Dzisiaj czytałem, że część dystrybucji chińskich czatów to destylaty do innych modeli i mają taką samą nazwę, ale niekoniecznie te same możliwości. Czy to prawda?
Tak, destylaty dodają reasoning (czyli “myślenie”) do mniejszych modeli innych firm (Llama od Mety i Qwen od Alibaby).
Różnica jest taka, że te modele zawierają znacznie mniejszy zbiór wiedzy ze względu na ograniczoną ilość parametrów.
Natomiast nieźle radzą sobie z rozwiązywaniem problemów logicznych, które były wyzwaniem dla wcześniejszych generacji modeli (nie potrafiących samodzielnie kwestionować swoich wywodów).
Dzisiaj czytałem, że część dystrybucji chińskich czatów to destylaty do innych modeli i mają taką samą nazwę, ale niekoniecznie te same możliwości. Czy to prawda?
Tak, destylaty dodają reasoning (czyli “myślenie”) do mniejszych modeli innych firm (Llama od Mety i Qwen od Alibaby).
Różnica jest taka, że te modele zawierają znacznie mniejszy zbiór wiedzy ze względu na ograniczoną ilość parametrów.
Natomiast nieźle radzą sobie z rozwiązywaniem problemów logicznych, które były wyzwaniem dla wcześniejszych generacji modeli (nie potrafiących samodzielnie kwestionować swoich wywodów).