Tytuł clickbaitowy, ale w sumie spoko wpis o LLM.

  • サぺルM
    link
    fedilink
    Polski
    arrow-up
    1
    ·
    19 days ago

    Dzisiaj czytałem, że część dystrybucji chińskich czatów to destylaty do innych modeli i mają taką samą nazwę, ale niekoniecznie te same możliwości. Czy to prawda?

    • naur
      link
      fedilink
      Polski
      arrow-up
      1
      ·
      edit-2
      19 days ago

      Tak, destylaty dodają reasoning (czyli “myślenie”) do mniejszych modeli innych firm (Llama od Mety i Qwen od Alibaby).

      Różnica jest taka, że te modele zawierają znacznie mniejszy zbiór wiedzy ze względu na ograniczoną ilość parametrów.
      Natomiast nieźle radzą sobie z rozwiązywaniem problemów logicznych, które były wyzwaniem dla wcześniejszych generacji modeli (nie potrafiących samodzielnie kwestionować swoich wywodów).