Tytuł clickbaitowy, ale w sumie spoko wpis o LLM.

  • naur
    link
    fedilink
    Polski
    arrow-up
    1
    ·
    19 days ago

    Do szybkich testów różnych modeli można też użyć LM Studio. Ma wbudowaną wyszukiwarkę modeli z filtrowaniem po możliwości offloadu na GPU.

    • サぺルM
      link
      fedilink
      Polski
      arrow-up
      1
      ·
      19 days ago

      Dzisiaj czytałem, że część dystrybucji chińskich czatów to destylaty do innych modeli i mają taką samą nazwę, ale niekoniecznie te same możliwości. Czy to prawda?

      • naur
        link
        fedilink
        Polski
        arrow-up
        1
        ·
        edit-2
        19 days ago

        Tak, destylaty dodają reasoning (czyli “myślenie”) do mniejszych modeli innych firm (Llama od Mety i Qwen od Alibaby).

        Różnica jest taka, że te modele zawierają znacznie mniejszy zbiór wiedzy ze względu na ograniczoną ilość parametrów.
        Natomiast nieźle radzą sobie z rozwiązywaniem problemów logicznych, które były wyzwaniem dla wcześniejszych generacji modeli (nie potrafiących samodzielnie kwestionować swoich wywodów).