Wydaje mi się, że odpowiedzi na pytania z dziedzin humanistycznych mają sens. Tak samo jak pytania o rośliny jadalne i przepisy kulinarne. Pewnie nie pytałem o coś trudnego.
Możliwe, że nie marnują wag na zbyt specjalistyczną wiedzę przy tej złożoności. W statystykach pewnie wychodzi czego ludzie potrzebują najbardziej.
Normalną odpowiedź znalazłem w PDF z dokumentacji CPU.
Ostatnio widziałem research paper opisujący metodę generowania prostych brył / modeli 3D przy użyciu LLM.
Nie mam pojęcia, jaki to ma sens. Dla eksperta to pewnie strata czasu, bo szybciej zrobi rysunek i poustawia constrainty.
Z kolei laik szybciej wyklikałby taki model przy użyciu prostego CSG w jakimś TinkerCADzie.
Ciekawe co będzie następne. Może oparty na promptach widget do wybierania kolorów w programach do grafiki.
Zainspirowałeś mnie. Kazałem wygenerować figurę wg opisu jako skrypt dla OpenSCAD. Wyszło inaczej niż chciałem. Wszystkie figury pojawiły się w odpowiedniej rotacji. Wystarczyło kilka poprawek związanych z pozycją.
Druga, trudniejsza próba z figurą zawierającą otwory wyszła gorzej. Skrypt był logicznie przekonywujący, ale nic się nie wyświetlało i nie wiem co było źle.
Trudno powiedzieć, jak to jest z tym przetrenowaniem. Do niedawna za optymalną proporcję ilości danych treningowych do rozmiaru modelu uznawało się tzw. Chinchilla Point.
Później LLama 3 została wytrenowana na znacznie większej liczbie tokenów i jakość modelu nadal wzrosła.
Wydaje mi się, że odpowiedzi na pytania z dziedzin humanistycznych mają sens. Tak samo jak pytania o rośliny jadalne i przepisy kulinarne. Pewnie nie pytałem o coś trudnego.
Możliwe, że nie marnują wag na zbyt specjalistyczną wiedzę przy tej złożoności. W statystykach pewnie wychodzi czego ludzie potrzebują najbardziej.
Normalną odpowiedź znalazłem w PDF z dokumentacji CPU.
Tak, w PDFie znajdzie się prawie wszystko, ale to AI miało rozwiązać wszystkie problemy i zastąpić programistów. ;-)
Perplexity.ai poradziło sobie lepiej od ChatGeppetto.
Trza sobie ciągle przypominać:
Ostatnio widziałem research paper opisujący metodę generowania prostych brył / modeli 3D przy użyciu LLM.
Nie mam pojęcia, jaki to ma sens. Dla eksperta to pewnie strata czasu, bo szybciej zrobi rysunek i poustawia constrainty.
Z kolei laik szybciej wyklikałby taki model przy użyciu prostego CSG w jakimś TinkerCADzie.
Ciekawe co będzie następne. Może oparty na promptach widget do wybierania kolorów w programach do grafiki.
Zainspirowałeś mnie. Kazałem wygenerować figurę wg opisu jako skrypt dla OpenSCAD. Wyszło inaczej niż chciałem. Wszystkie figury pojawiły się w odpowiedniej rotacji. Wystarczyło kilka poprawek związanych z pozycją.
Druga, trudniejsza próba z figurą zawierającą otwory wyszła gorzej. Skrypt był logicznie przekonywujący, ale nic się nie wyświetlało i nie wiem co było źle.
Ciekawi mnie jak ocenia się zajętość pamięci AI. Kiedyś mówiło się o przetrenowaniu. Ale to chyba inny problem.
Trudno powiedzieć, jak to jest z tym przetrenowaniem. Do niedawna za optymalną proporcję ilości danych treningowych do rozmiaru modelu uznawało się tzw. Chinchilla Point.
Później LLama 3 została wytrenowana na znacznie większej liczbie tokenów i jakość modelu nadal wzrosła.