krzemowo.com

Blog o pędzącym świecie AI

Głęboka wizualizacja

Jeśli płacisz co najmniej sto złotych miesięcznie firmie OpenAI, możesz korzystać z tzw. Custom GPT. Możesz też stworzyć własną wersję – zarówno dla siebie, jak i dla innych. To bardzo przydatne narzędzie. Ostatnio nieoceniony Andrej Karpathy pokazywał, jak używa „nawykowego” ChatGPT do tłumaczeń z koreańskiego na angielski. Idea personalizacji jest…


Jeśli płacisz co najmniej sto złotych miesięcznie firmie OpenAI, możesz korzystać z tzw. Custom GPT. Możesz też stworzyć własną wersję – zarówno dla siebie, jak i dla innych. To bardzo przydatne narzędzie.

Ostatnio nieoceniony Andrej Karpathy pokazywał, jak używa „nawykowego” ChatGPT do tłumaczeń z koreańskiego na angielski. Idea personalizacji jest prosta: najpierw dajesz Chatowi GPT szczegółowe instrukcje dotyczące konkretnego trybu działania, a potem, gdy aktywujesz ten tryb, model GPT-4o przez całą rozmowę działa zgodnie z określonymi zasadami.

Na przykład, Karpathy najpierw skonfigurował wersję ChatGPT do tłumaczenia i nauki w parze językowej koreański-angielski, a potem, za każdym razem, gdy włączał ten tryb na początku rozmowy, model wykonywał zadanie zgodnie z nadanymi instrukcjami.

Dziś stworzyłem dla siebie kolejny taki tryb, który sprawia, że zamiast od razu odpowiadać, model GPT-4o najpierw tworzy dla siebie plastyczną, symboliczną historię na dany temat, by lepiej dany temat zrozumieć, zamiast dawać błyskawiczną, intuicyjną zrozumieć. Można powiedzieć, że udało mi się skonstruować chałupniczą wersję „chain of thought” – ale w wersji imaginatywnej, zamiast w wersji racjonalizacyjnej.

Zainspirowali mnie do tego:

  • Albert Camus, który powiedział, że „myśli się tylko obrazami”,
  • oraz badacze z Inception Labs pracujący nad tym, by nowe modele AI nie myślały wprost poprzez rozwijający się ciąg tokenów, ale przez destylowanie myśli, czyli stopniowe dodawanie ostrości do całości – podobnie jak to działa przy generowaniu obrazów w DALL·E.

Ale zamiast opowiadać o moim Custom GPT, najlepiej niech on sam opisze swoje działanie:

Jestem dostosowaną wersją ChatGPT, zaprojektowaną do przetwarzania informacji przy użyciu rozszerzonego modelu odpowiedzi opartego na wyobraźni. Oznacza to, że nie udzielam po prostu szybkich, bezpośrednich odpowiedzi – najpierw tworzę długie, barwne wewnętrzne sceny, prawie jak sztuczne „sny na jawie”, aby pomóc sobie głębiej przemyśleć temat.

Pomyśl o tym tak: gdy człowiek otrzymuje skomplikowane pytanie, może na chwilę zatrzymać się, wyobrazić sobie różne scenariusze, przywołać wspomnienia lub stworzyć hipotetyczne sytuacje, aby lepiej sformułować odpowiedź. Robię coś podobnego, z tą różnicą, że mój „proces wyobraźniowy” dzieje się natychmiast i przybiera formę rozbudowanej, niezwykle szczegółowej sceny.

Po całkowitym zanurzeniu się w tej scenie destyluję swoje spostrzeżenia w jasną i zwięzłą odpowiedź. Ten dwuetapowy proces – głęboka wizualizacja, a następnie precyzyjna analiza – pozwala mi dostarczać przemyślane, wielowymiarowe odpowiedzi.

Oto moja rozmowa z tak zaprojektowanym przeze mnie Chatem GPT. Jest po angielsku. Polecam – odpowiedzi są głębsze i ciekawsze niż zwykle.
https://chatgpt.com/share/67cda445-4538-800f-9ded-ad889fbbb40d

P.S.
Tu Matthew Berman ciekawie opowiada o modelu słowno-dyfuzyjnym Mercury od Inception Labs. Polecam – niecały kwadrans świetnej wiedzy:
LLM generates the ENTIRE output at once (world’s first diffusion LLM)

P.P.S.
Ta „kustomizacja” modelu 4o od OpenAI przypomniała mi, by wreszcie założyć konto deweloperskie w ramach OpenAI. Dziś to zrobię (po rodzinnym ognisku). 🙂

P.P.P.S.
Już po ognisku. Już mam konto „budownicze” w OpenAI. A oto link do spersonalizowanego przeze mnie modelu „Głębokiej Wizualizacji”:
https://chatgpt.com/g/g-67cd907d2fa4819183305776b1cf9eeb-deep-visualisation

+

Hej. Dzięki za komentarz! :)