Przełom w sztucznej inteligencji: modele uczą się teraz, zadając sobie pytania

5

Sztuczna inteligencja od dawna opiera się na symulacji lub zadaniach zdefiniowanych przez człowieka. Jednak nowe podejście, zwane absolutnym zerowym rozumowaniem (AZR), zmienia ten paradygmat. Naukowcy z Uniwersytetu Tsinghua, Pekińskiego Instytutu Ogólnej Sztucznej Inteligencji (BIGAI) i Uniwersytetu Stanowego w Pensylwanii wykazali, że sztuczna inteligencja może znacznie poprawić swoje umiejętności rozumowania i kodowania, generując własne problemy i próbując je rozwiązać – proces naśladujący uczenie się człowieka.

Absolutny zero-rozsądek

System AZR działa w pętli: najpierw wykorzystuje duży model języka do tworzenia złożonych, ale możliwych do rozwiązania problemów z kodowaniem w Pythonie. Ten sam model następnie próbuje rozwiązać te problemy i testuje swoje rozwiązania, uruchamiając kod. Następnie system jest udoskonalany, wykorzystując sukcesy i porażki do doskonalenia zarówno umiejętności stawiania problemów, jak i ich rozwiązywania.

To samouczące się podejście przyniosło niezwykłe rezultaty. 7 i 14 miliardów wersji modelu języka Qwen o otwartym kodzie źródłowym wykazało znaczny postęp w kodowaniu i rozumowaniu, przewyższając nawet modele wytrenowane na danych zebranych przez ludzi.

Dlaczego to ma znaczenie: wyjście poza naśladownictwo

Konsekwencje tego badania są znaczące. Przez lata rozwój sztucznej inteligencji był ograniczony potrzebą posiadania ogromnych zbiorów danych oznaczonych przez człowieka. Ta nowa metoda przełamuje tę zależność, potencjalnie torując drogę dla bardziej wydajnej, samodoskonalącej się sztucznej inteligencji. Jak zauważa dr Andrew Zhao, jeden z twórców projektu, naśladuje to sposób, w jaki ludzie się uczą: „Na początku naśladujesz… ale potem musisz zadawać własne pytania”.

Koncepcja nie jest nowa — pionierzy tacy jak Jürgen Schmidhuber i Pierre-Yves Houdeyer od lat badają samokształcenie — ale system AZR demonstruje swoją skuteczność w praktyce. Należy zauważyć, że złożoność problemu skaluje się wraz ze wzrostem mocy modelu, tworząc ciągły cykl doskonalenia.

Obecne ograniczenia i przyszłe możliwości

System obecnie przoduje w rozwiązywaniu problemów dzięki łatwym do sprawdzenia rozwiązaniom (takim jak kodowanie). Wyzwaniem jest obecnie rozszerzenie tego podejścia na bardziej złożone scenariusze ze świata rzeczywistego. Zadania AI agentów, takie jak przeglądanie stron internetowych lub automatyzacja biura, mogą być następnymi, a sztuczna inteligencja samodzielnie ocenia swoją wydajność w tych zadaniach.

Niektórzy badacze uważają nawet, że może to być krok w kierunku sztucznej inteligencji ogólnej (AGI). Jak wyjaśnia dr Zilong Zheng: „Kiedy już to osiągniemy, stanie się to swego rodzaju ścieżką do superinteligencji”.

Zastosowania branżowe i kolejne kroki

Podejście AZR już zyskuje popularność w branży. Salesforce, Stanford i Uniwersytet Północnej Karoliny w Chapel Hill opracowały Agent0, samodoskonalący się agent, który wykorzystuje podobne zasady. Meta, Uniwersytet Illinois i Uniwersytet Carnegie Mellon również opublikowały prace dotyczące samokształcenia w tworzeniu oprogramowania.

W sytuacji kurczenia się tradycyjnych źródeł danych i ich kosztu rosnących samouczenie się stanowi krytyczną ewolucję w rozwoju sztucznej inteligencji. W przyszłości możemy zobaczyć systemy sztucznej inteligencji, które uczą się i dostosowują autonomicznie, a nie tylko polegają na danych dostarczanych przez ludzi.

Ta zmiana sygnalizuje szerszy trend w kierunku sztucznej inteligencji, która jest mniej zależna od naśladownictwa i bardziej zdolna do niezależnego rozumowania i rozwiązywania problemów, co potencjalnie zmienia krajobraz sztucznej inteligencji.