Umělá inteligence se při učení dlouho spoléhala na simulaci nebo úkoly definované lidmi. Ale nový přístup, nazvaný Absolute Zero Reasoner (AZR), toto paradigma mění. Výzkumníci z Tsinghua University, Pekingského institutu všeobecné umělé inteligence (BIGAI) a Pennsylvania State University prokázali, že umělá inteligence může výrazně zlepšit své uvažování a kódovací schopnosti tím, že vytváří své vlastní problémy a pokouší se je řešit, což je proces, který napodobuje lidské učení.
Absolute Zero Reasoner
Systém AZR funguje ve smyčce: Nejprve používá velký jazykový model k vytvoření složitých, ale řešitelných problémů s kódováním Pythonu. Stejný model se pak snaží tyto problémy vyřešit a testuje svá řešení spuštěním kódu. Systém se pak zdokonaluje a využívá úspěchy a neúspěchy ke zlepšení svých schopností řešit problémy a řešit problémy.
Tento přístup k samostudiu přinesl pozoruhodné výsledky. 7 a 14 miliard verze open-source jazykového modelu Qwen prokázaly významný pokrok v kódování a uvažování, dokonce předčily modely trénované na datech shromážděných lidmi.
Proč na tom záleží: Moving Beyond Imitation
Důsledky této studie jsou významné. Po celá léta byl vývoj umělé inteligence omezován potřebou obrovských souborů dat označených lidmi. Tato nová metoda ruší tuto závislost a potenciálně připravuje cestu pro schopnější, sebelepší AI. Jak zdůrazňuje Dr. Andrew Zhao, jeden z tvůrců projektu, toto napodobuje způsob, jakým se lidé učí: “Nejdřív napodobujete… ale pak si musíte klást vlastní otázky.”
Koncept není nový – průkopníci jako Jürgen Schmidhuber a Pierre-Yves Houdeyer studovali samoučení již léta – ale systém AZR prokazuje svou účinnost v praxi. Je důležité poznamenat, že složitost problému se zmenšuje s rostoucí silou modelu, což vytváří nepřetržitý cyklus zlepšování.
Současná omezení a budoucí příležitosti
Systém v současnosti exceluje v problémech se snadno ověřitelnými řešeními (např. kódování). Výzvou nyní je rozšířit tento přístup na složitější scénáře reálného světa. Úkoly AI agentů, jako je procházení webu nebo automatizace kanceláří, by mohly být další, přičemž AI sama hodnotí svůj výkon v těchto úkolech.
Někteří vědci se dokonce domnívají, že by to mohl být krok k umělé obecné inteligenci (AGI). Jak vysvětluje Dr. Zilong Zheng: „Jakmile toho dosáhneme, stane se to jakousi cestou k superinteligenci.“
Průmyslové aplikace a další kroky
Přístup AZR si již v tomto odvětví získává na popularitě. Salesforce, Stanford a University of North Carolina v Chapel Hill vyvinuly Agent0, sebezdokonalujícího se agenta, který používá podobné principy. Meta, University of Illinois a Carnegie Mellon University také publikovaly práci o samostudiu ve vývoji softwaru.
Vzhledem k tomu, že tradiční zdroje dat ubývají a náklady rostou, samoučení představuje zásadní evoluci ve vývoji umělé inteligence. V budoucnu můžeme vidět systémy umělé inteligence, které se budou učit a přizpůsobovat autonomně, spíše než se spoléhat na data od lidí.
Tento posun signalizuje širší trend směrem k umělé inteligenci, která je méně závislá na napodobování a je schopnější nezávislého uvažování a řešení problémů, což potenciálně mění prostředí umělé inteligence.
