L’intelligenza artificiale si affida da tempo all’imitazione o a compiti definiti dall’uomo per l’apprendimento. Ma un nuovo approccio, denominato “Absolute Zero Reasoner” (AZR), sta cambiando la situazione. I ricercatori della Tsinghua University, del Beijing Institute for General Artificial Intelligence (BIGAI) e della Pennsylvania State University hanno dimostrato che l’intelligenza artificiale può migliorare significativamente le proprie capacità di ragionamento e di codifica generando i propri problemi e tentando di risolverli, un processo che rispecchia l’apprendimento umano.
Il Ragionatore dello Zero Assoluto
Il sistema AZR opera in un ciclo: in primo luogo, utilizza un modello linguistico di grandi dimensioni per creare problemi di codifica Python impegnativi, ma risolvibili. Quindi, lo stesso modello tenta di risolvere questi problemi e verifica le proprie soluzioni eseguendo il codice. Il sistema poi si affina utilizzando successi e fallimenti per migliorare sia le sue capacità di porre problemi che di risolverli.
Questo approccio self-play ha prodotto risultati notevoli. Le versioni da 7 e 14 miliardi di parametri del modello linguistico open source Qwen hanno mostrato un aumento significativo nella codifica e nel ragionamento, superando persino i modelli addestrati su set di dati curati dall’uomo.
Perché è importante: oltre l’imitazione
Le implicazioni di questa ricerca sono sostanziali. Per anni, lo sviluppo dell’intelligenza artificiale è stato limitato dalla necessità di enormi set di dati etichettati come esseri umani. Questo nuovo metodo rompe questa dipendenza, aprendo potenzialmente la strada verso un’IA più capace e capace di auto-miglioramento. Come sottolinea il dottor Andrew Zhao, uno dei creatori del progetto, questo imita il modo in cui gli esseri umani apprendono: “All’inizio imiti… ma poi devi porti le tue domande”.
Il concetto non è nuovo – pionieri come Jürgen Schmidhuber e Pierre-Yves Oudeyer hanno esplorato il gioco personale per anni – ma il sistema AZR dimostra la sua efficacia in modo tangibile. È importante sottolineare che la difficoltà dei problemi si adatta al crescente potere del modello, creando un ciclo continuo di miglioramento.
Limiti attuali e possibilità future
Attualmente, il sistema eccelle in attività con soluzioni facilmente verificabili (come la codifica). La sfida ora sta nell’estendere questo approccio a scenari reali più complessi. Le attività di intelligenza artificiale come la navigazione sul web o l’automazione degli uffici potrebbero essere le prossime, con l’intelligenza artificiale che giudicherà le proprie prestazioni in queste attività.
Alcuni ricercatori ritengono addirittura che questo potrebbe essere un passo avanti verso l’intelligenza generale artificiale (AGI). Come spiega il dottor Zilong Zheng, “Una volta ottenuto questo, sarà una specie di modo per raggiungere la superintelligenza”.
Adozione da parte del settore e passaggi successivi
L’approccio AZR sta già guadagnando terreno nel settore. Salesforce, Stanford e l’Università della Carolina del Nord a Chapel Hill hanno sviluppato Agent0, un agente auto-migliorante che utilizza principi simili. Anche Meta, l’Università dell’Illinois e la Carnegie Mellon University hanno pubblicato un lavoro sul self-play per l’ingegneria del software.
Con le fonti di dati convenzionali che diventano sempre più scarse e costose, il self-play rappresenta un’evoluzione cruciale nello sviluppo dell’intelligenza artificiale. Il futuro potrebbe vedere sistemi di intelligenza artificiale che apprendono e si adattano autonomamente, anziché fare affidamento esclusivamente sui dati forniti dall’uomo.
Questo cambiamento segnala una tendenza più ampia verso un’intelligenza artificiale meno dipendente dall’imitazione e più capace di ragionamento e risoluzione dei problemi indipendenti, rimodellando potenzialmente il panorama dell’intelligenza artificiale.




























