A inteligência artificial há muito depende da imitação ou de tarefas definidas pelo homem para aprender. Mas uma nova abordagem, apelidada de “Raciocinador Zero Absoluto” (AZR), está a mudar isso. Investigadores da Universidade de Tsinghua, do Instituto de Inteligência Artificial Geral de Pequim (BIGAI) e da Universidade Estatal da Pensilvânia demonstraram que a IA pode melhorar significativamente as suas capacidades de raciocínio e codificação, gerando os seus próprios problemas e tentando resolvê-los – um processo que reflecte a aprendizagem humana.
O Raciocinador Zero Absoluto
O sistema AZR opera em loop: primeiro, ele usa um grande modelo de linguagem para criar problemas de codificação Python desafiadores, mas solucionáveis. Então, o mesmo modelo tenta resolver esses problemas e verifica suas soluções executando o código. O sistema então se refina usando sucessos e fracassos para melhorar suas habilidades de formulação e resolução de problemas.
Essa abordagem de autojogo produziu resultados notáveis. As versões de 7 e 14 bilhões de parâmetros do modelo de linguagem de código aberto Qwen exibiram um impulso significativo na codificação e no raciocínio, superando até mesmo modelos treinados em conjuntos de dados com curadoria humana.
Por que isso é importante: além da imitação
As implicações desta pesquisa são substanciais. Durante anos, o desenvolvimento da IA foi limitado pela necessidade de conjuntos de dados massivos e rotulados por humanos. Este novo método quebra essa dependência, abrindo potencialmente um caminho para uma IA mais capaz e de auto-aperfeiçoamento. Como aponta o Dr. Andrew Zhao, um dos criadores do projeto, isso imita como os humanos aprendem: “No começo você imita… mas depois você tem que fazer suas próprias perguntas”.
O conceito não é novo – pioneiros como Jürgen Schmidhuber e Pierre-Yves Oudeyer exploram o autojogo há anos – mas o sistema AZR demonstra a sua eficácia de uma forma tangível. É importante ressaltar que a dificuldade dos problemas aumenta com o poder crescente do modelo, criando um ciclo contínuo de melhoria.
Limitações Atuais e Possibilidades Futuras
Atualmente, o sistema se destaca em tarefas com soluções facilmente verificáveis (como codificação). O desafio agora reside em expandir esta abordagem para cenários mais complexos do mundo real. As tarefas de IA da Agentic, como navegação na web ou automação de escritório, podem ser as próximas, com a IA julgando seu próprio desempenho nessas tarefas.
Alguns pesquisadores até acreditam que este poderia ser um passo em direção à inteligência artificial geral (AGI). Como explica o Dr. Zilong Zheng: “Assim que tivermos isso, será uma espécie de maneira de alcançar a superinteligência”.
Adoção pela indústria e próximas etapas
A abordagem AZR já está ganhando força na indústria. Salesforce, Stanford e a Universidade da Carolina do Norte em Chapel Hill desenvolveram o Agent0, um agente de autoaperfeiçoamento que usa princípios semelhantes. Meta, a Universidade de Illinois e a Universidade Carnegie Mellon também publicaram trabalhos sobre autojogo para engenharia de software.
Com as fontes de dados convencionais a tornarem-se mais escassas e mais caras, o auto-jogo representa uma evolução crucial no desenvolvimento da IA. O futuro poderá ver sistemas de IA que aprendem e se adaptam de forma autónoma, em vez de dependerem apenas de dados fornecidos por humanos.
Esta mudança assinala uma tendência mais ampla para a IA, que é menos dependente da imitação e mais capaz de raciocínio independente e de resolução de problemas, potencialmente remodelando o panorama da inteligência artificial.





























