Прорыв в ИИ: Модели Теперь Учатся, Задавая Себе Вопросы

3

Искусственный интеллект долгое время полагался на имитацию или задачи, определяемые человеком, для обучения. Но новый подход, получивший название «Absolute Zero Reasoner» (AZR), меняет эту парадигму. Исследователи из Университета Цинхуа, Пекинского института общего искусственного интеллекта (BIGAI) и Университета штата Пенсильвания продемонстрировали, что ИИ может значительно улучшить свои навыки рассуждения и кодирования, генерируя собственные проблемы и пытаясь их решить — процесс, имитирующий человеческое обучение.

Absolute Zero Reasoner

Система AZR работает в цикле: сначала она использует большую языковую модель для создания сложных, но решаемых задач кодирования на Python. Затем та же модель пытается решить эти задачи и проверяет свои решения, запуская код. Система затем совершенствуется, используя успехи и неудачи для улучшения как своих навыков постановки задач, так и решения проблем.

Этот подход самообучения дал замечательные результаты. 7- и 14-миллиардные версии языковой модели Qwen с открытым исходным кодом продемонстрировали значительный прогресс в кодировании и рассуждениях, даже превзойдя модели, обученные на данных, собранных людьми.

Почему Это Важно: Выход за Рамки Имитации

Последствия этого исследования существенны. В течение многих лет разработка ИИ была ограничена необходимостью в огромных, размеченных человеком наборах данных. Этот новый метод разрушает эту зависимость, потенциально открывая путь к более способному, самосовершенствующемуся ИИ. Как отмечает доктор Эндрю Чжао, один из создателей проекта, это имитирует то, как учатся люди: «Сначала ты имитируешь… но потом тебе нужно задавать свои собственные вопросы».

Концепция не нова — пионеры, такие как Юрген Шмидхубер и Пьер-Ив Удейер, изучали самообучение годами — но система AZR демонстрирует его эффективность на практике. Важно отметить, что сложность задач масштабируется вместе с растущей мощностью модели, создавая непрерывный цикл улучшения.

Текущие Ограничения и Будущие Возможности

В настоящее время система преуспевает в задачах с легко проверяемыми решениями (например, в кодировании). Задача теперь состоит в том, чтобы расширить этот подход на более сложные сценарии реального мира. Задачи агентного ИИ, такие как просмотр веб-страниц или автоматизация офисной работы, могут быть следующими, с ИИ, самостоятельно оценивающим свою производительность в этих задачах.

Некоторые исследователи даже считают, что это может быть шагом к общему искусственному интеллекту (AGI). Как объясняет доктор Цзылун Чжэн: «Как только мы этого достигнем, это станет своего рода путем к сверхразуму».

Применение в Отрасли и Следующие Шаги

Подход AZR уже набирает популярность в отрасли. Salesforce, Стэнфорд и Университет Северной Каролины в Чапел-Хилл разработали Agent0, самосовершенствующегося агента, который использует аналогичные принципы. Meta, Университет Иллинойса и Университет Карнеги — Меллона также опубликовали работы по самообучению в области разработки программного обеспечения.

В условиях истощения и роста стоимости традиционных источников данных самообучение представляет собой решающую эволюцию в разработке ИИ. В будущем мы можем увидеть системы ИИ, которые учатся и адаптируются автономно, а не только полагаются на данные, предоставленные человеком.

Этот сдвиг сигнализирует о более широкой тенденции к ИИ, который в меньшей степени полагается на имитацию и в большей степени способен к независимому рассуждению и решению проблем, что потенциально изменит ландшафт искусственного интеллекта.