додому Останні новини та статті Прорив ШІ: моделі тепер навчаються, ставлячи собі запитання

Прорив ШІ: моделі тепер навчаються, ставлячи собі запитання

Прорив ШІ: моделі тепер навчаються, ставлячи собі запитання

Штучний інтелект давно покладається на симуляцію або завдання, визначені людиною, для навчання. Але новий підхід під назвою Absolute Zero Reasoner (AZR) змінює цю парадигму. Дослідники з Університету Цінхуа, Пекінського інституту загального штучного інтелекту (BIGAI) та Університету штату Пенсільванія продемонстрували, що штучний інтелект може значно покращити свої навички міркування та кодування, створюючи власні проблеми та намагаючись їх вирішити, процес, який імітує людське навчання.

Абсолютний нуль

Система AZR працює в циклі: спочатку вона використовує велику мовну модель для створення складних, але вирішуваних проблем кодування Python. Ця ж модель потім намагається вирішити ці проблеми та перевіряє свої рішення, запускаючи код. Потім система удосконалюється, використовуючи успіхи та невдачі для покращення навичок постановки та вирішення проблем.

Цей підхід до самонавчання дав чудові результати. Версії 7 і 14 мільярдів мовної моделі Qwen з відкритим вихідним кодом продемонстрували значний прогрес у кодуванні та міркуванні, навіть перевершивши моделі, навчені на даних, зібраних людьми.

Чому це важливо: подолання імітації

Наслідки цього дослідження значні. Протягом багатьох років розробка штучного інтелекту була обмежена потребою у величезних наборах даних, позначених людиною. Цей новий метод розриває цю залежність, потенційно прокладаючи шлях до більш потужного штучного інтелекту, що самовдосконалюється. Як зазначає доктор Ендрю Чжао, один із творців проекту, це імітує те, як люди навчаються: «Спочатку ви наслідуєте… але потім вам доведеться задавати власні питання».

Концепція не нова — такі піонери, як Юрген Шмідхубер і П’єр-Ів Худейєр, роками вивчали самонавчання, — але система AZR демонструє свою ефективність на практиці. Важливо відзначити, що складність проблеми зростає зі збільшенням потужності моделі, створюючи безперервний цикл вдосконалення.

Поточні обмеження та майбутні можливості

На даний момент система справляється з проблемами, які легко перевіряються (наприклад, кодування). Зараз стоїть завдання поширити цей підхід на більш складні сценарії реального світу. Завдання агента ШІ, такі як перегляд веб-сторінок або автоматизація офісу, можуть бути наступними, причому ШІ самостійно оцінюватиме свою продуктивність у цих завданнях.

Деякі дослідники навіть вважають, що це може бути кроком до штучного загального інтелекту (AGI). Як пояснює доктор Зілонг Чжен, «щойно ми досягнемо цього, це стане свого роду шляхом до суперінтелекту».

Застосування в галузі та наступні кроки

Підхід AZR вже набирає популярності в галузі. Salesforce, Stanford та Університет Північної Кароліни в Чапел-Хілл розробили Agent0, самовдосконалюваний агент, який використовує подібні принципи. Meta, Університет Іллінойсу та Університет Карнегі-Меллона також опублікували роботу про самонавчання в розробці програмного забезпечення.

Оскільки традиційні джерела даних скорочуються та зростають у ціні, самонавчання є критично важливим кроком у розвитку ШІ. У майбутньому ми можемо побачити системи ШІ, які навчаються та адаптуються автономно, а не просто покладаються на дані, надані людиною.

Цей зсув свідчить про ширшу тенденцію до штучного інтелекту, який менше залежить від імітації та більше здатний самостійно міркувати та вирішувати проблеми, що потенційно може змінити ландшафт штучного інтелекту.

Exit mobile version