Terobosan AI: Model Kini Belajar dengan Mengajukan Pertanyaan pada Diri Sendiri

19
Terobosan AI: Model Kini Belajar dengan Mengajukan Pertanyaan pada Diri Sendiri

Kecerdasan buatan telah lama mengandalkan imitasi atau tugas-tugas yang ditentukan manusia untuk belajar. Namun pendekatan baru, yang dijuluki “Absolute Zero Reasoner” (AZR), mengubah hal tersebut. Para peneliti di Universitas Tsinghua, Institut Kecerdasan Buatan Umum Beijing (BIGAI), dan Universitas Negeri Pennsylvania telah menunjukkan bahwa AI dapat secara signifikan meningkatkan keterampilan penalaran dan pengkodean dengan menghasilkan masalahnya sendiri dan berupaya menyelesaikannya—sebuah proses yang mencerminkan pembelajaran manusia.

Alasan Nol Mutlak

Sistem AZR beroperasi dalam satu lingkaran: pertama, sistem ini menggunakan model bahasa besar untuk menciptakan masalah pengkodean Python yang menantang namun dapat dipecahkan. Kemudian, model yang sama mencoba memecahkan masalah ini dan memverifikasi solusinya dengan menjalankan kode. Sistem kemudian menyempurnakan dirinya sendiri dengan menggunakan keberhasilan dan kegagalan untuk meningkatkan kemampuan dalam mengajukan masalah dan memecahkan masalah.

Pendekatan bermain mandiri ini membuahkan hasil yang luar biasa. Versi 7 dan 14 miliar parameter model bahasa sumber terbuka Qwen menunjukkan peningkatan yang signifikan dalam pengkodean dan penalaran, bahkan melampaui model yang dilatih pada kumpulan data yang dikurasi manusia.

Mengapa Ini Penting: Tidak Bisa Ditiru

Implikasi dari penelitian ini sangat besar. Selama bertahun-tahun, pengembangan AI terhambat oleh kebutuhan akan kumpulan data yang diberi label manusia dalam jumlah besar. Metode baru ini mematahkan ketergantungan tersebut, berpotensi membuka jalan menuju AI yang lebih mampu dan dapat mengembangkan diri. Andrew Zhao, salah satu pembuat proyek, hal ini meniru cara manusia belajar: “Pada awalnya Anda meniru…tetapi kemudian Anda harus mengajukan pertanyaan Anda sendiri.”

Konsep ini bukanlah hal baru—pelopor seperti Jürgen Schmidhuber dan Pierre-Yves Oudeyer telah mengeksplorasi permainan mandiri selama bertahun-tahun—tetapi sistem AZR menunjukkan keefektifannya dengan cara yang nyata. Yang penting, tingkat kesulitan masalah berskala seiring dengan semakin besarnya kekuatan model, sehingga menciptakan siklus perbaikan yang berkesinambungan.

Keterbatasan Saat Ini dan Kemungkinan di Masa Depan

Saat ini, sistem unggul dalam tugas-tugas dengan solusi yang mudah diverifikasi (seperti pengkodean). Tantangannya kini terletak pada perluasan pendekatan ini ke skenario dunia nyata yang lebih kompleks. Tugas-tugas AI agen seperti penjelajahan web atau otomatisasi kantor bisa menjadi yang berikutnya, dan AI akan menilai kinerjanya sendiri dalam tugas-tugas ini.

Beberapa peneliti bahkan percaya bahwa ini bisa menjadi langkah menuju kecerdasan umum buatan (AGI). Seperti yang dijelaskan oleh Dr. Zilong Zheng, “Setelah kita memilikinya, ini adalah semacam cara untuk mencapai kecerdasan super.”

Adopsi Industri dan Langkah Selanjutnya

Pendekatan AZR sudah mendapatkan daya tarik di industri ini. Salesforce, Stanford, dan University of North Carolina di Chapel Hill telah mengembangkan Agent0, agen pengembangan diri yang menggunakan prinsip serupa. Meta, Universitas Illinois, dan Universitas Carnegie Mellon juga telah menerbitkan karya tentang permainan mandiri untuk rekayasa perangkat lunak.

Dengan semakin langka dan mahalnya sumber data konvensional, permainan mandiri mewakili evolusi penting dalam pengembangan AI. Di masa depan, sistem AI dapat belajar dan beradaptasi secara mandiri, dibandingkan hanya mengandalkan data yang disediakan oleh manusia.

Pergeseran ini menandakan tren yang lebih luas menuju AI yang tidak terlalu bergantung pada peniruan dan lebih mampu berpikir dan memecahkan masalah secara independen, sehingga berpotensi membentuk kembali lanskap kecerdasan buatan.