OpenAI Kembangkan Teknologi Penalaran Baru dengan Nama Kode 'Strawberry'

JAKARTA - Pembuat ChatGPT, OpenAI, sedang mengembangkan pendekatan baru untuk model kecerdasan buatan mereka dalam proyek bernama kode "Strawberry." Hal ini terungkap menurut informasi dari orang yang mengetahui masalah ini dan dokumentasi internal. Proyek ini, yang belum pernah dilaporkan sebelumnya, muncul saat startup yang didukung Microsoft berlomba untuk menunjukkan bahwa jenis model yang mereka tawarkan mampu memberikan kemampuan penalaran yang canggih.

Tim-tim di dalam OpenAI bekerja pada Strawberry, sesuai salinan dokumen internal OpenAI yang dilihat oleh Reuters pada bulan Mei. Sayang hingga kini tidak dapat dipastikan tanggal pasti dokumen tersebut, yang merinci rencana bagaimana OpenAI bermaksud menggunakan Strawberry untuk melakukan penelitian. Sumber tersebut menggambarkan rencana ini sebagai pekerjaan yang sedang berjalan. Sayang hingga kini juga belum  dapat diketahui seberapa dekat Strawberry untuk diluncurkan ke publik.

Cara kerja Strawberry dirahasiakan dengan ketat bahkan di dalam OpenAI, kata sumber tersebut. Dokumen tersebut menggambarkan proyek yang menggunakan model Strawberry dengan tujuan memungkinkan AI perusahaan tidak hanya menghasilkan jawaban atas pertanyaan tetapi juga merencanakan ke depan untuk menavigasi internet secara mandiri dan andal untuk melakukan apa yang disebut OpenAI sebagai "penelitian mendalam."   Ini adalah sesuatu yang telah sulit dicapai oleh model AI hingga saat ini, menurut wawancara dengan lebih dari selusin peneliti AI.

Dalam sebuah pernyataan, juru bicara OpenAI mengatakan, "Kami ingin model AI kami melihat dan memahami dunia lebih seperti yang kita lakukan. Penelitian terus-menerus tentang kemampuan AI baru adalah praktik umum di industri, dengan keyakinan bersama, bahwa sistem ini akan meningkat dalam penalaran dari waktu ke waktu."

Proyek Strawberry sebelumnya dikenal sebagai Q*, yang menurut laporan Reuters tahun lalu sudah dianggap sebagai terobosan di dalam perusahaan. Dua sumber menggambarkan melihat demo Q* awal tahun ini yang mampu menjawab pertanyaan sains dan matematika rumit yang di luar jangkauan model komersial saat ini.

Pada  Selasa 9 Juli, menurut laporan Bloomberg, OpenAI telah menunjukkan demo proyek penelitian yang diklaim memiliki keterampilan penalaran baru yang mirip manusia. Juru bicara OpenAI mengonfirmasi pertemuan tersebut tetapi menolak memberikan rincian isinya. Namun media tidak dapat menentukan apakah proyek yang didemonstrasikan adalah Strawberry.

OpenAI berharap inovasi ini akan secara dramatis meningkatkan kemampuan penalaran model AI-nya, kata sumber yang mengetahui hal ini. Ia juga menambahkan bahwa Strawberry melibatkan cara khusus memproses model AI setelah dilatih sebelumnya pada dataset yang sangat besar.

Peneliti  mengatakan bahwa penalaran adalah kunci untuk AI mencapai kecerdasan setingkat manusia atau super-manusia. Sementara model bahasa besar (LLM) sudah dapat meringkas teks padat dan menyusun prosa elegan lebih cepat daripada manusia mana pun. Namun teknologi ini sering kali gagal dalam masalah akal sehat yang solusinya tampak intuitif bagi orang, seperti mengenali kekeliruan logis dan bermain tic-tac-toe.

Strawberry adalah komponen kunci dari rencana OpenAI untuk mengatasi tantangan-tantangan tersebut, kata sumber yang mengetahui masalah ini. Dokumen yang dilihat oleh Reuters menggambarkan apa yang ingin dicapai Strawberry, tetapi tidak bagaimana caranya.

Dalam beberapa bulan terakhir, perusahaan secara pribadi telah memberi sinyal kepada pengembang dan pihak luar lainnya bahwa mereka hampir merilis teknologi dengan kemampuan penalaran yang lebih canggih, menurut empat orang yang telah mendengar presentasi perusahaan. Mereka menolak untuk diidentifikasi karena tidak diizinkan berbicara tentang masalah pribadi.

Strawberry termasuk cara khusus dari apa yang dikenal sebagai "post-training" model AI generatif OpenAI, atau menyesuaikan model dasar untuk meningkatkan kinerjanya dengan cara khusus setelah mereka sudah "dilatih" pada sejumlah besar data umum.

Strawberry memiliki kesamaan dengan metode yang dikembangkan di Stanford pada tahun 2022 yang disebut "Self-Taught Reasoner" atau "STaR", kata salah satu sumber yang mengetahui masalah ini. STaR memungkinkan model AI untuk "bootstrap" diri mereka sendiri ke tingkat kecerdasan yang lebih tinggi melalui iteratif menciptakan data pelatihan mereka sendiri.

Salah satu kemampuan yang dituju OpenAI dengan Strawberry adalah melakukan tugas jangka panjang (LHT), mengacu pada tugas-tugas kompleks yang memerlukan model untuk merencanakan ke depan dan melakukan serangkaian tindakan selama periode waktu yang diperpanjang, jelas sumber pertama.

Untuk melakukannya, OpenAI sedang menciptakan, melatih, dan mengevaluasi model pada apa yang disebut perusahaan sebagai dataset "penelitian mendalam", menurut dokumentasi internal OpenAI. Reuters tidak dapat menentukan apa yang ada dalam dataset tersebut atau berapa lama periode waktu yang diperpanjang tersebut.

OpenAI secara khusus ingin modelnya menggunakan kemampuan ini untuk melakukan penelitian dengan menjelajahi web secara mandiri dengan bantuan "CUA", atau agen pengguna komputer, yang dapat mengambil tindakan berdasarkan temuannya, menurut dokumen dan salah satu sumber. OpenAI juga berencana menguji kemampuannya dalam melakukan pekerjaan insinyur perangkat lunak dan pembelajaran mesin.