GPT-5: Model AI Generatif Terbaru dari OpenAI yang Masih Ditunggu-tunggu
Chat GPT-5 dikabarkan akan segera meluncur. (foto: x @GPT5_ETH)

Bagikan:

JAKARTA - GPT-4 saat ini merupakan alat AI generatif terbaik di pasaran, namun itu tidak berarti kita tidak melihat ke masa depan.  CEO OpenAI, Sam Altman, secara teratur memberikan petunjuk tentang GPT-5, tampaknya kita akan segera melihat model AI yang baru dan ditingkatkan.

Meskipun tidak ada tanggal peluncuran spesifik untuk GPT-5, banyak yang mengira bahwa publik mungkin akan melihatnya tidak lama lagi. Namun, tak peduli kapan peluncurannya, ada beberapa fitur kunci yang kami harapkan ada saat GPT-5 diluncurkan.

Apa Itu GPT-5 dari OpenAI?

GPT-5 adalah penerus yang sangat dinantikan dari model AI GPT-4 milik OpenAI, yang diharapkan menjadi model generatif terkuat di pasaran. Meskipun belum ada tanggal resmi untuk peluncuran GPT-5, ada indikasi bahwa model ini mungkin akan dirilis pada musim panas 2024. Sedikit sekali detail tentang model ini yang diketahui saat ini, namun beberapa hal dapat dikatakan dengan tingkat kepastian tertentu:

OpenAI telah mendaftarkan merek dagang untuk nama tersebut dengan Kantor Paten dan Merek Dagang Amerika Serikat.

Beberapa eksekutif OpenAI telah membahas atau memberikan petunjuk tentang kemungkinan kemampuan model ini.

CEO OpenAI, Sam Altman, secara berulang kali menyebut model ini selama wawancara YouTube dengan Lex Fridman pada Maret 2024.

Semua ini menunjukkan satu realita yang mendebarkan: GPT-5 akan segera hadir! Namun, masih banyak hal yang bersifat spekulasi pada saat ini. Namun, ada beberapa hal yang kami harapkan dan cukup yakin akan hadir di model ini. Berikut adalah beberapa di antaranya:

Lebih Multimodal

Salah satu peningkatan paling menarik untuk keluarga model AI GPT adalah multimodalitas. Multimodalitas adalah kemampuan model AI untuk memproses tidak hanya teks tetapi juga jenis masukan lainnya seperti gambar, audio, dan video.

Multimodalitas akan menjadi tonggak penting untuk kemajuan keluarga model GPT ke depannya.  GPT-4 sudah mahir dalam mengelola masukan dan keluaran gambar, perbaikan yang mencakup pemrosesan audio dan video adalah tonggak berikutnya bagi OpenAI, dan GPT-5 adalah tempat yang tepat untuk memulainya.

Google sudah membuat kemajuan serius dengan multimodalitas semacam ini dengan model Gemini AI-nya. Akan aneh jika OpenAI tidak memberikan respons. Dalam podcast Unconfuse Me-nya [transkrip PDF], Bill Gates bertanya kepada CEO OpenAI, Sam Altman, tentang pencapaian apa yang ia lihat untuk seri GPT dalam dua tahun ke depan. Jawabannya? Pemrosesan Video.

Jadi, untuk GPT-5, diharapkan dapat bermain-main dengan video—mengunggah video sebagai permintaan, membuat video secara langsung, mengedit video dengan teks permintaan, mengekstrak segmen dari video, dan menemukan adegan tertentu dari file video besar. Kami berharap dapat melakukan hal serupa dengan file audio. Memang permintaan yang besar, ya. Namun, mengingat seberapa cepat perkembangan AI, ini adalah harapan yang sangat wajar.

Jendela Konteks yang Lebih Besar dan Lebih Efisien

Meskipun menjadi salah satu model AI paling canggih di pasaran, keluarga model AI GPT memiliki jendela konteks yang cukup kecil. Sebagai contoh, Claude 3 milik Anthropic memiliki jendela konteks sebesar 200.000 token, sedangkan Gemini milik Google dapat memproses hingga 1 juta token (128.000 untuk penggunaan standar).

Sebagai perbandingan, GPT-4 memiliki jendela konteks yang relatif lebih kecil, sekitar 128.000 token, dengan sekitar 32.000 token atau lebih sedikit yang realistis tersedia untuk digunakan pada antarmuka seperti ChatGPT.

Dengan multimodalitas canggih masuk dalam gambaran, peningkatan jendela konteks hampir tak terhindarkan. Mungkin peningkatan dua atau empat kali lipat akan cukup, tetapi kami berharap melihat peningkatan sekitar sepuluh kali lipat. Hal ini akan memungkinkan GPT-5 untuk memproses informasi yang jauh lebih banyak dengan cara yang jauh lebih efisien. Namun, jendela konteks yang lebih besar tidak selalu berarti lebih baik. Jadi, daripada hanya meningkatkan jendela konteks, kami ingin melihat peningkatan efisiensi pemrosesan konteks.

Agen GPT

Salah satu kemungkinan paling menarik dari rilis GPT-5 adalah kemunculan Agen GPT. Meskipun istilah "pengubah permainan" mungkin sudah terlalu sering digunakan dalam konteks AI, agen GPT benar-benar akan mengubah permainan dalam setiap arti praktis. Tetapi seberapa mengubah permainannya?

Saat ini, model AI seperti GPT-4 dapat membantu Anda menyelesaikan tugas. Mereka dapat menulis email, membuat lelucon, menyelesaikan masalah matematika, atau menyusun pos blog untuk Anda. Namun, mereka hanya dapat melakukan tugas tertentu itu saja dan tidak dapat menyelesaikan serangkaian tugas terkait yang diperlukan untuk menyelesaikan pekerjaan Anda.

Misalkan Anda adalah seorang pengembang web. Sebagai bagian dari pekerjaan Anda, Anda diharapkan untuk melakukan banyak hal: desain, menulis kode, memecahkan masalah, dan banyak lagi. Saat ini, Anda hanya dapat menugaskan sebagian dari tugas-tugas ini kepada model AI secara bertahap. Mungkin Anda bisa meminta model GPT-4 untuk menulis kode untuk halaman beranda, lalu memintanya untuk melakukannya untuk halaman kontak, dan kemudian untuk Halaman Tentang, dll. Anda perlu menyelesaikan tugas-tugas ini secara berulang-ulang. Dan ada tugas-tugas yang model tersebut tidak dapat menyelesaikannya.

Proses bertahap ini untuk meminta model AI untuk sub-tugas tertentu memakan waktu dan tidak efisien. Dalam skenario ini, Anda—pengembang web—adalah agen manusia yang bertanggung jawab untuk mengoordinasikan dan meminta model AI satu tugas demi satu tugas hingga Anda menyelesaikan satu set tugas terkait secara lengkap.

Agen GPT menjanjikan bot-bot ahli khusus yang dikoordinasikan oleh, semoga, GPT-5 yang mampu melakukan pemikiran sendiri dan menangani semua subset dari tugas kompleks secara otonom. Penekanan pada "pemikiran sendiri" dan "otonom."

Jadi, jika GPT-5 dilengkapi dengan Agen GPT, Anda bisa memintanya untuk "membangun situs portofolio untuk Maxwell Timothy" daripada hanya "menulis kode untuk halaman beranda." GPT-5 kemudian secara teoritis akan dapat meminta dirinya sendiri dengan memanggil agen AI ahli untuk menangani berbagai sub-tugas yang diperlukan untuk membangun sebuah situs web.

Mungkin ia memanggil satu GPT untuk mengumpulkan informasi dari web tentang Maxwell Timothy, agen lain untuk menulis kode untuk halaman-halaman berbeda, agen lain untuk menghasilkan dan mengoptimalkan gambar, dan bahkan agen AI lain untuk melakukan implementasi situs, semua tanpa perlu pengulangan pemberian instruksi dari manusia.

Halusinasi yang Lebih Sedikit

Meskipun OpenAI telah membuat kemajuan dalam menangani halusinasi dalam model AI mereka, uji coba sejati untuk GPT-5 akan menjadi kemampuannya untuk mengatasi masalah halusinasi yang persisten, yang telah menghambat adopsi AI secara luas dalam domain-domain yang penting dan kritis seperti perawatan kesehatan, penerbangan, dan keamanan siber.

Ini semua adalah area yang akan sangat diuntungkan dari keterlibatan AI yang besar tetapi saat ini menghindari adopsi yang signifikan.

Untuk lebih jelasnya, halusinasi dalam konteks ini merujuk pada situasi di mana model AI menghasilkan dan menyajikan informasi yang terdengar masuk akal tetapi sepenuhnya terbuat-buat dengan tingkat keyakinan yang tinggi.

Bayangkan sebuah skenario di mana GPT-4 terintegrasi ke dalam sistem diagnostik untuk menganalisis gejala pasien dan laporan medis. Halusinasi bisa membuat AI dengan percaya diri memberikan diagnosis yang salah atau merekomendasikan jalur pengobatan yang berpotensi berbahaya berdasarkan fakta yang dibayangkan dan logika yang salah. Konsekuensi dari kesalahan semacam itu di bidang medis bisa sangat fatal.

Reservasi serupa berlaku untuk bidang-bidang kritis lainnya, seperti penerbangan, energi nuklir, operasi maritim, dan keamanan siber. Kami tidak mengharapkan GPT-5 untuk sepenuhnya menyelesaikan masalah halusinasi, tetapi kami mengharapkan dapat mengurangi kemungkinan insiden semacam itu secara signifikan.

Saat kami dengan penuh harap menantikan peluncuran resmi model AI yang sangat dinantikan ini, satu hal yang pasti: GPT-5 memiliki potensi untuk mendefinisikan kembali batas-batas apa yang mungkin dengan kecerdasan buatan, membawa era baru kolaborasi dan inovasi antara manusia dan mesin.