JAKARTA - Fei-Fei Li, seorang ahli ilmu komputer yang terkemuka, sedang membangun sebuah startup yang menggunakan pemrosesan data visual mirip manusia untuk membuat kecerdasan buatan (AI) mampu melakukan penalaran lanjutan dalam apa yang akan menjadi lompatan besar bagi teknologi tersebut.
Li, yang dianggap sebagai pelopor dalam bidang AI, berhasil mengumpulkan dana untuk perusahaan tersebut dalam putaran pendanaan awal baru-baru ini. Investor termasuk firma modal ventura Silicon Valley Andreessen Horowitz, kata tiga orang sumber, dan Radical Ventures, sebuah perusahaan Kanada yang dia bergabung sebagai mitra ilmiah tahun lalu, menurut dua sumber lainnya.
Juru bicara untuk Andreessen Horowitz dan Radical Ventures menolak untuk berkomentar tentang hal itu. Li juga tidak memberikan tanggapan terhadap permintaan komentar.
Li dikenal luas sebagai "ibu dari AI," sebuah gelar yang berasal dari sebutan "bapak-bapak" yang sering digunakan untuk merujuk pada trio peneliti yang memenangkan penghargaan teratas dunia komputasi, Penghargaan Turing, pada tahun 2018 atas terobosan mereka dalam teknologi AI.
Dalam menggambarkan startup tersebut, salah satu sumber menunjuk pada pidato Li di konferensi TED di Vancouver bulan lalu. Kala itu dia mengatakan bahwa titik terdepan dari penelitian melibatkan algoritma yang dapat secara masuk akal mengekstrapolasi bagaimana gambar dan teks akan terlihat dalam lingkungan tiga dimensi dan bertindak berdasarkan prediksi-prediksi tersebut, menggunakan konsep yang disebut "kecerdasan spasial."
Untuk mengilustrasikan ide tersebut, dia menunjukkan gambar seekor kucing dengan tangan terulur, mendorong gelas menuju pinggiran meja. Dalam sekejap, katanya, otak manusia dapat menilai "geometri dari gelas ini, tempatnya dalam ruang 3D, hubungannya dengan meja, kucing, dan segalanya yang lain," kemudian memprediksi apa yang akan terjadi dan mengambil tindakan untuk mencegahnya.
"Alam telah menciptakan siklus yang baik dari melihat dan melakukan, didukung oleh kecerdasan spasial," kata Li.
Labnya sendiri di Universitas Stanford sedang mencoba mengajari komputer "bagaimana beraksi di dunia 3D," tambahnya, misalnya dengan menggunakan model bahasa besar untuk mendapatkan lengan robotik untuk melakukan tugas-tugas seperti membuka pintu dan membuat sandwich sebagai respons terhadap instruksi verbal.
Li mendapatkan namanya dalam bidang AI dengan mengembangkan kumpulan data gambar berskala besar bernama ImageNet yang membantu memperkenalkan generasi teknologi visi komputer yang dapat mengidentifikasi objek secara reliabel untuk pertama kalinya.
Dia bersama-sama memimpin Institut AI Berbasis Manusia di Stanford, yang berfokus pada pengembangan teknologi AI dengan cara-cara yang "meningkatkan kondisi manusia." Selain pekerjaan akademisnya, Li memimpin AI di Google Cloud dari 2017 hingga 2018, menjadi anggota dewan direksi Twitter, dan melakukan penugasan sebagai penasehat kebijakan, termasuk di Gedung Putih.
Li telah meratapi kesenjangan pendanaan dalam penelitian AI antara sektor swasta yang berdaya saing baik di satu sisi dan akademisi dan laboratorium pemerintah di sisi lain, memanggil untuk "mentalitas moonshot" dari pemerintah AS untuk berinvestasi dalam aplikasi ilmiah teknologi tersebut dan penelitian terhadap risikonya.
BACA JUGA:
Profil Stanford-nya menyebutkan bahwa dia cuti sebagian dari awal 2024 hingga akhir 2025. Di antara minat riset yang tercantum di profilnya adalah "AI terinspirasi kognitif," visi komputer, dan pembelajaran robotik.
Di LinkedIn, dia mencantumkan pekerjaan saat ini sebagai "newbie" dan "sesuatu yang baru," mulai dari Januari 2024.
Dengan melompat ke dunia startup, Li bergabung dalam perlombaan di antara perusahaan-perusahaan AI terpanas untuk mengajari algoritma mereka akal sehat untuk mengatasi keterbatasan teknologi saat ini seperti model bahasa besar, yang cenderung mengeluarkan kebohongan tak masuk akal di tengah-tengah respon yang sebaliknya mirip manusia yang memukau.
Banyak yang mengatakan bahwa kemampuan ini untuk "berpikir" harus dibangun sebelum model AI dapat mencapai kecerdasan buatan umum, atau AGI, yang merujuk pada ambang batas di mana sistem dapat melakukan sebagian besar tugas dengan baik atau lebih mumpuni daripada manusia.
Beberapa peneliti percaya bahwa mereka dapat meningkatkan penalaran dengan membangun versi yang lebih besar dan lebih canggih dari model-model saat ini, sementara yang lain berpendapat bahwa jalan ke depan melibatkan penggunaan model "dunia" yang baru yang dapat menyerap informasi visual dari lingkungan fisik di sekitar mereka untuk mengembangkan logika, mereplikasi cara bayi belajar.