Teknologi Terbaru AI Memungkinkan Pengguna Mengubah Gambar dengan Sekali Klik
JAKARTA - Kemampuan alat kecerdasan buatan (AI) untuk memanipulasi gambar terus berkembang. Contoh terbaru adalah sebuah paper penelitian yang sangat mengesankan, yang memungkinkan pengguna untuk dengan mudah menarik elemen gambar untuk mengubah penampilannya.
Pada awalnya, hal ini mungkin terdengar tidak terlalu menarik, tetapi sudah terdapat contoh-contoh di mana untuk mendapatkan gambaran tentang apa yang dapat dilakukan oleh sistem ini.
Tidak hanya dapat mengubah dimensi mobil atau memanipulasi senyuman menjadi cemberut dengan sekali klik dan tarik, tetapi Anda juga dapat memutar subjek gambar seolah-olah itu adalah model 3D - mengubah arah wajah seseorang, misalnya.
Salah satu demonstrasi bahkan menunjukkan pengguna mengatur refleksi di danau dan tinggi dari rangkaian pegunungan dengan beberapa klik.
Video-video ini berasal dari halaman utama tim peneliti, meskipun halaman tersebut telah mengalami gangguan karena jumlah lalu lintas yang dikirim ke situs tersebut oleh Twitter (terutama oleh pengguna @_akhaliq, yang melakukan pekerjaan luar biasa dalam menyoroti paper-paper AI yang menarik dan patut diikuti jika Anda tertarik). Anda juga dapat membaca paper penelitian tersebut di arXiv di sini.
Seperti yang dicatat oleh tim peneliti, yang benar-benar menarik dari karya ini bukanlah manipulasi gambar itu sendiri, tetapi antarmuka pengguna. Namun kita telah dapat menggunakan alat AI seperti GAN untuk menghasilkan gambar yang realistis dalam waktu yang cukup lama, tetapi sebagian besar metode kurang fleksibel dan presisi.
Baca juga:
- Jajal Fitur Baru Twitter yang Bisa Kirim Pesan Suara di DM, Mirip WhatsApp Nih!
- Meta Hadirkan Kemampuan Mengubah Tampilan Dunia Virtual Pengguna Headset Quest
- Selamat! NASA Pilih Blue Origin Milik Miliarder Jeff Bezos untuk Bangun Pendaratan Astronot di Bulan
- Apple Bakal Rilis Verifikasi Kunci Kontak iMessage untuk Perlindungan dari Peretasan
Anda dapat memberi tahu generator gambar AI untuk "membuat gambar singa berjalan-jalan di savana," dan Anda akan mendapatkannya, tetapi mungkin bukan pose yang tepat yang Anda inginkan atau butuhkan.
Model ini, yang dinamai DragGAN, menawarkan solusi yang jelas untuk hal ini. Antarmukanya sama persis dengan pemutarbalikan gambar tradisional, tetapi alih-alih hanya mengaburkan dan menggabungkan piksel yang ada, model ini menghasilkan subjek baru. Seperti yang ditulis oleh para peneliti: "[P]endekatan kami dapat menghaluskan konten yang tersembunyi, seperti gigi di dalam mulut singa, dan dapat mengubah bentuk sesuai dengan kekakuan objek, seperti lenting kaki kuda."
Jelas bahwa ini hanya sebuah demo untuk saat ini, dan sulit untuk mengevaluasi teknologi ini secara lengkap. (Seberapa realistis gambar-gambar akhirnya, misalnya? Sulit untuk dikatakan berdasarkan video berkualitas rendah yang tersedia.) Tetapi ini adalah contoh lain dari bagaimana manipulasi gambar menjadi lebih mudah diakses.