YouTube Shorts Bakal Punya Deskripsi Video Berkat Model Bahasa AI Google DeepMind
YouTubs Shorts akan segera memiliki deskripsi di sepanjang pemutaran video, (foto: .dok. Google DeepMind)

Bagikan:

JAKARTA - YouTubs Shorts akan segera memiliki deskripsi di sepanjang pemutaran video, berkat hasil karya penggabungan antara tim DeepMind dan Brain menjadi satu tim Kecerdasan Buatan (AI) besar di Google.

Dijuluki Google DeepMind, mereka merinci bagaimana salah satu Model Bahasa Visual (VLM) digunakan untuk membuat deskripsi pada layanan pesaing TikTok itu.

“YouTube Shorts dibuat hanya dalam beberapa menit dan sering kali tidak menyertakan deskripsi serta judul yang bermanfaat, sehingga lebih sulit ditemukan melalui penelusuran. Jadi kami memperkenalkan model bahasa visual kami Flamingo untuk membantu menghasilkan deskripsi," ujar tim Google DeepMind dalam blog resminya, dikutip Kamis, 25 Mei.

Flamingo dapat membuat deskripsi dengan menganalisis bingkai awal video untuk menjelaskan apa yang terjadi. Alat ini mampu membuat deskripsi untuk semua video Shorts baru.

Deskripsi teks akan disimpan sebagai metadata untuk mengkategorikan video dengan lebih baik dan mencocokkan hasil penelusuran dengan kueri penonton.

"Kini, pengguna dapat menonton video yang lebih relevan dan lebih mudah menemukan apa yang mereka cari dari berbagai kreator global," ungkap tim Google DeepMind.

Selain itu, Google DeepMind juga menerapkan penelitian AI mereka untuk meningkatkan pengalaman YouTube dengan menggandeng tim teknis dan produk YouTube.

"Kami telah membantu mengoptimalkan proses pengambilan keputusan yang meningkatkan keamanan, mengurangi latensi, dan meningkatkan pengalaman penonton, kreator, dan pengiklan untuk semua," kata tim Google DeepMind.

Tim Google DeepMind menyadari, jumlah total lalu lintas internet diperkirakan akan meningkat di masa mendatang, sehingga kompresi video menjadi masalah yang semakin penting.

Mereka mengeksplorasi potensi model AI, MuZero ke YouTube untuk meningkatkan codec VP9, ​​format pengkodean yang membantu mengompresi dan mengirimkan video melalui internet. Kemudian, tim menerapkan MuZero ke beberapa lalu lintas langsung YouTube.

"Sejak diluncurkan ke tahap produksi pada sebagian lalu lintas langsung YouTube, kami telah menunjukkan pengurangan kecepatan bit rata-rata sebesar 4 persen di kumpulan video yang besar dan beragam," ucap tim Google DeepMind.

"Bitrate membantu menentukan kemampuan komputasi dan bandwidth yang diperlukan untuk memutar dan menyimpan video – memengaruhi segalanya mulai dari berapa lama video dimuat hingga resolusi, buffering, dan penggunaan data," imbuhnya.

Sejak 2018, Google DeepMind telah berkolaborasi dengan YouTube untuk mengedukasi kreator dengan lebih baik tentang jenis video yang dapat memperoleh pendapatan dari iklan, serta memastikan iklan muncul di samping konten yang mengikuti pedoman konten yang cocok untuk pengiklan YouTube.

Bersama dengan tim YouTube, kami mengembangkan model kualitas label (LQM) yang membantu melabeli video dengan lebih presisi, sesuai dengan pedoman ramah iklan YouTube. Model tersebut meningkatkan keakuratan iklan yang ditayangkan di video sejalan dengan kebijakan ramah iklan YouTube," jelas tim Google DeepMind.

Terakhir, untuk meningkatkan pengalaman kreator dan penonton, tim Google DeepMind mengembangkan sistem AI yang dapat memproses transkrip video, fitur audio dan visual secara otomatis, serta menyarankan segmen bab dan judul untuk kreator YouTube.

Seperti yang diperkenalkan Sundar Pichai di Google I/O 2022, segmen yang dibuat secara otomatis sudah tersedia untuk 8 juta video hari ini, dan tim berencana untuk menskalakan fitur itu ke lebih dari 80 juta video selama tahun depan.

Dengan menggunakan AutoChapters, pengguna akan menghabiskan lebih sedikit waktu untuk mencari konten tertentu dan konten kreator bisa menghemat waktu dalam membuat bagian untuk video mereka.