VideoPoet: Inovasi Dalam Generasi Video
VideoPoet adalah alat inovatif yang dikembangkan oleh Google Research untuk mengubah model bahasa autoregresif menjadi generator video berkualitas tinggi. Dengan menggunakan komponen seperti MAGVIT V2 dan SoundStream, VideoPoet mampu mengonversi gambar, video, dan klip audio menjadi kode diskrit dalam kosakata yang seragam. Ini memungkinkan integrasi dengan berbagai modalitas lain, termasuk teks, untuk menghasilkan video yang menarik dan berkualitas tinggi.
Alat ini mendukung berbagai fungsi seperti text-to-video, video frame continuation, dan video stylization, memberikan fleksibilitas dalam menghasilkan konten video. VideoPoet juga dapat menghasilkan video dalam orientasi persegi atau potret, ideal untuk konten pendek, serta mendukung penghasilan audio dari input video. Dengan kemampuan multitasking yang kuat, VideoPoet menunjukkan bagaimana model bahasa dapat digunakan untuk menyintesis dan mengedit video dengan konsistensi temporal yang diinginkan.