Shengshu AI bertujuan untuk menyaingi Sora OpenAI

Vidu menghasilkan klip empat detik hanya dalam 30 detik, salah satu yang tercepat di pasaran.

Shengshu AI, perusahaan rintisan asal Tiongkok, telah meluncurkan alat pengubah teks ke video barunya, Vidu , untuk pengguna global. Alat ini mendukung perintah teks berbahasa Mandarin dan Inggris, sehingga dapat diakses oleh khalayak yang lebih luas. Pengguna dapat membuat klip berdurasi empat atau delapan detik melalui situs web resmi. Perkembangan ini menempatkan Shengshu di antara perusahaan lain yang menawarkan layanan serupa, seperti Zhipu AI dan Kuaishou Technology.

Vidu, yang pertama kali diluncurkan pada bulan April , dapat menghasilkan klip berdurasi empat detik hanya dalam waktu 30 detik, menjadikannya salah satu alat tercepat yang tersedia. Teknologi ini didasarkan pada arsitektur yang dikembangkan sendiri oleh Shengshu, U-ViT, yang dirinci dalam sebuah makalah penelitian oleh tim yang dipimpin oleh Zhu Jun, kepala ilmuwan perusahaan dan seorang profesor di Universitas Tsinghua. Tim kepemimpinan Shengshu mencakup beberapa alumni Tsinghua, yang menyoroti peran penting universitas tersebut dalam ambisi AI Tiongkok.

Alat ini juga dilengkapi fungsi karakter-ke-video baru, yang memungkinkan pengguna untuk menganimasikan karakter nyata atau fiksi menggunakan perintah teks sederhana. Kemampuan ini menjadi dasar bagi aplikasi komersial potensial dalam industri animasi dan konten. Zhang Xudong, direktur produk Shengshu, membayangkan perkembangan masa depan di mana pengguna dapat menganimasikan beberapa karakter dan adegan, mengintegrasikan alat AI dengan sektor tradisional.

Shengshu telah menarik investasi yang signifikan, mengamankan puluhan juta dolar AS dari para pendukung seperti Qiming Venture Partners, Baidu, Ant Group milik Alibaba, dan Beijing AI Industry Investment Fund. Dukungan finansial ini menggarisbawahi keyakinan terhadap potensi Shengshu untuk memimpin dalam pembuatan video AI, memposisikannya sebagai pesaing kuat bagi Sora milik OpenAI .