iklan - scroll untuk melanjutkan membaca.

Alibaba beberkan model AI baru, jago bikin video

Alibaba, sebagai salah satu perusahaan teknologi global utama pertama yang membuka sumber model AI berskala besar.

author photo
A- A+
alibaba
cover | @alibaba
Alibaba meluncurkan model pembuatan video sumber terbuka terbarunya, Wan2.1-FLF2V-14B. Model ini dirancang untuk memudahkan input frame awal dan akhir guna menyederhanakan pembuatan video. 

Hal ini memberikan kontrol kreatif yang lebih besar kepada kreator video pendek dengan membantu mereka dalam pengembangan model dan aplikasi AI mereka sendiri, baik secara efisien maupun terjangkau.
"Model ini merupakan bagian dari model dasar Alibaba – seri Wan2.1 – yang telah dirancang khusus untuk menghasilkan gambar dan video berkualitas tinggi dari teks dan gambar. Model ini kini menjadi sumber terbuka di Hugging Face dan GitHub , serta komunitas sumber terbuka Alibaba Cloud, ModelScope," tulis Alibaba dalam pengumuman resminya, dikutip topik.id Sabtu (19/4/2025).
Model ini menunjukkan kemampuan luar biasa dalam menjalankan instruksi pengguna, menjaga konsistensi antara frame pertama dan video yang dihasilkan, serta memberikan transisi yang mulus antara frame pertama dan terakhir untuk menghasilkan visual gerakan kompleks yang realistis dan alami. Model ini memungkinkan pengguna untuk membuat video berdurasi lima detik pada resolusi 720p secara gratis saat meminta model tersebut di situs web resmi Wan .

"Teknologi utama di balik model ini adalah pendekatan inovatif terhadap pembuatan video dengan menggabungkan mekanisme penyesuaian kontrol tambahan. Mekanisme ini menggunakan frame pertama dan terakhir yang disediakan pengguna dari suatu rangkaian sebagai kondisi kontrol, yang memungkinkan transisi yang halus dan tepat antara frame awal dan akhir," jelasnya.

Stabilitas visual.


Untuk memastikan stabilitas visual, mekanisme ini membantu menyuntikkan fitur semantik dari bingkai pertama dan terakhir ke dalam proses pembuatan, yang memungkinkan model mempertahankan konsistensi dalam gaya, konten, dan struktur, sambil mengubah bingkai secara dinamis.

Sebagai salah satu perusahaan teknologi global utama pertama yang membuka sumber model AI berskala besar yang dikembangkan sendiri, komitmen Alibaba Cloud terhadap hal itu diwujudkan dengan membuka sumber empat model Wan2.1 pada bulan Februari 2025. Hingga saat ini, model tersebut telah menarik lebih dari 2,2 juta unduhan di Hugging Face dan ModelScope.

Diluncurkan awal tahun ini, seri Wan2.1 adalah model pembuatan video pertama yang mendukung efek teks dalam bahasa Mandarin dan Inggris. Model ini berada di puncak papan peringkat VBench , rangkaian tolok ukur komprehensif untuk model generatif video.

Alibaba Cloud merilis model bahasa besar (LLM) terbuka pertamanya, Qwen-7B, pada bulan Agustus 2023. Model terbuka Qwen secara konsisten menduduki puncak Papan Peringkat LLM Terbuka Hugging Face, dengan performa yang menyamai model AI global terkemuka di berbagai tolok ukur.

"Selama beberapa tahun terakhir, Alibaba Cloud telah membuat lebih dari 200 model AI generatif menjadi sumber terbuka. Hingga saat ini, lebih dari 100.000 model turunan berdasarkan keluarga model Qwen telah dikembangkan di Hugging Face, menjadikannya salah satu keluarga model AI paling terkemuka di seluruh dunia," ungkapnya.


Share:
Premium.
Komentar
Komentar sepenuhnya tanggung jawab pengguna dan diatur dalam UU ITE.

Update
Indeks