Alibaba Luncurkan Model AI Multimodal Qwen2.5-Omni-7B, Optimalkan Perangkat Seluler

Sabtu, 29 Maret 2025 | 11:34:24 WIB
Alibaba Luncurkan Model AI Multimodal Qwen2.5-Omni-7B, Optimalkan Perangkat Seluler

JAKARTA - Alibaba Group melalui anak perusahaannya, Alibaba Cloud, resmi meluncurkan model kecerdasan buatan (AI) terbaru bernama Qwen2.5-Omni-7B. Model ini dirancang sebagai AI multimodal yang mampu memproses berbagai jenis input, seperti teks, gambar, audio, dan video, serta menghasilkan output dalam bentuk teks dan audio secara real-time. Dengan 7 miliar parameter, Qwen2.5-Omni-7B dioptimalkan agar dapat berjalan dengan efisien di perangkat seperti ponsel pintar, tablet, dan laptop, memungkinkan akses AI yang lebih canggih bagi pengguna sehari-hari.

"Kombinasi unik ini menjadikannya fondasi yang ideal untuk mengembangkan agen AI yang gesit dan hemat biaya, terutama dalam aplikasi suara cerdas," ujar Alibaba dalam pernyataannya.

Model ini telah melalui pelatihan dengan dataset besar dan beragam yang mencakup kombinasi image-text, video-text, video-audio, audio-text, dan teks. Hal ini membuat Qwen2.5-Omni-7B mampu memahami dan mengolah berbagai jenis input dengan performa yang lebih baik. Salah satu potensi aplikasinya adalah membantu penyandang tunanetra dengan memberikan deskripsi audio secara real-time atau memberikan panduan langkah demi langkah dalam berbagai aktivitas, seperti memasak dengan menganalisis bahan makanan yang tersedia.

Sebagai model AI open-source, Qwen2.5-Omni-7B kini dapat diakses secara gratis oleh pengembang atau perusahaan lain melalui platform seperti Hugging Face, GitHub, dan ModelScope milik Alibaba. Dengan keterbukaan ini, pengguna maupun pengembang dapat memanfaatkan model ini untuk penelitian, eksperimen, atau membangun aplikasi berbasis AI tanpa harus mengembangkan model dari nol.

Dari segi performa, Qwen2.5-Omni-7B menunjukkan kinerja yang mengesankan dalam berbagai uji benchmark. Model ini mencetak skor 56,1 pada OmniBench, melampaui skor 42,9 yang diraih oleh Google Gemini-1.5-Pro. Selain itu, model ini juga mengungguli versi sebelumnya, Qwen2-Audio, dalam benchmark audio CV15 dengan skor 92,4, satu poin lebih tinggi. Untuk tugas yang berkaitan dengan pemrosesan gambar, Qwen2.5-Omni-7B mencetak skor 59,2 pada benchmark Massive Multi-discipline Multimodal Understanding and Reasoning, melampaui model vision-language Qwen2.5-VL.

Peluncuran Qwen2.5-Omni-7B ini terjadi di tengah persaingan ketat dalam pengembangan AI di China, yang semakin berkembang pesat. Alibaba terus menunjukkan komitmennya dalam industri AI dengan mengumumkan rencana investasi sebesar 53 miliar dolar AS atau sekitar Rp 878,8 triliun dalam infrastruktur cloud dan AI selama tiga tahun ke depan. Investasi ini bahkan melebihi total dana yang telah dikeluarkan perusahaan dalam satu dekade terakhir.

Dengan kemampuan dan fleksibilitasnya, Qwen2.5-Omni-7B diharapkan mampu mendorong inovasi lebih lanjut dalam pengembangan aplikasi AI, khususnya yang berbasis suara dan multimodal. Model ini juga semakin memperkuat posisi Alibaba sebagai salah satu pemain utama dalam lanskap AI global.

Terkini

Cara Cek Biaya Pajak Motor Online dan Cara Bayarnya

Jumat, 19 September 2025 | 22:44:39 WIB

Ini Daftar Tarif Listrik per kWh untuk Semua Golongan

Jumat, 19 September 2025 | 22:44:32 WIB

Biaya Kuliah di Luar Negeri yang Murah? Cek 5 Negara ini!

Jumat, 19 September 2025 | 22:44:27 WIB