Xiaomi'nin yeni yapay zeka modeli: Rakiplere yakın ama çok daha ucuz

yakın bildirim

Bu makale İngilizce olarak da mevcuttur. Teknik yardımla tercüme edildi ve yayınlanmadan önce editoryal olarak gözden geçirildi.

Xiaomi, birlikte otonom yapay zeka aracılarının temelini oluşturacak üç yapay zeka modelini tanıttı. Basitçe ifade etmek gerekirse, üst model MiMo-V2-Pro “beyin”, multimodal model MiMo-V2-Omni “duyular” ve konuşma sentezi modeli MiMo-V2-TTS etmenli sistemlerin “sesi” görevi görüyor.

Reklamdan sonra devamını okuyun

Daha önce DeepSeek R1'de yer alan Fuli Luo, yapay zeka modellerinin geliştirilmesinden sorumlu. Üzerindeki bir gönderide, modellerin açık kaynak olarak yayınlanması olasılığı öne sürülüyor, ancak bu, modellerin yeterli stabiliteye ulaşması koşuluna bağlı.

En üst model MiMo-V2-Pro'nun çok aşamalı görevleri planlayabilmesi, araçları entegre edebilmesi ve karmaşık iş akışlarını yürütebilmesi amaçlanıyor. Teknik olarak Xiaomi, herhangi bir zamanda yalnızca 42 milyarı aktif olan trilyondan fazla parametreye sahip bir uzman modeline güveniyor. Bu, talep başına modelin yalnızca bir kısmının kullanıldığı anlamına gelir; bu da hesaplama çabasını sınırlandırabilir ve dolayısıyla maliyetleri de azaltabilir. Aynı zamanda MiMo-V2-Pro, bir milyona kadar jetonun bağlam pencerelerini destekler ve bu nedenle çok kapsamlı girdileri işleyebilir.

Karşılaştırmalarda Xiaomi MiMo-V2-Pro, en iyi modellerden açıkça daha iyi performans göstermeden en üst sırada yer alıyor. Buna göre model, Yapay Analiz Zeka Endeksi'nde küresel anlamda ilk 10'a girmeyi ve ClawEval ve PinchBench gibi etmen odaklı testlerde yüksek puanlar elde etmeyi başardı.

Yapay Analiz Zekası Endeksi AI kıyaslaması.

Xiaomi MiMo-V2-Pro'nun karşılaştırması budur.

(Resim: Xiaomi)

Resmi sunumdan önce MiMo-V2-Pro, OpenRouter gibi platformlarda zaten “Hunter Alpha” adı altında görünmüştü ve anonim olarak yayınlanan model, kısa sürede en çok kullanılan sistemler arasında yerini almıştı. Geliştiriciler başlangıçta bunun DeepSeek'in yeni bir modeli olabileceğini öne sürdüler.

Reklamdan sonra devamını okuyun

Xiaomi, API'yi merkezi bir argüman olarak kullanırken maliyet yapısını vurguluyor. Bir milyon tokena kadar daha büyük bağlam uzunlukları için, milyon giriş tokenı başına yaklaşık iki dolar ve çıktı tokenları için altı dolar ödenecektir. Karşılaştırma için: Claude Sonnet 4.6 sırasıyla yaklaşık üç ve 15 dolar, Claude Opus 4.6 ise milyon token başına beş ve 25 dolar.

Multimodal model MiMo-V2-Omni, planlama konusunda uzmanlaşmış MiMo-V2-Pro'yu algılayıcı ve yürütücü bir bileşenle tamamlıyor. Xiaomi'ye göre model, durumları anlamak, eylemleri türetmek ve dijital görevleri gerçekleştirmek için görüntü, video ve ses verilerini aynı anda işliyor.

Xiaomi bunu çeşitli kullanım örnekleriyle gösteriyor: araç kamerası videolarını ve film sahnelerini analiz etmekten yedi saatlik bir podcast'i özetlemeye, OpenClaw ile görevlere göz atmaya, otomatik alışverişe ve kısa bir video oluşturup TikTok'a yüklemeye kadar. Xiaomi'nin hedefi, gelecekte MiMo-V2-Omni'nin görevleri yalnızca dakikalar içinde değil, saatler veya günler boyunca planlayabilmesi ve aynı zamanda örneğin robotik alanında fiziksel sistemleri de kontrol edebilmesidir.

MiMo-V2-Pro görevleri planlarken ve MiMo-V2-Omni bunları eylemlere dönüştürürken, MiMo-V2-TTS'nin kullanıcılarla dilsel iletişimi devralması amaçlanıyor: Konuşma sentezi modeli, gerçek zamanlı olarak sözlü yanıtlar üretir ve konuşmanın tonunu ve tarzını ilgili bağlama uyarlayabilmelidir. Şu anda MiMo-V2-TTS yalnızca İngilizce ve Çince'yi desteklemektedir ancak Xiaomi gelecekte dil kapsamını genişletmeyi planlamaktadır.


(olmak)


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir