Google, Metin Okuma aracına yönelik iki yeni güncellemeyi duyurdu: Gemini 2.5 Flash ve Gemini 2.5 Pro. Bunlar, gelişmiş hassasiyet ve ifade gücüne sahip akıcı diyaloglar vaat ediyor. Bu iki yeni mod artık bir güncelleme aracılığıyla mevcut.
Metinden Konuşmaya, Gemini'yi kullanarak metni doğal ve optimize edilmiş sözlü konuşmaya dönüştürmenize olanak tanıyan bir konuşma sentezi teknolojisidir. Google bugün, daha geniş bir ses ifadesi aralığı, verilen talimatların daha iyi anlaşılması, daha akıllı hız ayarlamaları ve artık 24 dili kapsayan destek sunan Gemini 2.5 Flash ve Gemini 2.5 Pro adlı iki yeni modu tanıttı.
Gemini 2.5 Flash ve Gemini 2.5 Pro, daha fazla hassasiyet için iki yeni model
İlk Gemini 2.5 Flash modu düşük gecikmeli senaryolar için uygunken, Gemini 2.5 Pro ses kalitesine öncelik veriyor.
Bu iki yeni modun her ikisi de, sunulan tonun çok yönlülüğü sayesinde gelişmiş ifade gücü vaat ediyor. Çok paydaşlı senaryolarda bile her duruma uyarlanmış ve tutarlı sesler sayesinde diyalog daha akıcı olmalıdır. Bu sesler “mutlu ve iyimser” arasında değişen belirli tonlara ulaşma yeteneğine sahiptir. “karanlık ve ciddi”. Precision Rhythm de yeniden düzenlendi ve artık daha akıllı hız ayarına ve daha iyi talimat takibine sahip.
Hepsi bu kadar değil, çok dilli yetenekler de geliştirildi, artık 24 dil Metinden Konuşmaya aracı tarafından destekleniyor.
Bu iyileştirmeler, kullanıcı ihtiyaçlarının daha iyi karşılanmasını mümkün kılmalı, aynı zamanda şimdiye kadar fazla kişisel olmadığı için eleştirilen Metinden Konuşmaya aracına yönelik uzun süredir devam eden eleştirilere de yanıt vermelidir.
Bu iki yeni mod artık Google AI Studio'daki Gemini API'si aracılığıyla kullanılabiliyor ve TTS'nin Mayıs 2023'te yayınlanan eski sürümlerinin yerini alıyor.
👉🏻 Teknoloji haberlerini gerçek zamanlı takip edin: 01net'i Google'daki kaynaklarınıza ekleyin, WhatsApp kanalımıza abone olun veya bizi TikTok'taki videodan takip edin.

Yazan: Opera
Kaynak :

Bir yanıt yazın