Google, Search Live'ı Gemini 2.5 Flash Native Audio ile güncelleyerek Arama içindeki ses işlevlerini iyileştirirken aynı zamanda modelin çeviri ve canlı ses aracıları genelinde kullanımını da genişletti. Güncelleme, Canlı Arama'da daha doğal sesli yanıtlar sunuyor ve Google'ın doğal sesli sorguları iyileştirme çabasını yansıtıyor; kullanıcıların normal aramadan elde edebilecekleri her şeyi almalarının yanı sıra çevrelerindeki fiziksel dünya hakkında sorular sormalarına ve farklı dilleri konuşan iki kişi arasında anında sesli çeviri almalarına olanak tanıyan bir yol olarak sesi temel bir arayüz olarak ele alıyor.
Bu hafta Amerika Birleşik Devletleri'nde kullanıma sunulacak yeni güncellenmiş ses özellikleri, Google'ın sesli yanıtlarının daha doğal duyulmasını sağlayacak ve hatta eğitici içerik için yavaşlatılabilecek.
Google'a göre:
“Arama ile Canlı Yayına geçtiğinizde, gerçek zamanlı yardım almak ve web'deki ilgili siteleri hızlı bir şekilde bulmak için AI Modunda ileri geri sesli görüşme yapabilirsiniz. Ve şimdi, yerel sese yönelik en yeni Gemini modelimiz sayesinde, Canlı Arama'daki yanıtlar her zamankinden daha akıcı ve etkileyici olacak.”
Daha Geniş Gemini Yerel Ses Sunumu
Bu Arama yükseltmesi, Gemini Live (Gemini Uygulamasında), Google AI Studio ve Vertex AI dahil olmak üzere Google ekosisteminde kullanıma sunulan Gemini 2.5 Flash Native Audio'ya yönelik daha geniş bir güncellemenin parçasıdır. Model, konuşulan sesi gerçek zamanlı olarak işler ve akıcı sözlü yanıtlar üreterek doğal konuşmanın önündeki engelleri azaltır ve canlı etkileşimlerdeki sürtünmeyi azaltır. Google'ın duyurusunda modelin bir konuşma-konuşma modeli olduğu söylenmese de (konuşmayı metne, ardından metinden konuşmaya karşıt olarak), bu güncelleme Google'ın Ekim ayındaki “Konuşmayı Alma (S2R) duyurusunun ardından gelir. Bu, eşleştirilmiş ses sorgularından oluşan büyük veri kümeleri üzerinde eğitilmiş sinir ağı tabanlı bir makine öğrenimi modelidir.”
Bu değişiklikler, Google'ın tüketiciye yönelik ürünlerde yerel sesi temel bir yetenek olarak ele aldığını ve kullanıcıların çevrelerindeki fiziksel dünya hakkında daha önce mümkün olmayan doğal bir şekilde bilgi sormasını ve almasını kolaylaştırdığını gösteriyor.
Ses Tabanlı Sistemler İçin İyileştirmeler
Google, ses tabanlı sistemler oluşturan geliştiriciler ve kuruluşlar için güncellenen modelin çeşitli alanlarda güvenilirliği artırdığını söylüyor. Gemini 2.5 Flash Native Audio, konuşmalar sırasında harici işlevleri daha tutarlı bir şekilde tetikler, karmaşık talimatları takip eder ve birden fazla aşamada bağlamı korur. Bu iyileştirmeler, yanlış yorumlanan talimatların veya bozuk konuşma akışının kullanılabilirliği azalttığı gerçek dünyadaki iş akışlarında canlı ses aracılarını daha güvenilir hale getiriyor.
Sorunsuz Konuşmalı Çeviri
Güncelleme, Arama ve sesli aracıların ötesinde “canlı konuşmadan konuşmaya çeviri” için yerel destek sunuyor. Gemini, ortamdaki konuşmayı sürekli olarak hedef dile çevirerek veya farklı dilleri konuşanlar arasındaki konuşmaları her iki yönde yöneterek konuşulan dili gerçek zamanlı olarak çevirir. Sistem, konuşma ritmi ve vurgu gibi ses özelliklerini koruyarak daha akıcı ve konuşmaya benzer bir çeviriyi destekler.
Google, geniş dil kapsamı, otomatik dil algılama, çok dilli giriş işleme ve günlük ortamlar için gürültü filtreleme dahil olmak üzere bu çeviri özelliğini destekleyen çeşitli özellikleri vurgulamaktadır. Bu özellikler kurulumdaki zorlukları azaltır ve çevirinin manuel kontroller yerine konuşma sırasında pasif olarak gerçekleşmesine olanak tanır. Sonuç, iki kişi arasında çeviri yapan gerçek bir kişi gibi davranan bir çeviri deneyimidir.
Sesli Arama Google'ın Hedeflerini Gerçekleştiriyor
Güncelleme, Google'ın, popüler Star Trek televizyon ve film dizisindeki insanlar ve bilgisayarlar arasındaki bilim kurgu ses etkileşimlerinden ilham alan bir ideale doğru devam eden sesli arama yinelemesini yansıtıyor.
Devamını oku:
Google Sesli Aramada Yeni Bir Dönemi Duyurdu
Arama ile Canlı yayına geçtiğinizde artık daha akıcı ve anlamlı konuşmalar yapabilirsiniz.
Güçlü ses etkileşimleri için geliştirilmiş Gemini ses modelleri
İkizler Canlı
Arama ile Canlı yayına geçerek gerçek zamanlı yardım almanın 5 yolu
Shutterstock/Jackbin'den Öne Çıkan Görsel

Bir yanıt yazın