Bu yapay zeka teknolojisi, yüksek sesle söylenmeyen kelimeleri bile anlayabiliyor

Pohang Bilim ve Teknoloji Üniversitesi'ndeki (POSTECH) araştırmacılar, ince boyun kas hareketlerini okuyarak sessiz konuşmayı duyulabilir sese dönüştürebilen çığır açıcı bir giyilebilir teknoloji geliştirdi. Profesör Sung-Min Park ve Dr. Sunguk Hong tarafından yürütülen çalışma, Cyborg and Bionic Systems'de yayınlandı ve insan-makine iletişiminde ileriye doğru atılan önemli bir adıma işaret ediyor.

Kas Hareketlerinden Konuşulan Sözlere

Yenilik basit ama güçlü bir fikir üzerine inşa edildi: Konuşma sadece sesten ibaret değildir. Bir kişi konuştuğunda veya sessizce konuşmaya çalıştığında, boyun çevresindeki kaslarda ve deride küçük hareketler meydana gelir. Bu hareketler amaçlanan konuşmanın bir tür “görünmez haritasını” oluşturur.

Bunu yakalamak için araştırmacılar, çok eksenli gerinim haritalama sensörü adı verilen giyilebilir bir cihaz yarattılar. Sistem, minyatür bir kamerayı referans işaretleyicilerle gömülü esnek silikonla birleştirerek en küçük cilt deformasyonlarını bile tespit etmesine olanak tanır. Günlük kullanım için tasarlanan sensör, rahatça boyna takılabilir ve yeniden konumlandırıldığında otomatik olarak yeniden kalibre edilir.

Toplanan veriler daha sonra gerginlik modellerini yorumlayan ve amaçlanan kelimeleri veya cümleleri yeniden oluşturan yapay zeka kullanılarak işleniyor. Bunu kullanıcının ses profiline göre eğitilmiş ses senteziyle eşleştiren sistem, hiç ses üretilmediğinde bile kişinin doğal sesine çok benzeyen bir konuşma üretebilir.

Mevcut Sistemler Üzerinde Pratik Bir Atılım

Geleneksel ses restorasyon yöntemleri, genellikle büyük ekipman gerektiren ve uzun süreli kullanımda rahatsız edici olabilen Elektromiyografi (EMG) veya Elektroensefalografi (EEG) gibi teknolojilere dayanır.

POBTEK ekibinin yaklaşımı hafif, giyilebilir bir alternatif sunarak bu engelleri ortadan kaldırıyor. Testlerde sistem, geleneksel mikrofonların zorlandığı endüstriyel ortamlar gibi gürültülü ortamlarda bile konuşmayı yeniden yapılandırmada yüksek doğruluk sergiledi.

Gerçek Dünya Etkisi ve Gelecek Potansiyeli

Bu teknolojinin etkileri geniş kapsamlıdır. Ses teli hasarı veya gırtlak ameliyatı nedeniyle sesini kaybeden hastalar için yeni bir iletişim yolu sunarak, kendi ses profillerini kullanarak yeniden “konuşmalarını” sağlayabilir.

Sistem, sağlık hizmetlerinin ötesinde, kütüphaneler, toplantılar veya yüksek gürültülü işyerleri gibi yüksek sesle konuşmanın pratik olmadığı ortamlarda sessiz iletişimi mümkün kılabilir. Aynı zamanda niyetin fiziksel seslendirme olmadan konuşmaya tercüme edilebildiği daha doğal insan-yapay zeka arayüzlerinin kapısını da açıyor.

İleriye Bakış

Araştırmacılar, teknolojiyi gerçek dünyada daha geniş bir dağıtım için geliştirmeyi, doğruluğu artırmayı ve dil yeteneklerini genişletmeyi amaçlıyor. Gelecekteki yinelemeler, tüketici cihazlarıyla daha sorunsuz bir şekilde entegre olabilir ve potansiyel olarak insanların hem kişisel hem de profesyonel ortamlarda iletişim kurma şeklini dönüştürebilir.

Yapay zeka giyilebilir teknolojiyle birleşmeye devam ettikçe, bunun gibi yenilikler daha sezgisel, göze çarpmayan etkileşim biçimlerine doğru bir geçişin sinyalini veriyor; burada söylenmemiş kelimeler bile nihayet duyulabiliyor.


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir