Google'ın yapay zekası neden Google'ı (veya başka bir şeyi) heceleyemiyor?

Google'da kaç P var? Google'a göre iki tane var.

Ayrıca Google'ın Yapay Zeka Genel Bakışı, “'kaka' sözcüğünde tam olarak 1 'r'nin bulunduğunu” söylüyor; ayrıca gazetecilik sözcüğünde iki 'd' var, ama onu gazetecilik olarak heceliyor. Google en azından ABD başkanının soyadında bir P harfi olduğunu tespit etti ancak bunu trpum olarak yazdı.

Google'ın AI-ileriye yönelik Arama revizyonunun kötü sonuçlanacağını tahmin etmek için kahin olmanıza gerek yoktu. Bunu daha önce de yapmıştık. Google, Arama'ya Yapay Zeka Genel Bakışını ilk kez eklediğinde, bu özellik The Onion ve Reddit'teki hicivli gönderilerden alıntı yaparak insanlara taş yemelerini ve pizzalarına yapıştırıcı sürmelerini tavsiye ediyordu.

Bu sefer Google, üretken yapay zekayı 29 yıllık amiral gemisi ürününün merkezi haline getirme konusundaki kararlılığını iki katına çıkarırken, onun tökezlediğini görmek şaşırtıcı değil.

Google, Tmzilla'a e-postayla gönderilen bir bildiride “Kelimelerle saymak yüksek lisans öğrencileri için bilinen bir zorluktur ve bu özel sorunu çözmeye çalışıyoruz” dedi.

Bu temel yazım hataları tanıdık gelebilir. Sohbet robotlarına ve diğer metin oluşturuculara güç veren bir tür yapay zeka olan LLM'ler, yazımı anlamak için tasarlanmamıştır. Ne zaman bir şirket yeni bir yapay zeka modelini tanıtsa, ona çilek kelimesinde kaç tane 'r' olduğunu sormanız gerektiği yıllardır devam eden bir şakaydı. Bir uygulamayı saniyeler içinde kodlayabilen veya matematikçileri onlarca yıldır şaşırtan problemleri çözebilen bu yapay zeka modelleri, yazım konusunda bir anaokulu öğrencisi kadar iyidir.

Google'ın yapay zekaya genel bakışındaki sorunlar aptalca yazım hatalarının ötesine geçiyor. Google, geçen haftadan itibaren, “dikkate almama” kelimesini aramanın, kelimenin sözlük tanımına benzeyen bir sonuç vermesine neden olan bir sorunu zaten yamalamıştı; yalnızca tanım, “Anlaşıldı. Yeni bir soru veya soru olduğunda bana haber ver!” Ancak bu yazım hataları eğlenceli olmaya devam etti çünkü bunların ortadan kaldırılması çok zor.

Araştırmacıların daha önce bu yazım bilmecelerini sorduğumuzda açıkladığı gibi, yapay zeka cümleleri kelimelerden ve harflerden oluşan dil birimleri olarak algılamıyor. Birçok LLM, metni modele bağlı olarak tam kelimeler, heceler veya harfler olabilen belirteçlere bölen transformatör modelleri üzerine kuruludur. Yapay zeka, bir insanın yaptığı gibi “okumak” yerine, metni kendisinin sayısal temsillerine dönüştürür ve bunlar daha sonra yapay zekanın mantıksal bir yanıt bulmasına yardımcı olmak için bağlamsallaştırılır.

Resim Kredisi:Tmzilla

Alberta Üniversitesi'nde yapay zeka araştırmacısı ve yardımcı doçent olan Matthew Guzdial, Tmzilla'a şunları söyledi: “LLM'ler, aslında metin okumayan bu transformatör mimarisini temel alıyor. Bir bilgi istemi girdiğinizde, bu bir kodlamaya çevriliyor.” “'The' kelimesini gördüğünde, 'the'nin ne anlama geldiğine dair bir kodlamaya sahiptir, ancak 'T', 'H', 'E' hakkında bilgisi yoktur.”

Google'ın yapay zekaya genel bakışı gibi LLM'lere güç veren jeton tabanlı mimari, doğası gereği sınırlayıcıdır ve araştırmacılar, yazım sorununu çözebilecekleri konusunda iyimser değiller.

Northeastern Üniversitesi'nde geniş dil modellerinin yorumlanabilirliği üzerine çalışan doktora öğrencisi Sheridan Feucht, Tmzilla'a şunları söyledi: “Bir dil modeli için bir 'kelimenin' tam olarak ne olması gerektiği sorusunun etrafından dolaşmak biraz zor ve uzmanlardan mükemmel bir belirteç kelime dağarcığı üzerinde anlaşmaya varsak bile, modeller muhtemelen bazı şeyleri daha da 'parçalamayı' yararlı bulacaktır.” “Tahminimce bu tür bulanıklık nedeniyle mükemmel tokenizer diye bir şey yoktur.”

Bu, araştırmacıların kafasında mutlaka acil bir sorun teşkil etmiyor, çünkü Yüksek Lisans'ın faydası onların kapasitesiyle sınırlı değil. Ancak bu bariz başarısızlıklar, bazen algımızın ötesinde her şeyi bilen bir güç gibi görünse bile, yapay zekanın mükemmel olmadığını hatırlamamıza yardımcı oluyor. Doğruluklarını iki kez kontrol etmeden yapay zeka çıktılarına körü körüne güvenemeyiz.

Makalelerimizdeki bağlantılar aracılığıyla satın aldığınızda küçük bir komisyon kazanabiliriz. Bu bizim editoryal bağımsızlığımızı etkilemez.

Google'ın yapay zekası neden Google'ı (veya başka bir şeyi) heceleyemiyor?

Yorumlar

Bir yanıt yazın Yanıtı iptal et