Google'ın Öneri Sistemi Devrimi Semantik Niyeti Tespit Ediyor

Google, öneri sistemlerinin, kullanıcıların kendileriyle etkileşime girdiklerinde ne demek istediğini anlamalarına yardımcı olma konusunda bir araştırma makalesi yayınladı. Bu yeni yaklaşımla hedefleri, kullanıcıların ne okumak, dinlemek veya izlemek istediklerini bireysel düzeyde daha iyi ve ayrıntılı bir şekilde anlamak için mevcut en son teknolojiye sahip öneri sistemlerinin doğasında var olan sınırlamaların üstesinden gelmektir.

Kişiselleştirilmiş Anlambilim

Öneri sistemleri, bir kullanıcının bundan sonra ne okumak veya izlemek istediğini tahmin eder. YouTube, Google Discover ve Google Haberler, kullanıcılara içerik önermeye yönelik öneri sistemlerine örnektir. Diğer öneri sistemleri ise alışveriş önerileridir.

Öneri sistemleri genellikle bir kullanıcının tıkladığı, derecelendirdiği, satın aldığı ve izlediği şeyler hakkında veri toplayarak ve ardından bu verileri kullanıcının tercihlerine uygun daha fazla içerik önermek için kullanarak çalışır.

Araştırmacılar bu tür sinyalleri ilkel kullanıcı geri bildirimi olarak adlandırdı çünkü bunlar, bireyin neyin komik, sevimli veya sıkıcı olduğu konusundaki öznel yargısına dayalı önerilerde pek iyi değil.

Araştırmanın arkasındaki sezgi, Yüksek Lisans'ların yükselişinin, anlamsal amacı belirleyerek kullanıcının ne istediğini daha iyi anlamak için doğal dil etkileşimlerinden yararlanma fırsatı sunmasıdır.

Araştırmacılar şöyle açıklıyor:

“Etkileşimli öneri sistemleri, geleneksel öneri sistemleri tarafından kullanılan ilkel kullanıcı geri bildirimlerinin (örneğin, tıklamalar, ürün tüketimi, derecelendirmeler) sınırlamalarının üstesinden gelmek için umut verici bir paradigma olarak ortaya çıkmıştır. Kullanıcıların, genellikle doğal dili kullanarak (çok yönlü arama ve diyalog dahil) niyetini, tercihlerini, kısıtlamalarını ve bağlamlarını daha zengin bir şekilde ifade etmelerine olanak tanır.

Ancak bu geri bildirimi kullanmanın en etkili yollarını bulmak için daha fazla araştırmaya ihtiyaç var. Zorluklardan biri, istenen bir öğeyi tanımlamak için sıklıkla kullanılan açık uçlu terimlerden veya niteliklerden kullanıcının anlamsal amacını çıkarmaktır. Bu, öneri sonuçlarını iyileştirmek amacıyla doğal dili günlük, sezgisel kullanımlarında kullanıcılara destek olmak isteyen öneri sistemleri için kritik öneme sahiptir.”

Yumuşak Nitelikler Mücadelesi

Araştırmacılar, katı niteliklerin öneri sistemlerinin anlayabileceği bir şey olduğunu, çünkü bunların “tür, sanatçı, yönetmen” gibi nesnel temel gerçekler olduğunu açıkladı. Sorun yaşadıkları şey, “yumuşak nitelikler” adı verilen, öznel olan ve filmlerle, içerikle veya ürün öğeleriyle eşleştirilemeyen diğer tür niteliklerdi.

Araştırma makalesinde yumuşak niteliklerin aşağıdaki özellikleri belirtilmektedir:

“Bu tür yumuşak nitelikleri öğelerle ilişkilendiren kesin bir “temel gerçek” kaynağı yok

Niteliklerin kendileri kesin olmayan yorumlara sahip olabilir

Ve doğası gereği subjektif olabilirler (yani farklı kullanıcılar bunları farklı şekilde yorumlayabilir)”

Esnek nitelikler sorunu, araştırmacıların çözmek için yola çıktığı sorundur ve araştırma makalesine neden Kavram Etkinleştirme Vektörlerini Kullanan Tavsiye Sistemlerinde Esnek Nitelikler için Kişiselleştirilmiş Anlambilimi Keşfetme adı verilmiştir.

Konsept Aktivasyon Vektörlerinin (CAV'ler) Yeni Kullanımı

Konsept Etkinleştirme Vektörleri (CAV'ler), modellerin dahili olarak kullandığı matematiksel temsilleri (vektörleri) anlamak için yapay zeka modellerini incelemenin bir yoludur. İnsanların bu iç vektörleri kavramlara bağlaması için bir yol sağlarlar.

Yani CAV'ın standart yönü modeli yorumlamaktır. Araştırmacıların yaptığı şey bu yönü değiştirmekti; böylece artık amaç kullanıcıları yorumlamak, öznel yumuşak nitelikleri öneri sistemleri için matematiksel temsillere dönüştürmekti. Araştırmacılar, CAV'leri kullanıcıları yorumlamak için uyarlamanın, yapay zeka modellerinin bir bireye kişiselleştirilmiş ince niyetleri ve öznel insan yargılarını tespit etmesine yardımcı olan vektör temsillerini etkinleştirdiğini keşfetti.

Onlar yazarken:

“CAV temsilimizin yalnızca kullanıcıların öznel anlambilimini doğru bir şekilde yorumlamakla kalmayıp, aynı zamanda etkileşimli öğe eleştirisi yoluyla önerileri geliştirmek için de kullanılabileceğini gösteriyoruz.”

Örneğin model, kullanıcıların “komik” derken farklı şeyleri kastettiğini öğrenebilir ve önerilerde bulunurken bu kişiselleştirilmiş anlambilimden daha iyi yararlanabilir.

Araştırmacıların çözdüğü sorun, insanların konuşma şekli ile tavsiye sistemlerinin “düşünme” şekli arasındaki anlamsal boşluğun nasıl kapatılacağını bulmaktır.

İnsanlar belirsiz veya öznel açıklamalar (yumuşak nitelikler olarak adlandırılır) kullanarak kavramlarla düşünürler.

Öneri sistemleri matematikte “düşünür”: Yüksek boyutlu bir “gömme uzayında” vektörler (sayı listeleri) üzerinde çalışırlar.

O zaman sorun, tavsiye sistemini tüm nüanslarıyla değiştirmek veya yeniden eğitmek zorunda kalmadan, öznel insan konuşmasını daha az belirsiz hale getirmektir. CAV'lar bu ağır işi yapıyor.

Araştırmacılar şöyle açıklıyor:

“…tavsiye sistemi modelinin kendisi tarafından öğrenilen temsili kullanarak esnek niteliklerin anlambilimini çıkarıyoruz.”

Yaklaşımlarının dört avantajını sıralıyorlar:

“(1) Tavsiye sisteminin model kapasitesi, ek yan bilgileri (örneğin etiketler) tahmin etmeye çalışmadan kullanıcı öğesi tercihlerini tahmin etmeye yöneliktir ve bu genellikle tavsiye sisteminin performansını iyileştirmez.

(2) Tavsiye sistemi modeli, yeni esnek niteliklerin türetileceği yeni etiket, anahtar sözcük veya kelime öbeği kaynaklarının ortaya çıkması durumunda, yeniden eğitim gerektirmeden yeni nitelikleri kolayca barındırabilir.

(3) Yaklaşımımız, belirli esnek özelliklerin kullanıcı tercihlerini tahmin etmeyle alakalı olup olmadığını test etmek için bir araç sunar. Böylece, kullanıcının amacını yakalamayla en alakalı niteliklere (örneğin, önerileri açıklarken, tercihleri ortaya çıkarırken veya eleştiriler önerirken) odaklanabiliyoruz.

(4) Ön eğitim ve birkaç adımlı öğrenme ruhuyla, nispeten küçük miktarlarda etiketli verilerle yumuşak nitelik/etiket anlambilimi öğrenilebilir.

Daha sonra sistemin nasıl çalıştığına dair üst düzey bir açıklama sunarlar:

“Yüksek düzeyde yaklaşımımız şu şekilde çalışıyor: bize verilenlerin verildiğini varsayıyoruz:

(i) öğeleri ve kullanıcıları, kullanıcı öğesi derecelendirmelerine dayalı olarak gizli bir alana yerleştiren işbirlikçi filtreleme tarzı bir model (örneğin, olasılıksal matris çarpanlarına ayırma veya ikili kodlayıcı); Ve

(ii) bir öğe alt kümesi için bir kullanıcı alt kümesi tarafından sağlanan (küçük) bir etiket kümesi (yani, yumuşak nitelik etiketleri).

Her bir öğenin yumuşak bir nitelik sergileme derecesini ilişkilendiren ve böylece o niteliğin anlambilimini belirleyen yöntemler geliştiriyoruz. Bunu, makine öğrenimli modellerin yorumlanabilirliği için geliştirilen yeni bir yöntem olan kavram etkinleştirme vektörlerini (CAV'ler) işbirlikçi filtreleme modeline uygulayarak, özniteliğin bir temsilini öğrenip öğrenmediğini tespit ederek yapıyoruz.

Bu CAV'nin yerleştirme alanındaki projeksiyonu, daha sonra öğelere (ve kullanıcılara) uygulanabilecek nitelik için (yerel) yönlü bir anlambilim sağlar. Üstelik bu teknik, bir özelliğin öznel doğasını, özellikle de farklı kullanıcıların o etiketi kullanırken akıllarında farklı anlamlar (veya etiket anlamları) olup olmadığını belirlemek için kullanılabilir. Sübjektif nitelikler için böylesine kişiselleştirilmiş bir anlambilim, kullanıcının tercihlerini değerlendirmeye çalışırken gerçek niyetinin sağlıklı yorumlanması açısından hayati önem taşıyabilir.”

Bu Sistem Çalışıyor mu?

İlginç bulgulardan biri, yapay bir etiket (tek yıl) testinin, sistemin doğruluk oranının rastgele bir seçimin hemen hemen üzerinde olduğunu göstermesidir; bu da “CAV'lerin tercihle ilgili nitelikleri/etiketleri tanımlamak için yararlı olduğu” hipotezini doğrulamıştır.

Ayrıca öneri sistemlerinde CAV'lerin kullanılmasının “eleştiriye dayalı” kullanıcı davranışını anlamak için yararlı olduğunu ve bu tür öneri sistemlerini iyileştirdiğini de buldular.

Araştırmacılar dört fayda sıraladı:

“(i) öneri göreviyle en fazla ilgili olan nitelikleri belirlemek için işbirlikçi bir filtreleme gösterimi kullanmak;

(ii) nesnel ve öznel etiket kullanımını ayırt etmek;

(iii) öznel nitelikler için kişiselleştirilmiş, kullanıcıya özel anlambilimin belirlenmesi; Ve

(iv) nitelik anlambilimini tercih temsilleriyle ilişkilendirmek, böylece örnek eleştiride ve diğer tercih ortaya çıkarma biçimlerinde esnek nitelikler/etiketler kullanan etkileşimlere izin vermek.”

Yaklaşımlarının esnek niteliklerin keşfedilmesinin önemli olduğu durumlar için önerileri iyileştirdiğini buldular. Bu yaklaşımı, ürün alışverişi gibi sert özelliklerin daha fazla norm olduğu durumlarda kullanmak, yumuşak özelliklerin ürün önerilerinde bulunmaya yardımcı olup olmayacağını görmek için gelecekteki bir çalışma alanıdır.

Paket servis

Araştırma makalesi 2024'te yayınlandı ve onu bulmak için araştırma yapmak zorunda kaldım, bu da arama pazarlamacılığı topluluğunda neden genel olarak fark edilmediğini açıklayabilir.

Google, bu yaklaşımın bir kısmını, Google Cloud'un geliştiricilere yönelik bir ürünü olan gerçek üretim kodu olan WALS (Ağırlıklı Alternatif En Küçük Kareler) adlı bir algoritmayla test etti.

Dipnotta ve ekte yer alan iki notta şunlar açıklanmaktadır:

“Doğrusal özelliklere sahip MovieLens20M verilerindeki CAV'ler, yayınlanamayan dahili üretim kodu kullanılarak öğrenilen (WALS aracılığıyla) yerleştirmeleri kullanıyor.”

…Doğrusal yerleştirmeler, yayınlanamayan dahili üretim kodu kullanılarak öğrenildi (WALS aracılığıyla, Ek A.3.1).

“Üretim kodu” şu anda Google'ın kullanıcıya yönelik ürünlerinde (bu örnekte Google Cloud) çalışan yazılımı ifade eder. Muhtemelen Google Discover'ın temelindeki motor değildir, ancak mevcut bir öneri sistemine ne kadar kolay entegre edilebileceğini gösterdiği için dikkate alınması önemlidir.

Bu sistemi, 20 milyon derecelendirmeden oluşan halka açık bir veri kümesi olan MovieLens20M veri kümesini kullanarak test ettiler ve testlerden bazıları Google'ın tescilli öneri motoruyla (WALS) yapıldı. Bu, bu kodun canlı bir sistemde yeniden eğitilmesine veya değiştirilmesine gerek kalmadan kullanılabileceği çıkarımına güvenilirlik kazandırır.

Bu araştırma makalesinde gördüğüm sonuç, bunun tavsiye sistemlerinin esnek niteliklerle ilgili anlamsal verilerden yararlanmasını mümkün kılmasıdır. Google Keşfet, Google tarafından aramanın bir alt kümesi olarak kabul edilir ve arama modelleri, sistemin içeriği ortaya çıkarmak için kullandığı verilerden bazılarıdır. Google bu tür bir yöntem kullanıp kullanmadıklarını söylemiyor ancak olumlu sonuçlar göz önüne alındığında bu yaklaşımın Google'ın öneri sistemlerinde kullanılması mümkün. Durum böyleyse bu, Google'ın önerilerinin kullanıcıların öznel anlambilimine daha duyarlı olabileceği anlamına gelir.

Araştırma makalesinde Google Research'e (kredilerin %60'ı) ve ayrıca Amazon, Midjourney ve Meta AI'ya atıfta bulunulmaktadır.

PDF burada mevcuttur:

Konsept Etkinleştirme Vektörlerini Kullanarak Öneri Sistemlerinde Esnek Nitelikler için Kişiselleştirilmiş Anlambilimi Keşfetme

Shutterstock/Here'den Öne Çıkan Görsel