Google'dan John Mueller, AI ajanlarına ve tarayıcılara web sitesi içeriğini göstermek için önerilen bir standart olan LLMS.txt hakkında bir soruyu cevapladı, yararlılığını küçümsedi ve onu kullanan başkalarının deneyimini doğrulayan işe yaramaz anahtar kelimeler meta etiketiyle karşılaştırdı.
Llms.txt
Llms.txt, büyük dil modelleri için bir robots.txt olarak karşılaştırıldı, ancak bu% 100 yanlış. Bir robots.txt'in temel amacı, botların bir web sitesini nasıl taramasını kontrol etmektir. LLMS.txt için teklif botları kontrol etmekle ilgili değildir. Bu gereksizdir çünkü bunun için bir standart robots.txt ile zaten var.
LLMS.txt için teklifi, genellikle reklam ve site navigasyonundan yoksun bir web sayfasının ana içeriğini tüketebilmeleri için işaretleme biçimini kullanan bir metin dosyasıyla LLMS'ye içerik göstermekle ilgilidir. Markdown dili, pound işareti (#) ile başlıkları gösteren ve eksi işareti (-) ile listeler gösteren bir insan ve makine okunabilir formatıdır. Llms.txt bu işlevselliğe benzer birkaç şey daha yapar ve tek şey budur.
Llms.txt nedir:
- Llms.txt, AI botlarını kontrol etmenin bir yolu değildir.
- Llms.txt, AI botlarına ana içeriği göstermenin bir yoludur.
- Llms.txt sadece bir tekliftir ve yaygın olarak kullanılan ve kabul edilen bir standart değildir.
Bu son kısım önemlidir, çünkü Google'ın John Mueller'in söylediği şeyle ilgilidir:
Llms.txt Anahtar Kelimeler Meta etiketi ile karşılaştırılabilir
Birisi Reddit hakkında llms.txt hakkında bir tartışma başlattı Birinin AI botlarının llms.txt dosyalarını kontrol etmediğini deneyimlediğini sormak için.
Yazdılar:
“Blogumun köküne bu ayın başlarında bir llm.txt dosyası gönderdim, ancak tarama günlüklerim üzerinde henüz herhangi bir etki göremiyorum. Sadece herhangi birinin yerinde bir izleme sistemi olup olmadığını bilmeyi merak ediyorum, ya da sadece uygulamayı takip eden herhangi bir şey aldıysanız.
Henüz uygulamadıysanız, bu konudaki düşüncelerinizi duymayı merak ediyorum. ”
Bu tartışmadaki bir kişi, 20.000'den fazla alana ev sahipliği yaptıklarını ve LLMS.txt dosyalarını indirmediklerini, yalnızca Builtwith'ten bir tane gibi niş botların bu dosyaları yakaladığını paylaştı.
Yorumcu yazdı:
“Şu anda yaklaşık 20 bin alan evine ev sahipliği yapıyor. Hiçbir botun bunları bazı niş kullanıcı aracılarından ayırmadığını doğrulayabilir …”
John Mueller cevapladı:
“AIAIK AI hizmetlerinin hiçbiri llms.txt kullandıklarını söylemedi (ve sunucu günlüklerine baktığınızı kontrol etmediklerini söyleyebilirsiniz). Bana göre, bu anahtar kelimeler meta etiketi ile karşılaştırılabilir-bu, bir sitenin sitelerinin hakkında olduğunu iddia ediyor… (Site gerçekten böyle mi?
Haklı, büyük AI hizmetlerinin hiçbiri, Antropic, Openai ve Google, önerilen LLMS.txt standardı için destek duyurmadı. Peki hiçbiri aslında kullanmıyorsa, ne anlamı var?
Mueller ayrıca bir LLMS.txt dosyasının gereksiz olduğu noktasını da gündeme getiriyor çünkü orijinal içerik (ve yapılandırılmış veriler) zaten indirildiyse neden bu markdown dosyasını kullanıyorsunuz? LLMS.txt kullanan bir bot, spam olmadığından emin olmak için diğer içeriği kontrol etmek zorunda kalacak, neden rahatsız ediyorsunuz?
Son olarak, bir yayıncının veya SEO'nun llms.txt'de bir içerik kümesi göstermesini ve kullanıcılar ve arama motorları için başka bir içerik kümesine göstermesini engellemek için ne var? SPAM bu şekilde üretmek çok kolay, aslında LLM'ler için gizleniyor.
Bu bağlamda, hiçbir arama motorunun kullanmadığı anahtar kelimeler meta etiketine çok benzer, çünkü bir siteye güvenmek için bu anahtar kelimeler ve arama motorlarının bugünlerde ne olduğunu anlamak için içeriği ayrıştırma konusunda daha iyi ve daha sofistike olduğu konusunda çok kabataslak olacaktır.
LinkedIn'de takip yazısı
Reddit Post'u başlatan kişi Simone de Palma (LinkedIn Profili) LLMS.txt dosyalarını tartışmak için LinkedIn'de bir yazı oluşturdu. De Palma, LLMS.txt'in LLMS.txt'in nasıl kötü bir kullanıcı deneyimine yol açabileceğini açıklayan LLMS.txt hakkındaki görüşlerini ve görüşlerini paylaştı.
O yazdı:
“LLMS.txt dosyaları Hashtag#AI hizmetleri tarafından yok sayılır ve web sitesi sahiplerine çok az gerçek fayda sunar veya hiç bir fayda sunmaz.
… Dahası, birisi LLM.TXT dosyalarının orijinal URL'lere geri dönmediği için kötü kullanıcı deneyimlerine yol açabileceğini savunur. Web siteniz tarafından kazanılan herhangi bir alıntı, kullanıcıları uygun web sayfaları yerine inanılmaz bir metin duvarına yönlendirebilir – bu yüzden yine ne anlamı var? ”
Bu tartışmadaki diğerleri kabul etti. Bir katılımcı, dosyaya çok az ziyaret olduğunu paylaştı ve zaman ve dikkatin başka bir yere daha iyi odaklandığını belirtti.
Paylaştı:
“Kabul edin. Yaptığım testlerden, çok az ziyaret ve şimdiye kadar hiçbir avantaj yok (benim fikrim, farklı bir şekilde sömürülürse yararlı olabilir, çünkü bu şekilde çeşitli tarayıcıları karıştırıyorum; testi“ sadece ”testi“ sadece ”düşünmek için diğer verilere sahip olmak için“ sadece ”bıraktım.
Reddit tartışmasını buradan okuyun:
Llm.txt – Neredeyiz?
Shutterstock/Jemastock tarafından Öne Çıkan Resim
Bir yanıt yazın