Yapılandırılmış bilgi için dünyanın en büyük veritabanı Wikidata, MCP erişimi sunuyor

Dolandırıcı Bildirim

Bu makale bu nedenle İngilizce olarak mevcuttur. Yayınlamadan önce teknik yardım ve editoryal revizyon ile çevrildi.

Wikimedia Almanya'nın yapılandırılmış bilgi veritabanı Wikidata, gelecekte LLM için serbestçe erişilebilir bir arayüz sunacak. Proje, verilerini vektörleştirdi ve geliştiricilerin artan kurtarma üretimi (RAG) ve model bağlam protokolü (MPC) aracılığıyla LLMS'ye bağlanabilecekleri bir vektör veritabanında sağladı.

Operatöre göre, Wikidata, yaklaşık 119 milyon ses içeren ve dünya çapında yaklaşık 24.000 gönüllüyü koruyan dünyanın en büyük açık grafik tasarımcısıdır. Veritabanı, Wikipedia, Wikivoyage veya Wikisource gibi Wikimedia Projects grafikleri gibi yapılandırılmış veriler içerir.

Bu verilere açık erişim, yapılandırılmış, güncel ve test edilmiş bilgiye RAG aracılığıyla erişerek LLM'nin kalitesini artırmayı amaçlamaktadır. Bu yanlış yanıtları ve halüsinasyonları azaltabilir. Wikimedia, vandalizmle mücadele etmek için kontrolleri veya araçları olası uygulamalar olarak görür.

Wikidata-api ekran görüntüsü

Wikidata, kuruluş veritabanında araştırma için bir API sunar.

Operatörler, doğru veri kayıtlarını tanımlamak ve daha sonra grafik veritabanını yapılandırılmış bir şekilde (grafik) kullanmanızı önerir. Vektör araştırmalarına ek olarak, terimlerin kesin tanımlanması için anahtar kelimelerin bir arama işlevi ve tanımlayıcı sorgu vardır. Sistem, soruyu daha rahat ve başarılı hale getirmesi gereken bu yaklaşımları birleştirir.

Buna ek olarak, Wikidata bir kaynak olarak tanımlanabilir, böylece kullanıcılar arama sonuçlarının nereden geldiğini anlayabilir. Taşıyıcı veritabanı şu anda İngilizce, Fransızca ve Arapça araştırmalarını destekliyor. Operatör, İspanyol ve Mandarin'i yıl sonuna kadar genişletmek istiyor. Daha fazla dil izlemelidir.

Birleşme projesi Eylül 2024'ten bu yana iki ortakla oluşturuldu: Jina AI, Wikidata verilerini Astra DB vektör veritabanına inen vektörlere dönüştürüyor. Uygulamanın uygulama kodu açık ortak uzun süredir.

Wikimedia ayrıca sosyal bir yönü de çiziyor: Yeni teknoloji, LLM'yi daha şeffaf, daha güvenilir ve adil hale getirmek için dünyanın dört bir yanındaki geliştiricilere sunmayı amaçlıyor ve bu nedenle büyük teknolojik şirketlerin teklifleri için bir karşı ağırlık yaratıyor. Büyük bir uluslararası gönüllü topluluğunun çalışmaları sayesinde Wikidata, temsili olan konuları ve beklentileri de haritalayabilir ve bu nedenle AI'nın üretken gelişimi için daha çeşitlendirilmiş bir veritabanı oluşturabilir.

İlgilenen taraflar, 9 Ekim'de ücretsiz web seminerinde pratik öneriler ve uygulama örnekleri öğrenme fırsatına sahiptir.

Ayrıca oku


(DSÖ)


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir