Cevaplarında en çok hangi yapay zeka yatıyor?

Her şeyi bilme endeksine göre en güvenilir 10 model:

– Gemini 3.1 Pro Önizleme — 33

– Claude Opus 4.6 (maks.) — 14

– Grok 4.20 Beta 0309 — 13

– Claude Sonnet 4.6 (maks) — 12

– İkizler 3 Flaş — 12

– GPT-5.3 (Kodeks yüksek) — 10

– GPT-5.4 (xyüksek) — 6

– GLM-5 — 2

– GPT-5.2 (xyüksek) — -1

– Claude 4.6 Haiku — -4

Her zaman yanıtları olmasa bile daha fazla soruya yanıt veren sohbet robotları

Değerlendirilen metriklerden bir diğeri de sistemlerin farklı talep türlerine yanıt verme konusunda ne kadar istekli olduğunu analiz eden Açıklık Endeksi'dir.

En büyük açılışa sahip ilk 10 model

– K2 Düşünme V2 — 89

– NVIDIA Nemotron 3 Süper — 83

– NVIDIA Nemotron 3 Nano — 83

– GLM-5 — 50

– gpt-oss-20B (yüksek) — 39

– gpt-oss-120B (yüksek) — 39

– Mistral Büyük 3 — 39

-Qwen3.5 397B A17B—39

-Kimi K2.5 — 33

– Alev 4 Maverick — 28

Yanıtlarında en çok hata yapan chatbot

Yapay Analiz değerlendirmeleri, bazı modellerin her şeyi bilme endeksinde olumsuz puan aldığını, yani doğru yanıtlardan daha fazla yanlış yanıt kaydettiğini gösteriyor.

En kötü sonuçlara sahip sistemler arasında gpt-oss-20B, K-EXAONE ve Mi:dm K2.5 Pro yer alıyor ve puanları değerlendirmede en düşükler arasında yer alıyor.

En güvenilir chatbot

AA-Her Şeyi Bilme Endeksi'nden elde edilen sonuçlar aynı zamanda hangi modelin yanıtlarında en yüksek düzeyde güvenilirlik gösterdiğini belirlememize de olanak tanır.

Yapılan ölçüme göre Gemini 3.1 Pro Preview, değerlendirilen diğer sistemlere göre daha fazla hassasiyeti yansıtan bir rakam olan 33 puanla sıralamada en yüksek puanı aldı.


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir