Sydney -İnsanlar en iyi uluslararası matematik yarışmasında Google ve Openai tarafından yapılan üretken AI modellerini yendi, ancak programlar ilk kez altın seviyesi puanlarına ulaştı ve iyileşme oranı bazı insan içgözlemine neden olabilir.
Yapay zeka modellerinin hiçbiri tam puan almadı – katılımcıların 20 yaşın altında olması gereken prestijli bir yıllık rekabet olan Uluslararası Matematiksel Olimpiyat (IMO) 'da beş gencin aksine.
Google Pazartesi günü yaptığı açıklamada, Gemini Chatbot'un gelişmiş bir versiyonunun, bu ay Avustralya'nın Queensland'da düzenlenen IMO'da belirlenen altı matematik probleminden beşini çözdüğünü söyledi.
ABD teknoloji devi Gregor Dolinar'ın, “Google DeepMind'in çok istenen kilometre taşına ulaştığını doğrulayabiliriz, olası 42 puandan 35 kazandı – altın madalya skoru” dedi. “Çözümleri birçok açıdan şaşırtıcıydı. IMO sınıf öğrencileri onları açık, hassas ve çoğunun takip edilmesi kolay buldular.”
İnsan yarışmacılarının yaklaşık% 10'u altın seviyesi madalya kazandı ve beşi 42 puan kazandı.
ABD Chatgpt üreticisi Openai, deneysel akıl yürütme modelinin de testte altın seviyesi 35 puan aldığını söyledi.
Openai araştırmacısı Alexander Wei, bir sosyal medya yazısında, “dünyanın en prestijli matematik yarışmasında” sonucu “AI'da uzun süredir devam eden büyük bir meydan okuma elde etti” dedi.
“Modellerimizi 2025 IMO sorunları hakkındaki insan yarışmacılarla aynı kurallar altında değerlendirdik” dedi. “Her sorun için, üç eski IMO madalyası bağımsız olarak modelin gönderilen kanıtını derecelendirdi.”
Google, Güneybatı İngiltere'deki Bath şehrinde geçen yıl IMO'da gümüş madalya skoru elde etti ve altı sorundan dördünü çözdü.
Bu, iki ila üç günlük hesaplama aldı-İkizler modelinin 4,5 saatlik zaman sınırındaki sorunları çözdüğü bu yıldan çok daha uzun.
IMO, teknoloji şirketlerinin 112 ülkeden 641 rakip öğrencinin karşılaştığı aynı olanların “bu yılki problemlerde kapalı kaynaklı AI modellerini özel olarak test ettiğini” söyledi.
IMO Başkanı Dolinar, “AI modellerinin matematiksel yeteneklerinde ilerlemeyi görmek çok heyecan verici” dedi.
Yarışma organizatörleri AI modelleri tarafından ne kadar bilgi işlem gücünün kullanıldığını veya insan katılımı olup olmadığını doğrulayamadı.
Bir CBS'nin 60 Dakika ile Röportaj Bu yılın başlarında, Google'ın önde gelen AI araştırmacılarından biri, sadece beş ila 10 yıl içinde, “yapay genel zeka” olarak bilinen bir dönüm noktası olan insan düzeyinde bilişsel yeteneklere sahip bilgisayarların yapılacağını tahmin etti.
Google DeepMind CEO Demis Hassabis tahmin edildi AI teknolojisinin dünyayı nüanslı şekillerde anlamak ve sadece önemli sorunları çözmekle kalmayıp, aynı zamanda yatırımdaki bir artış sayesinde on yıl içinde bir hayal gücü duygusu geliştirmek için yolda idi.
“İnanılmaz derecede hızlı hareket ediyor,” dedi Hassabis. “Bence bir tür üstel iyileştirme eğrisindeyiz. Tabii ki, son birkaç yıldaki alanın başarısı daha fazla dikkat, daha fazla kaynak, daha fazla yetenek çekti. Bu da bu üstel ilerlemeye ekliyor.”
Bir yanıt yazın