Google, en güçlü AI modeli olan Gemini 2.0'ı herkese açar

Jaque Silva | SOPA görüntüleri | Lightocket | Getty Images

Google Çarşamba günü Gemini 2.0'ı – “en yetenekli” yapay zeka modeli paketi – herkese yayınladı.

Aralık ayında, şirket geliştiricilere ve güvenilir test uzmanlarına erişim sağladı ve bazı özellikleri Google ürünlerine sardı, ancak Google'a göre bu bir “genel sürüm”.

Model paketi, bir “işgücü modeli, yüksek hacimli, ölçekte yüksek frekanslı görevler için optimal” ve kodlama performansı için 2.0 Pro deneysel olarak faturalandırılan 2.0 Flash ve şirketin şirketin “En uygun maliyetli modeli” olarak adlandırıyor.

Gemini Flash, geliştiricilere metin, görüntü ve video girişleri için milyon başına 10 sent maliyeti, Flash-lite, daha uygun maliyetli sürümü, aynı için bir kuruş 0,75'e mal oluyor.

Devam eden sürümler, AI silah yarışı teknoloji devleri ve girişimler arasında ısındığından Google için daha geniş bir stratejinin bir parçasıdır.

MetaAmazon, MicrosoftOpenai ve Antropic de ajan AI'ya doğru ilerliyorlar veya her bir adımda yürümek zorunda bir kullanıcı yerine, bir kullanıcı adına karmaşık çok aşamalı görevleri tamamlayabilen modeller.

AI hakkında CNBC raporlamasını daha fazla oku

“Geçen yıl boyunca, daha fazla ajan model geliştirmeye yatırım yapıyoruz, yani çevrenizdeki dünya hakkında daha fazla bilgi edebilecekler, önünüzde birden fazla adım düşünebiliyorlar ve sizin adınıza harekete geçebilecekler,” diye yazdı Google bir Aralık blogunda yazdı. Gemini 2.0'ın “yerel görüntü ve ses çıkışı gibi – ve yerel araç kullanımı gibi multimodalitede yeni ilerlemelere” sahip olduğunu ve model ailesinin bizi bir vizyonumuza yaklaştıran yeni AI ajanları oluşturmamızı sağlayacağını da sözlerine ekledi. evrensel asistan. “

Ex-Openai araştırma yöneticileri tarafından kurulan Amazon destekli AI girişimi olan Antropic, AI ajanları geliştirme yarışında kilit bir rakiptir. Ekim ayında Antropic, AI ajanlarının karmaşık görevleri tamamlamak için insanlar gibi bilgisayarları kullanabildiğini söyledi. Antropic'in bilgisayar kullanım özelliği, teknolojisinin bilgisayar ekranında olanları yorumlamasına, düğmeleri seçmesine, metin girmesine, web sitelerinde gezinmesine ve herhangi bir yazılım ve gerçek zamanlı internet taraması aracılığıyla görevleri yürütmesine izin verdiğini söyledi.

Antropik'in baş bilim memuru Jared Kaplan, o zamanlar bir röportajda CNBC'ye verdiği demeçte, araç “temelde yaptığımız gibi kullanabilir” dedi. “Tens hatta yüzlerce adım” ile görevler yapabileceğini söyledi.

Openai, planlama tatilleri, formları doldurma, restoran rezervasyonu yapma ve yiyecek siparişi gibi görevleri otomatikleştirecek yakın zamanda operatör olarak adlandırılan benzer bir özellik yayınladı. Microsoft destekli başlangıç, operatörü “sizin için görevleri yerine getirmek için Web'e gidebilen bir ajan” olarak nitelendirdi.

Bu haftanın başlarında Openai, bir AI ajanının karmaşık araştırma raporlarını derlemesine ve kullanıcının seçimine ilişkin soruları ve konuları analiz etmesine izin veren Deep Research'i tanıttı. Aralık ayında Google, aynı adı taşıyan benzer bir araç başlattı – Deep Research – “Araştırma asistanı, karmaşık konuları keşfetme ve sizin adınıza raporları derleme” olarak görev yaptı.

CNBC ilk olarak Aralık ayında Google'ın 2025'in başlarında birkaç AI özelliği sunacağını bildirdi.

CEO Sundar Pichai, o sırada bir strateji toplantısında, “Tarihte her zaman önce olmanıza gerek yok ama iyi yürütmeniz ve gerçekten bir ürün olarak sınıfın en iyisi olmanız gerekiyor.” Dedi. “Bence 2025'in hepsi bu.”

Google, en güçlü AI modeli olan Gemini 2.0'ı herkese açar

AI hakkında CNBC raporlamasını daha fazla oku

CNBC Pro'dan bu bilgileri kaçırmayın

Yorumlar

Bir yanıt yazın Yanıtı iptal et