Yakın zamana kadar, “Görmek” İle ilgili Chatgpt İtalya'da, kullanıcıların arşivlerinden yükleyebilecekleri veya doğrudan akıllı telefon kamerasıyla alabilecekleri statik görüntülerle sınırlıydı.
Bu durumlarda, IA gösterilenler hakkında bilgi, açıklamalar veya bilgiler sağlayabildi.
Ancak şimdi OpenII, İtalya'da daha gelişmiş bir işlevi sağladı: Canlı vizyonbu da chatgpt'in analiz etmesine ve yorum yapmasına izin verir Gerçek zamanlı bir görüntü akışı.
Görüntüleri gerçek zamanlı olarak chatgpt'e nasıl iletir
Bu modu etkinleştirmek için, özellikle kullanıldığında etkili olan Resmi Chatgpt uygulamasıMetin çubuğunun yanındaki ses dalgası simgesini seçin: böyleceGelişmiş ses moduBu, son derece azaltılmış yanıt süreleri ve konuyu değiştirmek için herhangi bir zamanda IA'yı kesintiye uğratma olasılığı ile öğeyi kullanarak yapay zeka ile sohbet etmenizi sağlar.
Büyük haber, sol altta seçme olasılığında yatıyor, Kamera simgesi: Bu şekilde, akıllı telefon kamerasından alınan her şey yapay zekadan da görülebilir.
Bu modda, hem akıllı telefonun arkasındaki kamerayı kullanabileceğini, bizi çevreleyenleri devam ettirmek için hem de önün altını çizmek önemlidir. Genellikle selfie'ler için kullanılırYapay zeka ile yüz yüze – bir anlamda.
Aslında, düne kadar “kör” şimdi Gerçek dünyayı gör.
Bu işlev konuşmaları daha da ilgi çekici hale getirir.
Kullanıcı bir nesneyi çerçeveleyebilir, bilgi isteyebilir ve bir bina, elektronik cihaz veya bir yer olsun – hızlı bir şekilde başka bir öğeye geçebilir. neyin gözlemlendiğine dair anında açıklamalar.
Bir test sırasında, etiketleri bir chatgpt bilgisayar üzerindeki çerçeveleyerek, yüklü işlemci hakkında ayrıntılar sağladı.
Öte yandan, bir trenin dışındaki kameraya hitap etmek, üzerinde bulunduğumuz Frecciarossa trenini tanıdı ve hava koşulları hakkında yorum yaptı ve onları bulutlu olarak tanımladı.
Yapay zekanın görsel anlayışta sınırları
Potansiyeline rağmen, IA hala bazı zorluklar göstermektedir.
Video beslemesi olmadan sanal ses genellikle hassas ve akıcı ise, aktif video kamera ile cevaplarda daha az güvenli hale gelir ve bunları işlemek için daha fazla zaman alır.
Ayrıca Gerçek dünyanın anlaşılması bir meydan okuma olmaya devam ediyor: Hareketli bir treni ters yönde çerçeveleyerek, Chatgpt yanlışlıkla konvoyu tanımak yerine pencerede bir yansıma olduğunu belirtti.
Openai Operatörü: Ajanların Geleceği IA
Yapay vizyon, bir bilgisayarda gerçekleştirilebilenlerden başlayarak, insanlar yerine operasyonlar gerçekleştirebilecek geleceğin ajanları için temel olacaktır.
Openii yakın zamanda duyuruldu OperatörWeb'de bağımsız olarak faaliyetleri gerçekleştirebilen bir ajan.
Operatör, Openai tarafından yayınlanan en gelişmiş modellerden biri olan GPT-4O'nun gelişmiş vizyonunu, sofistike bir akıl yürütme sistemi ile birleştirerek, Ekran görüntüsünü yorumlayın, web sayfalarıyla etkileşim kurun ve içerik yazma, tıklama veya kaydırma gibi eylemler gerçekleştirin.
Microsoft Copilot: Gerçek zamanlı olarak gören ve açıklayan IA
Ayrıca Microsoft, şimdiye kadar yatırım yaptığı Openai teknolojisinden yararlanıyor 13 milyar dolarCopilot Chatbot'u ses ve görsel işlevsellikle zenginleştirdi.
Moda Kopilot GörüşüHenüz İtalya'da mevcut değil, AI'nın kullanıcının ekranında görünür içeriği yorumlamasına ve gerçek zamanlı olarak bağlamsal açıklamalar sunmasına izin verir.
Kısacası, bu işlev, CHATGPT için Openai tarafından İtalya'da tanıtılan işleve benzer.
Web taraması sırasında, Copilot ziyaret edilen sayfaları analiz edebilir ve doğal bir dille özet veya içgörü sağlayabilir, bu da deneyimi daha akıcı ve etkileşimli hale getirebilir.
Google Astra: Mountain View Dev'in Multidale IA
Google ayrıca kendi aracısı üzerinde çalışıyor IA “görme” ve “dinleme” yeteneğine sahip: buna denir Astra Ve gerçek zamanlı olarak çekilen görüntülerle ilgili soruları cevaplama yeteneğine sahiptir.
Astra, akıllı telefonlar veya akıllı gözlükler gibi cihazlarda çalışabilir.
Proje ayrıca Google'ın akıllı gözlük sektörüne dönüşü, Google Cam Birkaç yıl önce ve giderek daha akıcı ve doğal bir multimodal etkileşim sunmayı amaçlamaktadır.
Bir yanıt yazın