New York, NY, 16 Mart 2026 — Kurumsal düzeyde yapay zeka avatar çözümlerinde lider olan D-ID, bugün gerçek zamanlı, LLM bağlantılı konuşmaların yanı sıra komut dosyasıyla yazılmış uzun biçimli kurumsal video içeriği için tasarlanan yeni nesil ultra yüksek kaliteli dijital insanlar olan V4 Expressive Visual Agents'ın piyasaya sürüldüğünü duyurdu.
Yeni bir yayılma tabanlı model üzerine inşa edilen ve gerçek oyunculardan alınan performanslar üzerine eğitilen V4 Expressive Visual Agent'lar, 4K'ya kadar çözünürlükte daha hızlı nesil, düşük gecikme süreli (0,5 saniyenin altında) konuşma dönüşleri ve son derece doğru dudak senkronizasyonu sunarak kurumsal kullanım senaryolarına göre güvenilir bir şekilde ölçeklenen etkileyici, doğal etkileşimlere olanak tanır.
Bugün 1500 kurumsal müşteriye ve milyonlarca aboneye sunulan V4 avatarları, düşük gecikmeli teslimat için özel olarak tasarlanmıştır; bu da onları gerçek zamanlı, konuşma deneyimlerinin yanı sıra eğitim modülleri, açıklayıcılar ve çok dilli eğitim videoları gibi daha uzun biçimli içeriklere uygun hale getirir. Bugüne kadar önceki D-ID modelleri kullanılarak 800.000'den fazla görsel aracı ve 300 milyon etkileşimli olmayan avatar oluşturuldu. Lansman sırasında, V4 Expressive Visual Agent'lar tüm D-ID planlarında kullanıcılara ayda 5,90 dolardan başlayan fiyatlarla sunulacak ve V4 AI modelinin çığır açan maliyet verimliliğini sergileyecek.
Araştırmalar, insan benzeri yüz işaretlerinin bilgi aktarımını, akılda tutmayı ve kavramayı geliştirdiğini gösteriyor. Sonuç olarak işletmeler, özellikle açıklık, güven ve tutarlılığın önemli olduğu yerlerde, işe alım, eğitim, müşteri katılımı ve iç iletişim için yüksek kaliteli avatarları giderek daha fazla benimsiyor.
V4 Etkileyici Görsel Aracılar, seçilen duygularla dinamik olarak uyum sağlayan, ton ve amacın temel mesajla eşleşmesini sağlayan ilk yüksek kaliteli etkileyici avatarlardır. Bu, konuşulan içeriğin doğal ilerleme hızı ve vurguyla net ve güvenli bir şekilde aktarılmasına olanak tanır. Yapay zeka sistemleri için görsel bir arayüz katmanı görevi görecek ve tek yönlü video oynatma yerine gerçek zamanlı, iki yönlü etkileşimlere olanak sağlayacak şekilde tasarlandılar. Yüksek Lisans yanıt verirken avatar, yüz ifadelerini ve konuşmayı bağlama ve duyguya göre otomatik olarak uyarlar, böylece empati empatik görünür, aciliyet acil hissettirir ve güven, güven olarak algılanır. Bu, hem müşteriye yönelik hem de çalışanlara yönelik temsilcileri daha doğal, güvenilir ve etkili hale getirir.
V4 Etkileyici Görsel Aracılar aynı zamanda gerçek zamanlı duygu farkındalığına olanak tanıyan, hem LLM tepkisine hem de ton ve yüz ifadesi de dahil olmak üzere avatarın etkileyici sunumuna sözsüz ipuçları besleyen isteğe bağlı bir kamera katmanı ekler. Ek olarak, V4 Expressive Visual Agent'lar, D-ID'nin MCP Uygulamaları aracılığıyla etkinleştirilen formlar ve testler gibi yapılandırılmış etkileşimlerin yanı sıra resimler, grafikler ve video gibi bağlamsal görselleri paylaşmak için etkileşimli kullanıcı arayüzü öğelerini konuşma sırasında satır içi olarak ortaya çıkarabilir.
Yalnızca saniyeler süren sinematik klipler için optimize edilmiş kısa biçimli video oluşturma araçlarının aksine, V4 Avatarları sürekli, tutarlı çıktı için tasarlanmıştır. Kuruluşlar, istikrarlı bir avatar kimliğiyle dakikalarca veya saatlerce video üretebilir, aynı zamanda gerçek zamanlı konuşmaları geniş ölçekte, fiyatın çok altında bir maliyetle (Google VEO 3 Fast'den 70 kat daha ucuz) yürütebilir; bu da kurslar, açıklayıcılar, çok dilli eğitimler ve tekrarlanabilir içerik serileri için çok daha uygun maliyetli olmasını sağlar. Bu tasarruflar, gerçek zamanlı etkileşimler söz konusu olduğunda birleşerek D-ID kullanıldığında sohbet başına birkaç kuruşa mal oluyor.
“Durağan görüntüleri konuşan portrelere dönüştürerek dünyayı sevindiren ilk modellerimizden bu yana uzun bir yol kat ettik.” dedi D-ID Kurucu Ortağı ve CEO'su Gil Perry. “Bugün V4 ile, avatar sadakati ve performansı için yeni bir ölçüt belirliyor, aynı zamanda onu gerçek zamanlı konuşmalar için yeterince hızlı ve kurumsal ölçek için yeterince tutarlı, verimli ve güvenli tutuyoruz. Avatar teknolojisindeki bu ilerleme, işletmelerin etkileşimleri daha doğal ve insani hale getirme arayışında olduğu bir sonraki yapay zeka benimseme dalgası için görsel arayüz katmanını sağlamada D-ID'yi öncü olarak konumlandırıyor.”
Eylül 2025'te simpleshow'un satın alınmasının ardından D-ID, kurumsal dağıtım alanını genişletti ve AI avatar yeteneklerini simpleshow'un kurumsal eğitim ve açıklayıcı video ekosistemine entegre etti. O zamandan bu yana, D-ID'nin ARR'si %250 oranında büyüdü; bu, çapraz satış genişlemesini ve etkileşimli yapay zeka destekli videoya yönelik kurumsal talebin arttığını yansıtıyor.
D-ID Hakkında
D-ID, video ve dijital insanlar için üretken yapay zeka alanında dünya lideridir ve Gerçek Zamanlı Akış API'si aracılığıyla sorunsuz, gerçek zamanlı etkileşime olanak tanır. Teknolojisi, Fortune 500 şirketleri ve misyon odaklı kuruluşlar için gerçekçi dijital sunum yapan kişilere, öğrenim arkadaşlarına ve sanal asistanlara güç veriyor. Eylül 2025'te D-ID, yapay zeka tabanlı açıklayıcı video oluşturmada küresel öncü olan simpleshow'u satın aldı. Merkezi Berlin'de bulunan simpleshow, 70'ten fazla ülkedeki kuruluşların akıllı, ölçeklenebilir ve insan odaklı video iletişimi yoluyla karmaşık mesajları basitleştirmesine yardımcı oluyor.

Bir yanıt yazın