Yapabilirler mi? Ya da değil? AI şirketleri, modellerinin gökyüzünün altındaki neredeyse her şeyde iyi ve şaşırtıcı arasında değiştiğini iddia ediyor (ve çok coşkuyla). Programlama görevleri, kodlama ve hata ayıklama, bu güvenin nedenlerinden biridir. Bu iddiaya zarar veren AI modellerinin çamaşır listesi var. Openai'nin GPT-4 ve GPT-4O, Antropic'in Claude kodu (bu Canva'nın yeni kod özelliğinin altını çiziyor; biraz daha fazla konuşacağız), Google İkizler (ve potansiyel olarak alfacode) ve Microsoft'un kendi Copilotu genel amaçlı AI modellerinden bazılarıdır; Ve geliştirici odaklı AI araçları arasında, elbette Amazon'un Codewhisperer'ının yanı sıra Openai'nin modelleri üzerine inşa edilen GitHub Copilot için bir durum var. 2023'te GitHub CEO'su Thomas Dohmke, “daha sonra, kodun% 80'i Copilot tarafından yazılacak. Ve bu geliştiricinin değiştirileceği anlamına gelmiyor.” Bu hikayede dizginsiz iyimserlikten daha fazlası var.
Microsoft Research tarafından yapılan yeni bir çalışma (bu ilginizi çekiyorsa, daha fazla bilgi edinebilirsiniz) birçok AI modelinin hala görevlendirildikleri yazılımla ilgili birçok sorunu doğru bir şekilde hata ayıklamadığını öne sürüyor-bu gerçek SWE-Bench Lite, Mini-Nightmare ve Destek adı verilen yazılım geliştirme ölçütleri ile aydınlatıldı. Openai (GPT-4O, GPT-4O Mini, O1 önizleme ve O3-mini), Claude (3.7 sonnet), meta lama (Llama-3.2-3b-Intruct ve Llama-3.3-70b-int-interpl ve derinseek (derinseek (Deepseek (Deepseek) Deepseek-R1-Distill-Qwen-32B).
Sonuçlar endişe verici. SWE-Bench tarafından ortaya çıkan hata ayıklama ölçütünde hiçbir AI modeli, başarı oranı açısından% 50'den fazla puan almamıştır. Antropik Claude 3.7 sonnet, grafikleri%48.4 skorla yönetti, bunu O1 (%30.2) ve O3-mini (%22.1) izledi. Eğer yine de yürümeye devam ederse, bu karanlık tünelin sonunda potansiyel olarak ışık var. Araştırmacılar, “Bunun, mevcut LLM eğitim cesedinde sıralı karar verme davranışını (örneğin, hata ayıklama izleri) temsil eden verilerin kıtlığından kaynaklandığına inanıyoruz” diyor. Veri zayıf bağlantı ise, eğitim için daha fazla veri almak sorun olmamalıdır. Uzun zaman önce verilerin yeni yağ olduğu söylendi. Ve AI şirketlerinin çok fazla var.
Yeniden düzenleme?
İpados 19'un (bu yaz WWDC Konferansı'nda göreceğimiz ilk bakışlarının) macOS'un işleyişine ve davranışlarına hiç olmadığı kadar yakın olacağını duyuyoruz. Bu belki de iPad kullanıcıları için en iyi haber – en azından bir klavye kullanan ve iPados'taki macOS'un üretkenliği, çoklu görev ve uygulama penceresi yönetimini çoğaltmak için gerçek denemeler yapan (itiraf edeceğim, o demografide). Bu rüya gerçek olabilir; Şimdilik parmaklarımızı çapraz tutalım.
Apple iPad ve iPados Evolution'ı kapsamımız…
HIZ
Yapay zeka gelişiminin hızı göz kırpma ve özlem aşamasındadır. Openai, geçen yıldan itibaren GPT-4O multimodal AI modelinin AA halefi olan GPT-4.1'i tanıttı. Tabii ki, iddialar her açıdan daha iyi, kodlama için iddia edilen belirli iyileştirmeler (kıyaslama testleri bunu GPT-4O'dan% 21,4 daha iyi) ve takip eden talimatlar (GPT-4O'ya göre iddia edilen% 10,5 artış). GPT-4.1 mini ve GPT-4.1 nano ile birlikte GPT-4.1 vardır. Openai, bu modellerin daha geniş bağlam pencerelerine sahip olduğunu doğrular – 1 milyona kadar bağlamı destekler. Bu, Google'ın Gemini 2.5 Pro 'Düşünme Modeli'ni yayınladıktan birkaç hafta sonra, ayrıntılı olarak analiz ettiğimiz bir şey
Kararlılık
Büyük teknoloji şirketleri, ticaret savaşıyla bir sonraki adımda ne olacağını anlamaya çalışan, belirli bir uyum veya adım dizisi olmayan hassas bir dans. Hindistan perspektifinden, bu anın fırsatı ve önemi, göstermeye çalıştığım bir şey. Hindistan büyük ölçüde sadece büyük tüketici tabanından değil, aynı zamanda küresel tedarik zincirlerine iyi ve gerçekten takılmış olan mevcut elektronik üretim altyapısından da yararlanmalıdır. Saatin ihtiyacı, turtanın büyük bir payını köşeye sıkıştırmasıdır; ve bu uzun vadeli ortaklarla ve büyük sayılarla.
Performansa bağlı teşvik (PLI) şeması Mart ayında duyuruldu, şimdi bir zaman faktörü olarak daha da önem kazanıyor (hiç kimse Donald Trump'ın tarife belirsizliklerinin bu kadar uzun sürmesini beklemiyor). İşte geçen şey.
- Hindistan Hükümeti, 2025-26 yıllarında Performansa Bağlı Teşvik (PLI) programı kapsamında kilit sektörler için bütçe tahsislerinin önemli ölçüde arttığını açıkladı.
- Bu, şimdi bir tahsis artışı olan elektronik ve BT donanımı içerir. La5.777 crore (bu 2024-25 için zaten gözden geçirilmiş bir tahmindi) La9.000 crore ve otomobil ve otomatik bileşenler artış için tahsis ediliyor La346.87 crore La2.818.85 crore.
Aşağıda, Hindistan'ın hızlı bir şekilde inşa edilmesi gereken bakış açısının bazı örnekleri verilmiştir.
- Apple, Foxconn, Pegatron ve Tata Electronics gibi tedarikçiler aracılığıyla Hindistan'daki üretim sayılarını artırmak için ayrıntılı planlara sahip; Bunun için bir barometre, Hindistan'dan gelen ihracatın 2025'te 15 milyar doları geçmesi bekleniyor.
- Micron Technology, montaj, test ve ambalaj (ATMP) tesisi için Gujarat'a yapılan yatırımları sıraladı.
- Tata Electronics'in Hindistan'ın Gujarat'ın Dholera'sındaki ilk büyük yarı iletken fab için 28. ve üstü çipler için 152.000 $ (18 milyar $) taahhüdü.
EVRİM
Bu hafta, yıllık Canva Create Keynote, bize hala bir-on-the-on-the Creative Suite'in yeni yükseltmeler olarak mağazada neler olduğu hakkında bir görüş verdi. Canva'nın geçen yılki yaratımda büyük ileriye dönük hareketler yaptığını düşünerek bu konuda keskin bir göz vardı. Canva'nın rekabeti, sık sık işaret ettiğim gibi bir rakip değil; Rekabet manzaraları sadece Adobe, Google ve Microsoft gibi yaratıcı ve çalışma alanı araçlarını içermiyor; Ancak, haklı olarak yaratan artan sayıda üretken yapay zeka aracı, yaratıcı yeteneklerin kendilerini iddia ediyor. Openai'nin chatgpt'in Ghibli tarzı zekaları, görüntü oluşturma örneğidir, Google'ın Gemini 2.5 bahisleri en yetkin kodlama modeli olarak iddia ediyor. Tüm bunlar arasında yeni (ve çok şey var), birkaçı alaka düzeyi açısından göze çarpacak.
Elbette yeni olan her şeyin altını çizen Canva Ai var. Canva'nın kurucu ortağı ve baş işletme görevlisi olan Cliff Obrecht, giderek daha güçlü açık kaynaklı modellerin kendi omni modellerini oluşturmaya yardımcı olduğunu söylüyor (bunlar, bir istemde metin, görüntüler, ses ve video arasındaki ilişkileri anlıyorlar) ve Leonardo.a'nın güçlü bir imaj genel modelinin ameliyatına yardımcı olan akıllı alımları anlıyor. Canva kodu söz konusu olduğunda, bu antropik ile ortaktır.
Antropic'in Claude 3.5 sonnet ve diğer Claude modelleri, kodlama görevleri için en rafine AI modelleri arasında yer alıyor-Google Gemini 1.5 Pro, yeni Gemini 2.5 ve Openai'nin GPT-4O ile rekabet ediyorlar. Bu modellerin (diğerlerinin yanı sıra) bir seçim sağlayan imleç, aider, rüzgar sörfü gibi AI araçları vardır. Adından da anlaşılacağı gibi, Canva Kodu, kullanıcıların bir uygulama oluşturma konusunda ellerini denemelerini daha basit ve görsel olarak daha sezgisel hale getirmeye çalışıyor ve ne yapmasını istediklerini açıklıyor.
Obrecht ve ben, herhangi bir tarihte dünya çapında çalınan tüm kriket maçlarının kapsamlı bir listesini derleyen deneysel bir uygulama oluşturduk, skorlar ve her biri Hindistan bölgesi için yayınlanacakları akış platformunun veya TV kanallarının ayrıntıları. İstemimizi işlemek için yaklaşık bir buçuk dakika süren sonuçlar canlı ayrıntılı ve etkileyiciydi.
DURUŞMA
Meta'ya karşı dönüm noktası antitröst davasındaki işlemler, Meta'nın (daha önce Facebook) rekabete zarar verdiği ve yıllar önce anlık mesajlaşma uygulaması ve sosyal medya platformu Instagram'ı satın aldıklarında tekel gibi davrandığı iddialarına dayanan bir dava başladı. Federal Ticaret Komisyonu (FTC) avukatı Daniel Matheson'un söylediği gibi, “Rekabetin zor olduğuna ve rakiplerini satın almanın onlarla rekabet etmekten daha kolay olacağına karar verdiler.” Meta, elbette, bu düşünce çizgisine katılmıyor. Meta, bu uygulamaların Facebook ile birlikte büyümesini istedikleri bir noktaya sahip olabilir – sonuçta, şirket kendi hizmetlerinin birbirlerini yamyamlaştırmasına izin vermez (belki de haberci hariç, WhatsApp ve Instagram Direct mesajları lehine). Meta, WhatsApp veya Instagram'ı (ya da her ikisi için daha kötü durum) döndürmek zorunda kalabilir mi? Bunun kolay bir cevabı olmayacak. Veya hızlı bir.

Bir yanıt yazın