Salı akşamı Openi, GPT-OS-1220B ve GPT-OS-20B ile iki auriküler model yayınladı. Openi Sam Altman'ın şefi, GPT-2'den Mart'a kadar ilk modellere söz vermişti. Ancak Temmuz ayında yayın, belirsiz bir dönemde güvenlik sorunları tarafından ertelendi. GPT-4 veya O4-mini gibi kapalı modellerin aksine, açık modeller ayrıca üçüncü tarafların altyapıları üzerinde çalışmasına izin veren eğitimli parametreleri de içerir.
Openai'ye göre, merkezi kıyaslamadaki GPT-OS-1220b, Opigais O4-Mini akıl yürütme modelinin performansına ulaşır, ancak 80 GB GPU'da çalışır. Bununla birlikte, GPT-OS-20B, 16 GB'lık bir cihazda güçlü başlangıç becerileri sağlar. Akıl yürütme modelleri, karmaşık mantıksal sonuçlar çıkarmak, sorunları çeşitli seviyelerde çözmek ve düşünce süreçlerini açıkça sunmak için özel olarak eğitilmiştir.
Yeni Geliştirilmiş Güvenlik Protokolü
Açık modeller ayrıca yüksek güvenlik ortamlarında kullanım için ilginçtir, çünkü yerel olarak yönetilebilirler. Bununla birlikte, güvenlik gereksinimleri de modeller için daha yüksektir, çünkü kapalı modellerin aksine onaydan sonra geri çekilemez. Görünüşe göre Openi Sam Altman'ın şefi Temmuz ayında hala endişeleri vardı ve daha fazla güvenlik testine ihtiyaç duyulduğunu açıkladı. Mevcut yayın sırasında şirket, modellerin yeni bir güvenlik standardı ile geliştirildiğini söyledi.
Bu “en kötü beting” protokolü, biyoloji ve bilgisayar güvenliği alanlarında zararlı kullanımı simüle eder, bu nedenle silah veya BT saldırılarının inşası için modeli önlemeyi amaçlamalıdır. Dış uzmanlar metodolojiyi kontrol etmişlerdi ve OpenAAI ayrıca değerlendirme kodu, istemleri ve değerlendirme yönergelerini kamuya açık hale getirir.
“Demokratik değerlerle karakterize”
Yeni modellerin yayınlanmasıyla birlikte, modelleri ihtiyaçları için uyarlamak ve koruma mekanizmalarını uygulamak için geliştirme kılavuzları ve araçları da sağlanmıştır. Apache 2.0 lisansı ile yayınlanırlar ve diğerlerinin yanı sıra Face, VLLM, Ollama ve Lama.cpp'e entegre edilebilir.
Yayın vesilesiyle, Openai Altman şefi, dünyanın “demokratik değerlerle modellenen, ücretsiz ve herkesin büyük bir yararı için Amerika Birleşik Devletleri'nde geliştirilen gelecekte açık bir yapay zeka yığınına dayanabileceğini” söyledi. Açıklama, yayınlanmasından sonra çok popüler olan açık ağırlıklı Çin modellerine bir ima olarak anlaşılabilir, ancak aynı zamanda olay yerinde eleştirmenler olarak adlandırılır. Dolayısıyla, eğitim materyali Çin hükümeti anlamında soruları cevaplamak için koordine edilmiştir. Tian'anmen-Platz'daki tarihsel olaylar IA'yı gizler.
(MKI)
Bir yanıt yazın