Bir dizi popüler uygulama geliştirme araçlarının arkasındaki şirket olan JetBrains, kodlama için ilk “açık” AI modelini yayınladı.
Çarşamba günü, Jetbrains, geçen yıl çeşitli yazılım geliştirme süitleri için yayınlanan ve AI Dev Platform Hugging Fact'ta açıkça bulunan şirketin kod üreten bir model olan Mellum'u yaptı. 4 trilyondan fazla jeton üzerinde eğitilmiş olan Mellum, 4 milyar parametre ağırlığında ve özellikle kod tamamlama için tasarlanmıştır (yani çevre bağlama göre kod parçacıklarını tamamlama).
Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelirken, jetonlar bir modelin işlediği ham verilerdir. Bir milyon jeton kabaca 30.000 satır koda karşılık gelir.
JetBrains, teknik raporda “Profesyonel geliştirici takımlarına entegrasyon (örn. Entegre geliştirici ortamlarındaki akıllı kod önerileri), AI ile çalışan kodlama asistanları ve kod anlayışı ve üretim araştırmaları için araştırmalar, eğitim uygulamaları ve ince ayar deneyleri için de çok uygun” diye açıklıyor.
Jetbrains, GitHub ve İngilizce Wikipedia makalelerinden izin verilen lisanslı kod da dahil olmak üzere bir veri kümesi koleksiyonunda Apache 2.0 lisanslı olan Mellum'u eğittiğini söylüyor. Eğitim 256 H200 NVIDIA GPU'luk bir kümede yaklaşık 20 gün sürdü.
Mellum ayağa kalkmak için biraz iş gerektirir. Temel model kutunun dışında kullanılamaz; Önce ince ayarlanmalı. Jetbrians, Python için ince ayarlanmış birkaç Mellum modeli sağlasa da, şirket bir üretim ortamına yerleştirilmemek için “potansiyel yetenekler hakkında tahmin” için tasarlandı.
AI tarafından oluşturulan kod şüphesiz yazılımın oluşturulma şeklini değiştirir, ancak aynı zamanda yeni güvenlik zorlukları da sunar. Geliştirici Güvenlik Platformu Synk tarafından 2023'ün sonlarında yapılan bir ankete göre, kuruluşların% 50'sinden fazlası bazen veya sık sık AI üretilen kodlarla karşılaşıyor.
Tmzilla Etkinliği
Berkeley, CA
|
5 Haziran
Şimdi kitap
Gerçekten de, Jetbrains, Mellum'un “kamu kod tabanlarında bulunan önyargıları yansıtabileceğini” (örneğin, açık kaynak depolarına benzer şekilde benzer kod oluşturma) ve kod önerilerinin “güvenli veya güvenlik açıkları yok” olmayacağını not eder.
“Bu sadece başlangıç,” diye yazdı Jetbrains bir blog yazısında. “Genelliği kovalamıyoruz – odak noktası oluşturuyoruz. Mellum anlamlı bir deney, katkı veya işbirliği bile kıvılcım olursa, bunu bir kazanç olarak göreceğiz.”
Bir yanıt yazın