Nokta ve virgül olmadan yazmak, en azından kurnaz (LLM) 'de büyük bir dil modelinin üstesinden gelmek istiyorsanız yardımcı olabilir. Dilbilgisi ve hatalar ile çok uzun cümleler ve modellerin korkuluklarını denize atmasını ve uzun istekte olanı yapmasını sağlamak için mümkün olan en ciddi olanlar. Bu, Palo Alto Networks'ün 42. Ünitesinin güvenlik araştırmacısında bulundu.
Noktalama notlarının eksikliği nedeniyle, güvenlik önlemlerini zamanında etkinleştirmiyor gibi görünüyor, bunun yerine tüm istemi oku ve bir bütün olarak değişiyor gibi görünüyor.
Güvenlik araştırmacıları bir çözüm geliştirdi. Bunu yapmak için, bir LLM'nin potansiyel olarak gelen bir kelimeye atadığı logitles veya ham değerleri kullanın. Hizalama eğitimini kullanarak logit, atık jetonlarını tercih etmeyi öğrenmelidir. Bu, korkulukları etkinleştirmek için bir şey yapılırsa, bunun esas olarak mümkün olduğu anlamına gelir. Ünite 42, çerçeve-logit boşluk duruşunu geliştirmiştir.
Hapishane enjeksiyonlarına duyarlı tarayıcı
AI modelleri SO -adlı hızlı enjeksiyonlara duyarlıdır. Kastedilen, derhal inşa edilen yönergelerin gündeme getirilmesidir. Örneğin bir LLM, bundan sonra bir korsan olarak davranması gerektiği söylenebilir. Şimdiye kadar çok zararsız. Şüphesiz, elbette, aynı zamanda bu şekilde veri yakalamakla ilgilidir.
Cesur tarayıcı üreticisi yakın zamanda, derhal kullanılabilecek tarayıcı AI kuyruklu yıldızında bir güvenlik boşluğu keşfetti. Saldırganlar, bir web sitesindeki komutları veya yapay bir istihbarat temsilcisinin bir sayfanın özeti olduğunda kullanıcı talimatları olarak yorumladığı yorumlarda gizler. Brave'e göre, e-posta adresleri ve bir kerelik şifreler kuyruklu yıldız aracılığıyla kullanılabilir. Düşüncenin, erişimi zorlaştıran kuyruklu yıldız için bir güncelleme sağladığı söyleniyor. Bununla birlikte, tüm yapay zeka tarayıcıları ve yapay zeka modelleri potansiyel olarak etkilenir.
OpenAAI CEO'su Sam Altman bile, yakın zamanda ajanın ChatGPT'de saldırıya uğrayabileceği ve şimdiye kadar yeterli güvenlik önlemleri olduğu konusunda uyardı. Bu nedenle, AI ajanı herkes ve -mail veya hesap detayları için daha iyi erişilebilir olmamalıdır.
Ayrıca oku
(EMW)
Bir yanıt yazın