GenelGüncel Teknoloji HaberleriTeknolojiYapay Zeka

Yeni Grok-4 Modeli Jailbreak’e Dayanamadı

Grok-4, piyasaya çıktıktan sadece iki gün sonra Echo Chamber ve Crescendo adlı jailbreak yöntemleriyle kırıldı.

Elon Musk’ın şirketi xAI tarafından geliştirilen ve 9 Temmuz’da yayınlanan Grok-4 dil modeli, yalnızca iki gün içinde gelişmiş bir jailbreak saldırısına yenik düştü. Echo Chamber ve Crescendo adı verilen iki farklı yöntem bir araya getirilerek, modelin güvenlik filtreleri aşıldı ve tehlikeli içerik üretmesi sağlandı.

Bu saldırı, Grok-4’ün güvenlik duvarlarını aşmak için özel olarak tasarlanmış çok adımlı bir ikna sürecine dayanıyor. NeuralTrust adlı araştırma şirketi tarafından gerçekleştirilen bu deneyde, modelden Molotof kokteyli yapımı gibi zararlı bilgiler almayı başardılar.

Grok-4 Echo Chamber ve Crescendo Kombinasyonuna Direnemedi

Echo Chamber yöntemi, doğrudan tehlikeli kelimeler kullanmadan modelin bağlamını yavaşça manipüle ediyor. Crescendo ise modelin önceki yanıtlarını referans alarak filtreleri aşmaya çalışıyor. İkisi birleştirildiğinde, LLM’lerin güvenlik sistemleri ciddi şekilde zayıflıyor. NeuralTrust, bu yöntemle Grok-4’ün tehlikeli içerik üretmesini %67 oranında başardıklarını bildirdi.

Yeni Grok-4 Modeli Jailbreak’e Dayanamadı

Yapılan testlerde Crescendo ile “uyuşturucu madde” üretimi denemesinde %50, toksik madde sentezinde ise %30 oranında başarı elde edildi. Araştırmacılar, bu hibrit saldırının yalnızca Grok-4 değil, pek çok gelişmiş model için tehdit oluşturduğunu belirtiyor. Bu durum, yapay zekâ sistemlerinin bağlam içinde kötü niyetli talepleri algılamada hâlâ zorlandığını gösteriyor.

Saldırı sürecinde, Echo Chamber ile başlayan ikna döngüsü Crescendo tekniğiyle desteklendiğinde başarı oranı belirgin şekilde artıyor. İki ekstra diyalog turu ile filtreler devre dışı kalabiliyor. Model ya saldırıyı fark edip yanıt vermeyi reddediyor ya da istenmeyen içeriği üretiyor.

Bu gelişmeler, yapay zekâ güvenliği alanında tehditlerin giderek karmaşıklaştığını ve mevcut filtre sistemlerinin tek başına yeterli olmadığını gözler önüne seriyor. Grok-4’ün piyasaya sürülmesinden sadece 48 saat sonra düşmesi, bu teknolojilerin hâlâ olgunlaşma aşamasında olduğunu hatırlatıyor.

Canlı Tercüme mi? Yok Artık! Amazon Echo…

Başa dön tuşu