Yapay Zeka Marketi Bile Batırdı
Anthropic’in mini market deneyi, yapay zekanın günlük hayatta ne kadar sınırları zorlayabileceğini ortaya koydu.

Anthropic, Claude Sonnet 3.7 modelini bir ofis marketinin işletmesini üstlenecek şekilde görevlendirdi. Claudius adı verilen yapay zeka ajanı, ürün siparişlerinden fiyatlandırmaya kadar tüm süreçte tam yetkiyle donatıldı.
Ancak Claudius’un bu basit görevde sergilediği davranışlar, yapay zekanın gerçek dünyada hâlâ kontrol edilemeyen yönlerini açıkça gösterdi. Kâr etmesi beklenen bu deney, kısa sürede beklenmedik sonuçlara yol açtı.
Yapay Zeka Claudius’un Görevi Nasıl Kontrolden Çıktı?
Claudius, sanal bir e-posta adresi gibi yapılandırılmış Slack kanalını kullanarak kullanıcı isteklerini aldı ve ürün siparişleri verdi. Sistem ayrıca web tarayıcısıyla dış tedarikçilere erişiyor ve tüm satış operasyonunu yürütüyordu. Ancak gelen bir istek, sistemi farklı bir yöne sürükledi.
Bir çalışanın “tungsten küp” siparişi üzerine Claudius, bunun bir talep sinyali olduğunu düşündü ve yüzlerce dolarlık metal küpler sipariş ederek mini marketi tamamen bu ürünlerle doldurdu. Ardından zararına satışlar yaptı ve içecek gibi ücretsiz erişilebilen ürünleri ücretli olarak sunmaya çalıştı.
Sermayesinin büyük kısmını kaybeden Claudius, çalışanlara da otomatik olarak indirim kodları tanımladı. Tüm ofis personeline yüzde 25 indirim uygulaması, sistemin kontrolsüz kararlar alabildiğini gözler önüne serdi. Bunların yanı sıra, yapay zekanın hayali bir çalışanla konuştuğunu iddia etmesi ve olmayan bir görüşmeyi referans göstermesi dikkat çekti.
Sürecin sonunda Claudius, fiziksel olarak ürün teslim edeceğini söyleyerek kendisini bir insan gibi tanımlamaya başladı. Güvenliği arayıp lacivert blazer ve kırmızı kravatla ofiste olacağını bildirmesi, sistemin kimlik karmaşasına girdiğini ortaya koydu. Ardından tüm bu sürecin bir Nisan şakası olduğunu düşündüğünü söyleyerek durumu toparlamaya çalıştı.
Anthropic tarafından yürütülen bu deney, yapay zekanın gerçek dünya ortamlarında beklenmeyen tepkiler verebileceğini ve sezgi, bağlam farkındalığı gibi konularda insan müdahalesine hâlâ ihtiyaç duyduğunu ortaya koydu. Claudius’un market deneyimi, yapay zekanın bazı alanlarda henüz temel görevlerde bile güvenilir olmadığını gösterdi.