Apple MM1 Büyük Dil Modeli Detayları Belli Oldu: Heyecan Verici Detaylar Var

Apple yapay zeka konusunda büyük bir hamle yaptı ve yeni MM1 Büyük Dil Modeli'nin detaylarını makaleyle paylaştı.

Ferdi Alevci17/03/2024Tarih: 17/03/2024

Teknoburada'yı Google'da tercih edilen kaynak olarak ekleyin

Yapay zekanın bu kadar ilerlemesine ayak uydurmaya çalışan Apple, OpenAl tarafından LLM furyasına katıldı. Apple araştırma ekibi, “MM1: Multimodal LLM Ön Eğitiminden Yöntemler, Analiz ve Anlayışlar” adında bir makale yayınlayarak Büyük Dil Modeli’nin detaylarını paylaştı. Bu yeni dil modeli, hem doğal dil, hem de görüntü tanıma muhakemesinde şaşırtıcı yeteneklere sahip.

Apple MM1 Üç Boyuta Sahip: 3 Milyar, 7 Milyar ve 30 Milyar Parametre

Araştırmacıların bu dil modelini yapmaktaki asıl amacı, deneyler yapmak ve performansı etkileyen temel faktörleri belirlemek. Görsel bileşenlerin ölçeklendirilmesinin önemini vurgulayan ekibe göre görüntü çözünürlüğü ve görüntü etiketlerinin sayısı, görsel dil bağlayıcılarından daha büyük bir etkiye sahip. Ayrıca farklı eğitim öncesi veri kümelerinin modelin etkinliğini önemli ölçüde etkilediği ortaya kondu.

Ekip, MM1’i oluştururken “Uzmanların Karması” mimarisini ve “İlk 2 Geçitleme” yöntemini kullandı. Bu yaklaşım sayesinde çok modlu kıyaslamalarda güçlü performans elde edildi. Belirli görevler için ince ayarlar yapıldıktan sonra bile MM1 modelleri rekabetçi performansını korudu. Testlerde MM1-3B-Chat ve MM1-7B-Chat modellerinin pazardaki benzer büyüklükteki rakiplerin çoğundan daha iyi performans gösterdi. Apple‘ın bu iki modeli özellikle VQAv2 (görüntü ve metne dayalı soru yanıtlama), TextVQA (görüntü hakkında metin tabanlı soru yanıtlama) ve ScienceQA (bilimsel soru yanıtlama) gibi görevlerde çok daha başarılı.

Bu kadar başarılı fakat Google’ın Gemini ve ya OpenAI’ın GPT-4 V modellerini geçemiyor. MM1 sektöre hızlı ve güçlü bir giriş yapsa da ilerleyen zamanlarda Google ve OpenAI ile yarışabilecek düzeye gelecektir.

Ferdi Alevci17/03/2024Tarih: 17/03/2024

Takip Et