Yapay Zeka Sesli Asistanlara Dönüşüyor: Gemini 2.5’e Yeni Araçlar Eklendi!

Google, I/O etkinliğinde tanıttığı yeni AI modeli Gemini 2.5 ile sesli diyalog ve üretim yeteneklerinde devrim yaratıyor.

Google I/O etkinliğinde tanıtılan Gemini 2.5, yapay zeka destekli sesli diyalog ve üretim yeteneklerinde çığır açıyor. Bu yeni model, dünya genelinde çeşitli ürünler ve diller arasında kesintisiz sesli etkileşimler sunarak yapay zeka ile iletişim kurma şeklimizi baştan aşağı değiştirmeyi hedefliyor.

Gemini 2.5, NotebookLM’nin Sesli Genel Bakışları ve Project Astra gibi uygulamalara entegre edildi. Modelin temel özelliği, gerçek zamanlı sesli konuşmalara öncelik vermesi. Bu sayede yapay zeka, konuşmayı doğal ton, stil ve bağlamsal farkındalıkla yorumlayabiliyor ve üretebiliyor. Peki bu temel ses diyaloğunun özellikleri neler? İşte cevabı.

Gemini 2.5 Real-time audio dialog

Gemini 2.5 İçin Temel Ses Diyalog Özellikleri:

Metinden Konuşmaya (TTS) Özelleştirme

Gemini 2.5, ses üretimi üzerinde de üst düzey kontrol sunarak kullanıcıların konuşma çıkışını hassas bir şekilde ayarlamasına olanak tanıyor:

Gemini 2.5 Text-to-speech

Exit mobile version