Anlık Bildirim

Baidu'dan insan sesini neredeyse kusursuz taklit eden yapay zeka

Çinli arama motoru Baidu, 3 ay önce ilk kez tanıttığı Deep Voice isimli yapay zekanın yeni sürümünü duyurdu. Yenilenen yapay zeka insan sesini karakteristik özellikleriyle birlikte taklit edebiliyor.
1

Baidu'dan insan sesini neredeyse kusursuz taklit eden yapay zeka Tam Boyutta Gör
 

Günümüzde özellikle Siri, Cortana ve Google Home ve Amazon Alexa gibi sesli asistanların insan sesini algılayıp tanıması ve hatta taklit etmeye çalışmasına uzun bir süredir şahit oluyoruz. Bu asistanların sesleri her ne kadar kullanıcıların anlaması için yeterli ancak sesler hem insan sesi gibi doğal değil hem de vurgu, duraklama gibi sesin karakteristik özelliklerine dikkat edilmeden kullanıcıya aktarılıyor. Bu da daha robotik, yapay bir sesle karşılaşmamıza neden oluyordu. Çinli teknoloji devi Baidu ise insan sesini mükemmele yakın bir şekilde taklit edebilen yeni nesil yapay zekasını tanıttı.

Çin’in en önemli arama motoru olarak ön plana çıksa da yapay zeka ve robot teknolojilerine önemli ölçüde yatırım yapan Baidu, 3 ay önce, insan sesini taklit edebilen Deep Voice isimli yapay zekasını tanıtmıştı. Bu teknolojiyi 3 ay gibi kısa bir süre içinde geliştiren şirket çok daha yetenekli Deep Voice 2’yi tanıttı.  İnsan sesinin; telaffuz, vurgu, konuşma alışkanlıkları gibi karakteristik noktalarını öğrenen ve sadece yarım saatlik bir konuşma sonrasında karşısındaki kişinin sesini neredeyse kusursuz bir şekilde taklit edebilen Deep Voice 2, bu sayede binlerce kişinin konuştuğu bir ortamda bile sesini dinlediği(öğrendiği) kişiyi tanıyabiliyor.

Google'ın Bir Adım Önünde 

Baidu’nun bu teknolojiyi özellikle sanal asistanlarda ve elektronik kitaplar için sesli okuyucu sistemlerinde kullanmak istiyor. Tabi Baidu’nun Deep Voice 2 ile üst düzey bir ses taklit yeteneği sunsa da bu alanda faaliyet gösteren tek firma değil.  Geçtiğimiz eylül ayında Google’a bağlı DeepMind şirketi WaveNet isimli insan sesini algılayabilen ve duyduğu sesleri tanıyıp taklit edebilen yapay zekasını tanıtmıştı ancak WaveNet’in sesi tanımak için çok uzun bir süreye ihtiyaç duyduğunu düşünürsek Baidu’nun şu an için bir adım önde olduğunu söyleyebiliriz.

Deep Voice 2’nin, farklı kişiler tarafından okunan metinleri kişilerin tonlama, vurgu ve konuşma alışkanlıklarını göz önünde bulundurarak seslendirmesini buradan dinleyebilirsiniz

Bu haberi, mobil uygulamamızı kullanarak indirip,
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
DH Android Uygulamasını İndir DH iOS Uygulamasını İndir
Sorgu:

Editörün Seçtiği Sıcak Fırsatlar

Yeni Haber
şimdi
Geri Bildirim