OpenAI, 15 saniyelik kayıttan ses klonlayabilen yeni teknolojisini tanıttı

Yapay zeka sohbet robotu ChatGPT'nin geliştiricisi OpenAI, "Voice Engine" adını verdiği yeni teknolojisinin yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak orijinal konuşmacınınkine çok benzeyen bir konuşma üretebildiğini duyurdu.

Teknoloji
02 Nisan 2024 Salı 04:03
31

OpenAI, 15 saniyelik kayıttan ses klonlayabilen yeni teknolojisini tanıttı

İSTANBUL-NURULLAH SARI(YSM) - OpenAI tarafından, şirketin ses klonlayabilen yeni teknolojisine ilişkin açıklama yapıldı.

Açıklamada, "Voice Engine"in yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine çok benzeyen bir konuşma üretebildiği bilgisi paylaşıldı.

Söz konusu teknolojinin 2022'de geliştirildiği belirtilen açıklamaya göre, "kötüye kullanım potansiyeli" nedeniyle daha geniş bir sürüm için temkinli ve bilinçli yaklaşım benimsendi.

"İnsanların seslerine benzeyen konuşmalar üretmenin özellikle de seçim yılında ciddi riskler taşıdığının farkındayız." denilen açıklamaya göre, bu kapsamda ABD'nin de dahil olduğu çok sayıda uluslararası ortakla birlikte çalışılarak geri bildirim toplandı.

Güvenlik endişelerine ilişkin, Voice Engine'in test aşamasındaki kullanıcı partnerlerine, kişi veya kuruluşların kimliğini kullanmanın yasaklandığı, orijinal konuşmacının rızasının gerektiği ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça bildirilmesinin zorunlu kılındığı açıklandı.

Çeviri de yapabilecek

Açıklamaya göre ayrıca, Voice Engine orijinal konuşmacının sesini koruyarak çeviri yapabilecek.

Video ve podcast gibi içerik üreticilerinin bu özellikten faydalanarak "kendi sesleriyle" dünyaya ulaşabileceği, çevrilen seste orijinal konuşmacının "aksanını" da koruyabileceği bilgisi paylaşıldı.

YSM HABER MERKEZİ