Fotoğrafları Hem Videoya Dönüştürüp Hem de Seslendirebilen Yapay Zekâ Aracı EMO Tanıtıldı

Fotoğrafları Hem Videoya Dönüştürüp Hem de Seslendirebilen Yapay Zekâ Aracı EMO Tanıtıldı
0

 EMO adı verilen yeni bir yapay zekâ aracı tanıtıldı. Bu araç, fotoğrafları videoya dönüştürebiliyor. Dahası, fotoğraftaki kişileri dilediğiniz sese uygun şekilde konuşturup şarkı bile söyletebiliyor.

Alibaba Group’un Akıllı Bilgisayar Enstitüsü‘nden araştırmacılar Linrui Tian, Qi Wang, Bang Zhang ve Liefeng Bo, yapay zekânın seçili metinleri okuyabilmelerini, okudukları metinlere göre de yüz ifadelerini akıcı şekilde değiştirebilmelerini sağlayan bir yapay zekâ olan EMO’yu tanıttı. 

Ağız hareketleri, sözlere uygun olarak değişiyor

EMO’nun en dikkat çeken yanı, bir fotoğrafı ya da görseli konuşturması değil, bunu yapan başka çok sayıda uygulama görmüştük. Bu yapay zekâ aracının en önemli farkı, önceden hazırlanmış konfigürasyonun dışında seslere göre de görselleri canlandırabilmesi. Ayrıca ağız hareketleri de sözlere uygun olacak şekilde değişiyor. Yani görsel, tam anlamıyla sese uygun olarak videoya dönüştürülüyor.

Bir diğer dikkat çekici özellik ise yapay zekâ aracının, ses kaynağına göre temposunu ayarlayabilmesi. Sakin sakin konuşma ile rap yapma arasındaki farkı anlayabilen yapay zekâ, animasyonlarda da jest ve mimiklerin, ağız hareketlerinin temposunu buna göre ayarlıyor. Üstelik yapay zekâ, animasyon karakterlerini, yapay zekânın oluşturduğu görselleri ya da anime karakterlerini de konuşturmayı başarabiliyor. 

Peki nasıl çalışıyor?

yapay zekâ

Araştırmacılar, yapay zekâ modelinin özünde iki kısımdan oluştuğunu belirtiyor. Bunlardan biri, görseli tanımlayıp referans görselden yola çıkarak hareketli kareleri oluşturuyor. Diğeri ise ses dosyasını tanımlayarak anahtar noktaları belirliyor. Sonrasında da anahtar noktalar ile görseller eşleştiriliyor. Yapay zekânın iki de kontrol modülü bulunuyor. Bunlardan biri, görseldeki karakterin değişmeden kaldığına emin olurken diğeri ise sesi kontrol ediyor. Her iki taraftan gelen sonuçlar daha sonra birleştiriliyor. 

Kaynak:https://humanaigc.github.io/emote-portrait-alive/
 

Bu Yazıya Tepkiniz Ne Oldu?
  • 0
    be_end_m
    BEĞENDİM
  • 0
    alki_
    ALKIŞ
  • 0
    _a_kin
    ŞAŞKIN
  • 0
    k_t_
    KÖTÜ
  • 0
    berbat
    BERBAT

1959 yılında Samsunda doğdu. 1989-2005 Yılları arasında Temsa, Mitsubishi, Sabancı Holding grubunda Otomotiv, Bilgi işlem ve Yazılım bölümlerinde Müdür olarak çalıştı. Adnan Güney, şu anda, Network Dizayn Yazılım ve Tasarım koordinatörü olarak çalışmalarına devam etmekte. Ayrıca Blogger, Wordpress, Tumblr, Google sites gibi alanlara ilgili olup, uzun yıllardır SEO ve Alexa üzerinde çalışmakta.

Yazarın Profili

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir