Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

Microsoft just dropped VASA-1. This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba 10 wild examples: 1. Mona Lisa rapping Paparazzi

7,298,891 görüntüleme • 2 yıl önce •via X (Twitter)

13 Yorum

Min Choi profil fotoğrafı
Min Choi2 yıl önce

2. Realism and liveliness - example 1

Min Choi profil fotoğrafı
Min Choi2 yıl önce

3. Realism and liveliness - example 2

Min Choi profil fotoğrafı
Min Choi2 yıl önce

4. Out-of-distribution generalization - singing audios

Min Choi profil fotoğrafı
Min Choi2 yıl önce

5. Controllability of generation 1 Example of eye gaze direction and head distance, and emotion offsets

Min Choi profil fotoğrafı
Min Choi2 yıl önce

6. Controllability of generation 2 Example of different emotion offsets

Min Choi profil fotoğrafı
Min Choi2 yıl önce

7. Power of disentanglement Example of same motion sequence with different photos

Min Choi profil fotoğrafı
Min Choi2 yıl önce

8. Power of disentanglement Pose and expression editing

Min Choi profil fotoğrafı
Min Choi2 yıl önce

9. Out-of-distribution generalization - singing audios

Min Choi profil fotoğrafı
Min Choi2 yıl önce

10. Realism and liveliness - example 2

Min Choi profil fotoğrafı
Min Choi2 yıl önce

READ MORE: Official Microsoft Research blog at

Min Choi profil fotoğrafı
Min Choi2 yıl önce

If you enjoyed this thread, Follow me @minchoi and please Bookmark, Like, Comment & Repost the first Post below to share with your friends:

Min Choi profil fotoğrafı
Min Choi2 yıl önce

Also check out wild new AI Music Videos 👇

Min Choi profil fotoğrafı
Min Choi2 yıl önce

Also check out my series "AI will disrupt Hollywood (Part 36)" 👇

Benzer Videolar