Disco to sztuczna inteligencja, która z pojedynczego zdjęcia generuje film taneczny.

kiki · Lipiec 22, 2023

Disco to sztuczna inteligencja, która z pojedynczego zdjęcia generuje film taneczny

Ostrzegamy tancerzy TikToka, bo już niedługo do stworzenia tanecznego filmiku wystarczy samo zdjęcie. Disco to model generatywny, który ma tę zdolność.

Jeśli nie umiesz tańczyć, ale z jakiegoś powodu chcesz wyglądać tak, jak potrafisz, za jakiś czas będziesz mógł stworzyć film ze swojego baletu ze zdjęcia selfie.

Generatywny model sztucznej inteligencji Disentangled Control for Real-World Reference Human Dance Generation (DisCo), opracowany przez badacza Tan Wanga i jego współpracowników z Nanyang Technological University w Singapurze, wraz z Microsoft Azure, pozwala w rzeczywistości generować realistyczne filmy przedstawiające tańczących ludzi, używając tylko statycznego obrazu jako odniesienia .

Aby tańczyć, zaczynasz od obrazu

Badania preprintów ilustrują, w jaki sposób firma DisCo „rozumie”, jak różne części ciała poruszają się podczas sekwencji tanecznych, oddzielając temat od tła, dzięki czemu konstrukcja ostatecznego filmu jest bardziej wiarygodna.

Najlepszym sposobem na wyszkolenie takiego modelu jest posiadanie zestawów danych, które są odpowiednie do celu, a naukowcy z Singapuru uważali, że tańce TikTok są na ich drodze.

W rzeczywistości firma DisCo wykorzystała zestaw danych składający się z 350 filmów TikTok związanych z tańcem jednej osoby trwającym 10-15 sekund każdy. Z nich naukowcy wyodrębnili klatki i użyli na nich narzędzia OpenPose, aby zlokalizować kluczowe punkty pozy osoby, skutecznie budując „szkielet” pozycji. Więc przeszkolili swój model z 8 procesorami graficznymi Nvidia V100.
Wyniki uzyskane z badań są dobre w niektórych przykładowych filmach wykorzystanych jako demonstracja sukcesu Disco.

Oprócz udawania poprawy umiejętności tanecznych, DisCo może stać się użytecznym modelem do tworzenia filmów generowanych przez sztuczną inteligencję, na przykład pokazywanych w transmisji na żywo z AI-WebTV , lub do integracji ich z kinowymi technologiami komputerowego widzenia .
Nie można jednak wykluczyć, że model o takich możliwościach mógłby być również wykorzystany do tworzenia filmów typu deepfake, po prostu zaczynając od przedniego zdjęcia osoby.
dday

Disco to sztuczna inteligencja, która z pojedynczego zdjęcia generuje film taneczny.

kiki

Sklep audiovideo.com.pl