Reklama
Megaboard

Společnost Alibaba vytvořila EMO model, který rozezpívá každou fotografii

Jakýkoli obrázek/audio se nyní může proměnit v mluvící animaci, a dokonce nám zazpívá.

Metoda nejprve zkoumá fotografii a identifikuje veškeré pohyby obličeje (frames encoding). Následně zpracuje zvuk a určí vhodné pohyby obličeje pro dané video (diffusion process). Takto budou výrazy obličeje vždy odpovídat hlasu a „náladě“ audio nahrávky (expression mapping).

Model nyní dokáže vytvářet videa, která drží krok s rychlými písněmi, takže nebude problém rozezpívat portréty v rytmu rock and rollu. Dokonce dokáže animovat staré portréty tak, že vypadají jako by mluvily nebo zpívaly.

Jistě víte, co to znamená. Opět jsme o krok blíže mluvícím portrétům z Harryho Pottera.

Ipsos
MAM_SOME_800x1068_cover-03

MAM Exkluzivně v časopise

Jan Patawa, MV ČR
David Klimeš, NFNZ
Domi Alagia, DVTV

MAM Téma čísla

gaming_rytir_iStock_nový web-otvírák (50)
2025
Téma Ročenky 2024
Ipsos

MAM Další zajímavé čtení

WEB_normal(10)
Souboj spotů osmifinále 2024
MAM Souboj spotů 2024 finále
MAM Souboj spotů 2024 semifinále
WEB_normal(10)
Souboj spotů osmifinále 2024
MAM Souboj spotů 2024 finále
MAM Souboj spotů 2024 semifinále