Společnost Alibaba vytvořila EMO model, který rozezpívá každou fotografii

Jakýkoli obrázek/audio se nyní může proměnit v mluvící animaci, a dokonce nám zazpívá.

Metoda nejprve zkoumá fotografii a identifikuje veškeré pohyby obličeje (frames encoding). Následně zpracuje zvuk a určí vhodné pohyby obličeje pro dané video (diffusion process). Takto budou výrazy obličeje vždy odpovídat hlasu a „náladě“ audio nahrávky (expression mapping).

Model nyní dokáže vytvářet videa, která drží krok s rychlými písněmi, takže nebude problém rozezpívat portréty v rytmu rock and rollu. Dokonce dokáže animovat staré portréty tak, že vypadají jako by mluvily nebo zpívaly.

Jistě víte, co to znamená. Opět jsme o krok blíže mluvícím portrétům z Harryho Pottera.

Reklama
MAM_SOME_800x1068_cover_2026-20

Týdně vám přinášíme exkluzivní obsah z oboru a shrnujeme pro vás to podstatné. Staňte se součástí komunity, která nepřestává hledat cesty, jak lépe a efektivněji komunikovat.

Ipsos

AKTUÁLNÍ VYDÁNÍ

MAM_SOME_800x1068_cover_2026-20

Týdně vám přinášíme exkluzivní obsah z oboru a shrnujeme pro vás to podstatné. Staňte se součástí komunity, která nepřestává hledat cesty, jak lépe a efektivněji komunikovat.

MAM Téma čísla

Ice hockey sports tournament modern poster template
Big data Network Abstract concept
Ai generative

MAM Exkluzivně v časopise

Zvidava Eva - premiera FFB
Snímek obrazovky 2026-05-14 v 10.37
tungart7-business-8676559
Ipsos

MAM Další zajímavé čtení

Welker - Obluk_nový web-otvírák - 2025-06-23T093718
MAM Souboj spotů duben
Timplich
Publicis Content team
Welker - Obluk_nový web-otvírák - 2025-06-23T093718
MAM Souboj spotů duben
Timplich
Publicis Content team