Společnost Alibaba vytvořila EMO model, který rozezpívá každou fotografii

Jakýkoli obrázek/audio se nyní může proměnit v mluvící animaci, a dokonce nám zazpívá.

Metoda nejprve zkoumá fotografii a identifikuje veškeré pohyby obličeje (frames encoding). Následně zpracuje zvuk a určí vhodné pohyby obličeje pro dané video (diffusion process). Takto budou výrazy obličeje vždy odpovídat hlasu a „náladě“ audio nahrávky (expression mapping).

Model nyní dokáže vytvářet videa, která drží krok s rychlými písněmi, takže nebude problém rozezpívat portréty v rytmu rock and rollu. Dokonce dokáže animovat staré portréty tak, že vypadají jako by mluvily nebo zpívaly.

Jistě víte, co to znamená. Opět jsme o krok blíže mluvícím portrétům z Harryho Pottera.

MAM_SOME_800x1068_cover-2026-8

Týdně vám přinášíme exkluzivní obsah z oboru a shrnujeme pro vás to podstatné. Staňte se součástí komunity, která nepřestává hledat cesty, jak lépe a efektivněji komunikovat.

Ipsos

AKTUÁLNÍ VYDÁNÍ

MAM_SOME_800x1068_cover-2026-8

Týdně vám přinášíme exkluzivní obsah z oboru a shrnujeme pro vás to podstatné. Staňte se součástí komunity, která nepřestává hledat cesty, jak lépe a efektivněji komunikovat.

MAM Téma čísla

Toužimáci
Glowing Speech Bubble on Pink Background
Ski gates with parallel slalom

MAM Exkluzivně v časopise

Samo Jaško 2
Kids playing video games on smart phone after school
Raul Baronetti na workshopu v Publicis Groupe v Praze
Ipsos

MAM Další zajímavé čtení

Vodafone výročí
MARK BBDO
Leo Prague - Motion team
woo - logo
Vodafone výročí
MARK BBDO
Leo Prague - Motion team
woo - logo