Společnost Alibaba vytvořila EMO model, který rozezpívá každou fotografii

Jakýkoli obrázek/audio se nyní může proměnit v mluvící animaci, a dokonce nám zazpívá.

Metoda nejprve zkoumá fotografii a identifikuje veškeré pohyby obličeje (frames encoding). Následně zpracuje zvuk a určí vhodné pohyby obličeje pro dané video (diffusion process). Takto budou výrazy obličeje vždy odpovídat hlasu a „náladě“ audio nahrávky (expression mapping).

Model nyní dokáže vytvářet videa, která drží krok s rychlými písněmi, takže nebude problém rozezpívat portréty v rytmu rock and rollu. Dokonce dokáže animovat staré portréty tak, že vypadají jako by mluvily nebo zpívaly.

Jistě víte, co to znamená. Opět jsme o krok blíže mluvícím portrétům z Harryho Pottera.

Reklama
Reklama
MAM_SOME_800x1068_cover_2026-14

Týdně vám přinášíme exkluzivní obsah z oboru a shrnujeme pro vás to podstatné. Staňte se součástí komunity, která nepřestává hledat cesty, jak lépe a efektivněji komunikovat.

Ipsos

AKTUÁLNÍ VYDÁNÍ

MAM_SOME_800x1068_cover_2026-14

Týdně vám přinášíme exkluzivní obsah z oboru a shrnujeme pro vás to podstatné. Staňte se součástí komunity, která nepřestává hledat cesty, jak lépe a efektivněji komunikovat.

MAM Téma čísla

Jiří Jón ČSOB
a blue background with lines and networks illustration
6G sítě iStock

MAM Exkluzivně v časopise

Radek Novák
Plzeňský biskup Tomáš Holub
Pavel Stepan Konica Minolta
Ipsos

MAM Další zajímavé čtení

Untitled design (4)
Souboj spotů březen
ČSOB
Vajnerová Veronika
Untitled design (4)
Souboj spotů březen
ČSOB
Vajnerová Veronika