Microsoft umí v reálném čase rozhýbat fotku podle audia. Je to tak dobré, že to raději nikomu nedá

18. 4. 2024 - 14:45 | Zive.cz

Asijská pobočka Microsoft Research zveřejnila svůj framework VASA-1, který z jediné fotografie či klidně jen nakresleného obrázku a audio stopy vytvoří reálně působící video mluvící postavy. Hlavní inovací jsou pokročilé možnosti animace přenášející emoce a pohyby hlavy pro přirozeně působící ...