La divisione di Microsoft in Asia ha presentato un nuovo progetto di intelligenza artificiale, chiamato Vasa-1, che riesce a realizzare video di persone sulla base di una sola fotografia. La piattaforma, che punta a concorrere con Sora di OpenAI, stando a quanto si apprende dalla stessa Microsoft, riesce anche a replicare la voce di un individuo in pochi secondi. L’intento è, per i ricercatori, di «aprire la strada a interazioni con avatar realistici che emulano comportamenti umani». Scopriamo più nel dettaglio come lavora il nuovo progetto AI di Microsoft.
Leggi anche: Perché Microsoft investe anche negli Emirati Arabi: 1,5 miliardi nella società AI G42
I dubbi su Vasa-1
Al momento, Vasa-1 è solo un esperimento che piano piano sta prendendo forma nei laboratori di Microsoft Research. Il colosso americano ha pubblicato diversi esempi in cui si vedono volti, ad un primo sguardo verosimili, pronunciare alcune frasi. Anche se i movimenti delle labbra e della testa potrebbero sembrare artefatti, l’argomento intacca di nuovo il potenziale rischio di un utilizzo della tecnologia per diffondere deepfake, filmati fasulli. I ricercatori stessi hanno deciso di non rilasciare «una demo, un prodotto e ulteriori dettagli di implementazione o qualsiasi offerta correlata» finché non saranno sicuri che la loro tecnologia «sarà utilizzata in modo responsabile e in conformità con le corrette procedure».
Come funziona Vasa-1
Secondo il documento diffuso da Microsoft, Vasa-1 è stato addestrato sul set di dati VoxCeleb2, che contiene «oltre 1 milione di espressioni di 6.112 individui celebri» estratte dai video di YouTube. Anche se lo strumento è stato addestrato su volti reali, Microsoft dimostra che Vasa-1 può funzionare anche su disegni e opere. Gli esperti hanno, per esempio, combinato la Mona Lisa con un file audio dell’attrice Anne Hathaway. «Pur riconoscendo la possibilità di un uso improprio, i vantaggi dell’IA per video vanno dall’equità educativa al miglioramento dell’accessibilità per le persone con difficoltà di comunicazione, fino alla compagnia o il supporto terapeutico a chi ne ha bisogno», spiega Microsoft.