Deepfake, nuovo strumento di Microsoft
Microsoft ha presentato la nuova funzionalità avanzata per creare deepfake. Ecco come funziona.
Microsoft ha recentemente lanciato il suo nuovo strumento chiamato Azure AI Speech Text to Speech Avatar, che consente agli utenti di creare video di avatar personalizzati in grado di pronunciare discorsi generati dagli utenti stessi, conosciuti come deepfake. Questo strumento innovativo si basa su due componenti principali: un modello per gestire l’avatar e uno strumento di sintesi vocale per rendere udibile il testo inserito dall’utente.
Secondo Microsoft, questa nuova funzionalità permette agli utenti di creare video in modo più efficiente, ad esempio per scopi educativi, presentazioni di prodotti, testimonianze clienti e altro ancora. L’avatar può essere utilizzato anche per sviluppare agenti conversazionali, assistenti virtuali, chatbot e molte altre applicazioni.
Il video di presentazione della tecnologia mostra un esempio in cui una persona, sia in termini di immagine che di parlato, è stata ricreata utilizzando Azure Text to Speech. Gli avatar generati possono comunicare in diverse lingue e integrare modelli di intelligenza artificiale avanzati come GPT-3.5 di OpenAI per rispondere alle domande degli utenti.
Al momento del lancio, la maggior parte degli utenti di Azure avrà accesso solo ad avatar predefiniti, mentre quelli personalizzati saranno disponibili solo attraverso una registrazione speciale e per casi d’uso specifici.
Oltre a Azure AI Speech Text to Speech Avatar, Microsoft ha introdotto anche il servizio Personal Voice all’interno del suo servizio vocale neurale. Questo strumento è in grado di replicare la voce di un utente dopo aver fornito un campione vocale di un minuto. Microsoft suggerisce che questo strumento può essere utilizzato per creare assistenti vocali personalizzati, doppiare contenuti in diverse lingue e generare narrazioni personalizzate per storie, audiolibri e podcast.
Data la natura potenzialmente controversa di questa tecnologia, Microsoft ha implementato misure precauzionali, richiedendo agli utenti di fornire un “consenso esplicito” sotto forma di una dichiarazione registrata prima di poter utilizzare la voce personale per sintetizzare discorsi.
Nonostante le potenziali applicazioni positive, queste nuove funzionalità sollevano anche importanti questioni etiche, considerando il rischio di utilizzo fraudolento, propaganda politica distorta e la creazione di deepfake per scopi ingannevoli.
Scritto da Michele Bellotti
Commenta!