Connect with us

Come

Il motore vocale di OpenAI può clonare la tua voce con una clip vocale di 15 secondi

Il motore vocale di OpenAI può clonare la tua voce con una clip vocale di 15 secondi

Cosa sapere

  • OpenAI dispone di un modello Voice Engine migliorato in grado di clonare le voci con un campione vocale di soli 15 secondi.
  • La tecnologia di clonazione vocale AI di OpenAI ha implicazioni di vasta portata e la società sta ritardando un ampio rilascio in questo momento.
  • Nel frattempo, OpenAI sta implementando varie funzionalità di sicurezza e guardrail per identificare e monitorare l’uso della tecnologia.

Il modello Voice Engine di OpenAI, che alimenta le funzionalità Voice e Read Aloud di ChatGPT, ottiene una nuova potente capacità. Con nient’altro che un input di testo e un campione vocale di 15 secondi, ora può generare un clone dal suono naturale di una voce umana molto simile all’oratore originale. E i risultati sono spaventosamente buoni.

Insieme all’aggiornamento, OpenAI condiviso sul suo sito i risultati di alcuni test di clonazione vocale. Ciascuno di questi include un “audio di riferimento” originale, seguito dall'”audio generato” clonato. Ecco alcuni esempi di ciò di cui è capace il modello Voice Engine:

Audio di riferimento 1


Audio generato 1

Audio di riferimento 2

Audio generato 2

Audio di riferimento 3

Audio generato 3

Con possibili applicazioni nel settore dell’istruzione e della sanità, nella traduzione e nel raggiungere le comunità di tutto il mondo, la clonazione vocale sembra avere molti mercati in attesa di divorarla. Ma le implicazioni di tale tecnologia non sono tutte rosee.

Le chiamate fraudolente clonate dall’intelligenza artificiale sono già in aumento. Anche se c’è stato un consenso generale tra le nazioni sulla tutela degli utenti nell’era dell’intelligenza artificiale, i guardrail non sono così facili da mettere in atto, soprattutto quando la tecnologia corre avanti.

OpenAI, tuttavia, sta lavorando per implementare una propria serie di misure di sicurezza, “inclusa la filigrana per tracciare l’origine di qualsiasi audio generato da Voice Engine”, vietando l’imitazione di un altro individuo e richiedendo il consenso esplicito e informato dell’oratore originale.

“Stiamo adottando un approccio cauto e informato verso un rilascio più ampio a causa del potenziale uso improprio della voce sintetica”, ha affermato la società nella sua post sul blog.