Microsoft VALL-E puede imitar cualquier voz con una muestra de tan solo 3 segundos

Microsoft VALL-E puede imitar cualquier voz con una muestra de tan solo 3 segundos

por Jordi Bercial 1

Recientemente hablábamos de cómo Microsoft había estado considerando añadir herramientas alimentadas por la inteligencia artificial de ChatGPT a Bing, pero parece ser que su interés por la inteligencia artificial viene de antes y viene fuerte, pues tal como podemos leer en este enlace, Microsoft ha lanzado VALL-E, una herramienta capaz de imitar cualquier voz con una pequeña muestra de 3 segundos.

Esta herramienta está entrenada en 60.000 horas de datos de voz en inglés, por lo que, si alguien quiere usar esta herramienta, deberá hacer uso de muestras de voz en inglés, algo que si bien no será difícil si queremos imitar voces de personas famosas del mundo anglosajón, para el resto de casos puede ser más complicado.

Geeknetic Microsoft VALL-E puede imitar cualquier voz con una muestra de tan solo 3 segundos 1

Una de las principales mejoras de este modelo en relación a otras formas de generación de voz es el hecho de que se pueden reflejar emociones, de forma que, si contamos, por ejemplo, con una muestra de voz alegre, el resultado será alegre, mientras que, si la muestra se escucha somnolienta, el resultado también lo será.

Por ahora, esta herramienta no está disponible para su uso público, pues como mencionábamos inicialmente, una de las principales fuentes de muestras puede ser famosos de parla anglosajona, cosa que puede usarse de forma malintencionada.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Redactor del Artículo: Jordi Bercial

Jordi Bercial

Ávido entusiasta de la tecnología y la electrónica. Cacharreo con componentes de ordenador casi desde que aprendí a andar. Empecé a trabajar en Geeknetic tras ganar un concurso en su foro sobre redacción de artículos de hardware. Amante del Drift, la mecánica y la fotografía. No te cortes y deja un comentario en mis artículos si tienes alguna consulta.

Comentarios y opiniones sobre: Microsoft VALL-E puede imitar cualquier voz con una muestra de tan solo 3 segundos ¿Qué opinas? ¿Alguna pregunta?
Liqmaxflo Banner