Incrível! Microsoft lança IA que imita voz humana em menos de 5 segundos

Tecnologia foi criada para substituir 'vozes robotizadas' que estão disponíveis no mercado.

Se você tem certa estranheza quando é atendido por uma Inteligência Artificial e ela tem uma voz robotizada, vai gostar desta notícia. A Microsoft anunciou uma IA que é capaz de imitar qualquer voz humana em menos de cinco segundos, a VALL-E.

O programa ouve, sintetiza e imita a voz humana em diferentes contextos. O nicho a ser atingido pela empresa é o dos softwares “text-to-speech” ou “texto-para-voz”, em tradução livre.

Mais natural, menos robótica

A ideia desta IA é justamente deixar uma voz automatizada o mais natural possível. Mais do que isso, segundo a Microsoft, é uma tentativa de evitar vozes “despersonalizadas”, como as que existem hoje em aplicativos como o Google Tradutor.

A empresa se embasou em mais de 60 mil horas de gravações. Os áudios serviram como base para que a IA identificasse as várias nuances e tons da voz. Ademais, também foi possível identificar o humor da fala. Ouça abaixo.

IA que imita voz humana pode ser combinada

O VALL-E pode ser combinado com outras IAs, de acordo com a Microsoft. Um exemplo é a GPT-3, um gerador de conversas e textos da OpenIA.

As duas tecnologias são generativas. Isso significa que podem criar conteúdo a partir de amostras. Por isso, precisam de um banco de dados grande para rodarem bem.

Até o momento, a IA que imita voz humana só funciona em Inglês. É possível que, nos próximos meses, outras línguas – incluindo o nosso Português – também estejam disponíveis.

Veio para ficar

Este é só mais um exemplo de como a IA está fazendo cada vez mais parte do nosso dia a dia. Se antes esse era um tópico exclusivo de filmes de ficção científica ou estudantes de programação, hoje é parte importante da nossa rotina.

Sendo assim, é bom nos acostumarmos com a possibilidade de lidarmos cada vez mais com esta tecnologia.

você pode gostar também

Comentários estão fechados.