IA generativa cria vídeo baseado nos pensamentos de uma pessoa

Você já se pegou imaginando personagens e histórias fictícias? A inteligência artificial (IA) pode criar um filme com essas ideias.

Por Bruna Machado Publicado em 09/06/2023 - 10:33

Nos últimos anos, temos visto um progresso constante nas capacidades das máquinas dotadas de inteligência artificial (IA), inclusive, no que diz respeito a ler mentes humanas.

Consoante a isso, pesquisadores têm utilizado a tecnologia de geração de vídeos por meio de IA para fornecer uma visão “real” do que ocorre em nossa mente.

Veja mais

Brasil é lar do maior pássaro do mundo; conheça a ave

1° vírus de computador: descubra como e por que foi criado

A interpretação dos sinais aéreos é impulsionada principalmente pela esperança de que, um dia, possamos oferecer novas formas de comunicação para pessoas em coma ou com diferentes formas de paralisia.

Além disso, a tecnologia também pode criar interfaces mais intuitivas entre humanos e máquinas, com possíveis aplicações para pessoas saudáveis.

Até o momento, a maioria das pesquisas tem se concentrado em recriar os monólogos internos dos pacientes, identificando as palavras em que estão pensando por meio de sistemas de IA.

Embora os resultados mais promissores tenham sido obtidos por meio de implantes aéreos invasivos, essa abordagem provavelmente não será a prática mais usada pela maioria das pessoas.

IA usada para criar “vídeos mentais”

Pesquisadores da Universidade Nacional de Cingapura e da Universidade Chinesa de Hong Kong conseguiram avanços ao combinar varreduras incorporadas não invasivas com tecnologia de geração de imagens de IA.

Eles podiam criar trechos curtos de vídeo que são surpreendentemente semelhantes aos clipes que os participantes estavam assistindo quando seus dados radiais foram coletados.

Para alcançar esse resultado, os pesquisadores primeiro treinaram um modelo utilizando grandes conjuntos de dados coletados por meio de scanners aéreos fMRI.

Em seguida, combinaram esse modelo com a tecnologia de geração de imagem AI Stable Diffusion, de código aberto, para criar as imagens correspondentes.

Um artigo publicado recentemente no servidor de pré-impressão arXiv apresenta uma abordagem semelhante à pesquisa anterior dos autores.

No entanto, dessa vez, eles adaptaram o sistema para interpretar fluxos de dados radiais e convertê-los em vídeos, em vez de imagens estáticas.

No início, o pesquisador acompanhou o treinamento do modelo utilizando conjuntos extensos de dados fMRI para que ele pudesse adquirir conhecimento das características gerais dessas varreduras elétricas.

Depois, eles expandiram o treinamento para que o modelo pudesse processar uma sequência de varreduras fMRI em vez de tratá-las individualmente.

Posteriormente, o modelo foi mantido a um novo treinamento, desta vez utilizando a combinação de varreduras fMRI, trechos de vídeo que evocavam essa atividade cerebral e sequência de texto correspondente.

Em uma abordagem separada, o pesquisador adaptou o modelo pré-treinado Stable Diffusion para gerar vídeos em vez de imagens estáticas.

Esse modelo foi, então, submetido a um novo treinamento utilizando os mesmos vídeos e sequência de texto que foram utilizados no treinamento do primeiro modelo.

Posteriormente, os dois modelos foram combinados e ajustados utilizando as varreduras fMRI e seus respectivos vídeos associados.

Resultado da pesquisa

Após a combinação e ajuste dos modelos, o sistema resultante foi capaz de realizar novas varreduras de fMRI que não havia encontrado anteriormente e gerar vídeos que apresentavam semelhanças reveladas com os clipes que os participantes humanos haviam assistido.

Embora ainda haja margem para melhorias, a saída da IA geralmente se aproxima bastante dos vídeos originais, reproduzindo com precisão cenas de cultivo ou manadas de cavalos, e mantendo a visualização com a paleta de cores utilizada.

Os investigadores responsáveis pelo estudo afirmam que essa área de pesquisa tem aplicações potenciais tanto na neurociência fundamental quanto em interfaces cérebro-máquina futuras.

No entanto, eles também reconhecem a necessidade de regulamentações governamentais e esforços por parte da comunidade científica para proteger a privacidade dos dados biológicos e evitar possíveis usos maliciosos dessa tecnologia, conforme autorizados em seu trabalho.

Essa linha de pesquisa abre caminho para avanços capazes de alcançar o entendimento da mente humana e o desenvolvimento de tecnologias que podem estabelecer interfaces mais sofisticadas entre o cérebro e as máquinas.

Ainda que haja considerações importantes a serem abordadas, como a proteção dos dados pessoais e a prevenção de abusos, o potencial benefício científico e tecnológico é promissor.