Futuro próximo
Nenhum Resultado
Veja todos Resultado
Outubro 2 2023
  • Home
  • Tecnologia
  • Saúde
  • Meio Ambiente
  • Energia
  • Transporte
  • Espaço
  • AI
  • Conceitos
  • H+
Compreender, antecipar, melhorar o futuro.
CES2023 / Coronavírus / Rússia-Ucrânia
Futuro próximo
  • Home
  • Tecnologia
  • Saúde
  • Meio Ambiente
  • Energia
  • Transporte
  • Espaço
  • AI
  • Conceitos
  • H+

Compreender, antecipar, melhorar o futuro.

Nenhum Resultado
Veja todos Resultado
Tecnologia

AudioLM, a IA do Google ouve um fragmento de uma música e a completa

Um novo sistema de IA é capaz de criar música (e palavras) a partir de sons depois de ouvir alguns segundos de áudio ou músicas

Outubro 8 2022
Gianluca RiccioGianluca Riccio
⚪ 4 minutos
Partilhar69pino17Tweet43ENVIARPartilhar12PartilharPartilhar9

LEIA EM:

ÁudioLM, o sistema desenvolvido pelos pesquisadores do Google, gera todos os tipos de sons, incluindo sons complexos como música de piano em uma música ou pessoas falando, quase indistinguíveis do fragmento inicial que é submetido a ele.

A técnica é muito promissora e pode ser útil de várias maneiras. Por exemplo, ele pode acelerar o processo de treinamento da inteligência artificial ou gerar automaticamente músicas para acompanhar os vídeos. Mas é muito mais do que isso.

Jogue de novo, Sam

Já estamos acostumados a ouvir áudio gerado por inteligência artificial. Quem luta todos os dias com Alexa ou Google Nest sabe bem: nossos assistentes de voz processam linguagem natural.

Existem, com certeza, também sistemas treinados em música: lembre-se juke-box por OpenAI? Eu falei sobre isso aqui. Todos esses sistemas, no entanto, são baseados em um longo e complexo "treinamento", que passa pela catalogação e administração de muitas "idéias". Nossas inteligências artificiais estão famintas por dados e querem cada vez mais.

O artigo continua após os links relacionados

É assim que terminaria uma guerra entre humanos e inteligência artificial

Sem um freio por parte das instituições, a IA levará ao neofeudalismo privado?

O próximo passo é fazer a IA “pensar” permitindo que ela processe as informações que ouve com mais rapidez, sem a necessidade de longos treinamentos. Algo semelhante ao que você tenta fazer com sistemas autônomos.

Como o AudioLM funciona

Para gerar o áudio, alguns segundos de música ou som são inseridos no AudioLM, que literalmente prevê o que vem a seguir. Não é Shazam, não procura a peça inteira e a repropõe. Ele não faz uma colagem de sons que tem na memória. Ele os constrói. O processo é semelhante ao modo como eu modelos linguísticos como o GPT-3, eles preveem frases e palavras.

Os clipes de áudio lançados pela equipe do Google soam muito naturais. Em particular, a música de piano gerada pelo AudioLM parece mais fluida do que aquela gerada com as atuais inteligências artificiais. Em outras palavras, ele é melhor em capturar a forma como produzimos uma música ou um som.

"É realmente impressionante, até porque indica que esses sistemas estão aprendendo algum tipo de estrutura em camadas", diz ele Roger Danenberg, pesquisador em música gerada por computador na Carnegie Mellon University.

Música ou som, a IA toca tudo
AudioLM processa e prevê sons de maneiras sem precedentes

Não apenas uma canção

Imagine falar com AudioLM, duas palavras e parar. O sistema continuará o discurso aprendendo sua cadência, seu sotaque, suas pausas e até mesmo sua respiração. Em resumo, exatamente do jeito que você fala. Não há necessidade de fazer treinamento específico: ele pode fazer quase sozinho.

Como um papagaio repetindo as coisas que você ouve. Só este é um papagaio capaz de receber e produzir qualquer som, e completar autonomamente os que ficaram no meio.

Em suma? Teremos muito em breve (e nestes casos significa muito em breve) sistemas capazes de falar com muito mais naturalidade e de compor uma música ou soar exatamente como De E 2, MidjourneyAI e outros criam imagens, ou Faz um video cria clipes com base em nossa entrada.

Quem detém os direitos de uma música?

Embora esses sistemas possam criar conteúdo quase por si mesmos, isso "quase" ainda faz toda a diferença no mundo e torna necessário considerar as implicações éticas dessa tecnologia.

Se eu disser "Então, faça-me um final diferente para Bohemian Rapsody" e essa coisa vai fazer uma música nesse sentido, quem pode reivindicar os direitos e cobrar os royalties da música? Sem mencionar o fato de que sons e falas agora indistinguíveis dos humanos são muito mais convincentes e abertos a uma disseminação sem precedentes de desinformação.

No documento publicado para apresentar esta IA (eu linko aqui), os pesquisadores escrevem que já estão considerando como mitigar esses problemas inserindo maneiras de distinguir sons naturais daqueles produzidos com AudioLM. acredito pouco. Muitos dos propósitos para os quais essa IA foi criada seriam perdidos.

De maneira mais geral, o risco é produzir um fenômeno que eu chamaria de "desconfiança da realidade". Se tudo pode ser verdade, nada pode ser. Nada tem valor.

Tentamos treinar nossa inteligência natural para essas mudanças enquanto pensamos em como a inteligência artificial pode produzi-las. Se não o fizermos, teremos uma música com um final muito amargo.

Tags: auditivogoogleinteligência artificial

Últimas notícias

  • LK-99, novo episódio: é realmente supercondutor em temperatura ambiente?
  • Comente a CVP Impack Machine da Sparck Technologies pode revolucionar a indústria de embalagens
  • Prêmio Nobel de Medicina aos criadores das técnicas de mRNA por trás das vacinas Covid
  • SciMatch: tire uma selfie e conheça sua alma gêmea
  • O futuro monitoramento da glicose? Um novo e engenhoso sensor de suor
  • Da morte à paixão: se o veneno da aranha superar a disfunção erétil
  • Ficando velho? Não, obrigado: o futuro da longevidade entre a investigação e a especulação
  • Videogames e fotorrealismo: fronteira cada vez mais tênue entre jogo e realidade
  • É assim que terminaria uma guerra entre humanos e inteligência artificial
  • O alarme dos cientistas japoneses: microplásticos também nas nuvens


Bate-papo GPT Megafácil!

Guia concreto para quem se aproxima desta ferramenta de inteligência artificial, também pensada para o mundo escolar: muitos exemplos de aplicações, indicações de utilização e instruções prontas a usar para treinar e interrogar o Chat GPT.

Para submeter artigos, divulgar os resultados de uma pesquisa ou descobertas científicas escreva para a equipe editorial

Entre no canal Telegram do Futuroprossimo, clique aqui. Ou siga-nos no Instagram, Facebook, Twitter, Mastodonte e Linkedin.

FacebookTwitterInstagramTelegramLinkedinMastodontePinterestTikTok

O amanhã diário.


Futuroprossimo.it traz novidades sobre o futuro da tecnologia, ciência e inovação: se há algo que está para chegar, aqui já chegou. FuturoProssimo faz parte da rede Para a frente, estudos e habilidades para cenários futuros.

  • Meio Ambiente
  • arquitetura
  • Inteligência artificial
  • Gadgets e Electronicos
  • Conceitos
  • Design
  • Medicina
  • Espaço
  • Robotica
  • Trabalhar
  • Transporte
  • Energia
  • Edição Francesa
  • edição alemã
  • versão japonesa
  • Edição Inglesa
  • edição em português
  • Consulte Mais informação
  • Edição espanhola

Boletim informativo Iscriviti alla

  • Os Editores
  • Publicidade no FP
  • Política de Privacidade

© 2023 Futuro próximo - Licença Creative Commons
Este trabalho é distribuído sob licença Creative Commons Atribuição 4.0 Internacional.

Nenhum Resultado
Veja todos Resultado
Compreender, antecipar, melhorar o futuro.
  • Home
  • Tecnologia
  • Saúde
  • Meio Ambiente
  • Energia
  • Transporte
  • Espaço
  • AI
  • Conceitos
  • H+