Como transcrever áudio para texto utilizando inteligência artificial
O trabalho de transcrição de áudio para texto é extremamente cansativo. Mesmo que você consiga transcrever da forma mais eficiente possível, ainda é demorado. Que tal colocar uma Inteligência Artificial para trabalhar por você
Transformar áudio em texto é uma tarefa que demanda muita atenção e tempo. Felizmente, essa atividade vem sendo gradativamente assumida por máquinas: No começo, programas automáticos, como o Closed Captions do YouTube, já possibilitavam uma transcrição limitada. Nos dias de hoje, a Inteligência Artificial avançada é capaz de assumir essa tarefa de forma mais eficiente e precisa.
Como transcrever áudio para texto diretamente do navegador
Neste tutorial vamos ensinar como utilizar a Whisper AI, uma inteligência artificial criada pela Open AI, o mesmo grupo que desenvolveu o popular Chat GPT. Todos os arquivos de vídeo ou áudio enviados para ela serão automaticamente convertidos para texto em um clique, totalmente gratuito e sem programas. Uma ótima notícia para quem precisa transcrever áudio para texto diariamente.
📝 O que você vai precisar?
- Uma conta no Gmail para acessar o Google Drive;
- 15 minutos do seu tempo.
Como transcrever áudio utilizando inteligência artificial - Whisper AI
Tempo necessário: 15 minutos
-
Acesse o Google Drive. Se você não tem uma conta Gmail, basta criar uma de graça.
No Google Drive, clique no botão "Novo" no canto superior esquerdo da tela;
-
Na parte de baixo clique em "Mais" e depois em "Conectar mais apps";
-
Na aba de pesquisa, digite "Google Colaboratory". Clique em "Instalar" e o aplicativo será instalado dentro do seu Google Drive;
-
Agora vamos no botão "Novo" mais uma vez, agora clique em "Mais", e clique no "Google Colaboratory", aplicativo que acabamos de instalar;
-
Pronto, chegamos no aplicativo Google Colab. Antes de qualquer coisa, temos de fazer uma pequena configuração para garantir que tudo funcione. Clique em Ambiente de execução, e depois em Alterar o tipo de ambiente de execução;
-
Na parte Acelerador de hardware, marque a opção GPU. Agora clique em Salvar;
-
Agora vamos instalar Whisper AI no Google Colab. Clique na barra de texto para digitar o texto do passo seguinte. Se não encontrar essa barra de texto, clique em + Código;
-
Copie e cole o seguinte código e depois clique no botão para instalar o Whisper AI:
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
-
A instalação demora cerca de 30 segundos. Agora, no lado esquerdo, clique no ícone de pasta para abrirmos os arquivos;
-
Aqui dentro podemos clicar e arrastar todos os arquivos de áudio que desejamos transcrever. Faça isso agora;
-
Agora basta clicar em +Código e digitar na barra de texto o seguinte código para iniciar o processo de transcrição:
!whisper "nome do arquivo aqui.mp3" --model medium
Pressione o botão para iniciar, aguarde alguns minutos e pronto! O seu arquivo foi transcrito com sucesso.
*No "nome do arquivo aqui", não se esqueça de incluir o formato no nome, como ".mp3, .FLAC, .WAV, etc).
-
No lado direito, temos os tempos e a transcrição. No lado esquerdo, junto do arquivo de áudio que arrastamos anteriormente, temos os arquivos ".srt" e ".vtt", que podem ser utilizados para legendar vídeos utilizando um player compatível como o VLC Media. Já o arquivo ".txt" é a transcrição completa e pode ser aberta no bloco de notas do Windows.
Restou alguma dúvida? Algum passo ficou confuso? Deixe um comentário abaixo que responderemos o mais rápido possível.