Aplicação web desenvolvida com Streamlit para transcrever áudio em tempo real usando a API Whisper da OpenAI.
- Transcrição de Microfone: Grave e transcreva áudio em tempo real diretamente do seu microfone
- Transcrição de Vídeo: Faça upload de arquivos .mp4 e extraia/transcreva o áudio
- Transcrição de Áudio: Faça upload de arquivos .mp3 para transcrição
- Suporte a Prompts: Adicione prompts opcionais para melhorar a qualidade da transcrição
- Streamlit: Interface web interativa
- OpenAI Whisper: Modelo de transcrição de áudio
- streamlit-webrtc: Captura de áudio em tempo real
- MoviePy: Processamento de vídeo
- PyDub: Manipulação de áudio
- Clone o repositório:
git clone https://github.com/fbressa/audioTranscriptor.git
cd audioTranscriptor- Instale as dependências:
pip install -r requirements.txt- Configure a chave da API OpenAI:
- Crie um arquivo
.envna raiz do projeto - Adicione sua chave da API:
- Crie um arquivo
OPENAI_API_KEY=sua_chave_api_aqui
- Execute a aplicação:
streamlit run main.py-
Acesse a aplicação no navegador (geralmente em
http://localhost:8501) -
Escolha uma das abas:
- Microfone: Clique para começar a gravar e falar
- Vídeo: Faça upload de um arquivo .mp4
- Áudio: Faça upload de um arquivo .mp3
-
(Opcional) Adicione um prompt para melhorar a transcrição
- Python 3.7+
- Chave de API da OpenAI
- Microfone (para a funcionalidade de gravação em tempo real)
O projeto cria automaticamente uma pasta temp/ para armazenar arquivos temporários durante o processamento.
Crie um arquivo .env com as seguintes variáveis:
OPENAI_API_KEY=sua_chave_api_aquiEste projeto é de código aberto e está disponível sob a licença MIT.
fbressa
Contribuições, issues e feature requests são bem-vindos!