Hoje você vai aprender a integrar o Google Cloud Text-to-Speech (TTS) ao seu ambiente Asterisk, criando uma URA com áudios gerados dinamicamente — com vozes naturais, fluentes e sem precisar gravar uma palavra.
Imagine sua URA dizendo:
“Olá, João. Sua próxima consulta é na terça-feira às 14 horas.”
Sem gravação manual, sem sofrimento. Apenas um comando e pronto: áudio gerado com voz profissional, direto do Google.
Vantagens da URA com Google TTS
- Vozes naturais (Wavenet) em português do Brasil
- Integração simples com shell script ou qualquer linguagem
- Possibilidade de gerar áudios com dados dinâmicos (nome, saldo, datas, etc.)
- Elimina necessidade de gravações manuais para conteúdos variáveis
Pré-requisitos
- Conta no Google Cloud Console
- Projeto com a API Text-to-Speech ativada
- Credencial (JSON) de uma conta de serviço com permissão para TTS
- Pacotes instalados:
gcloud
,ffmpeg
(ousox
) - Asterisk funcional com acesso ao diretório de áudios
Script de Integração com Google TTS
Abaixo, um exemplo de script em bash para gerar o áudio e convertê-lo para o formato aceito pelo Asterisk:
#!/bin/bash
TEXT="$1"
VOICE="pt-BR-Wavenet-A"
OUTPUT_MP3="/tmp/tts_output.mp3"
OUTPUT_WAV="/var/lib/asterisk/sounds/custom/tts_output.wav"
# Gera o áudio via Google TTS
gcloud text-to-speech synthesize \
--text="$TEXT" \
--voice="$VOICE" \
--audio-encoding=MP3 \
--output-file="$OUTPUT_MP3"
# Converte para WAV compatível com Asterisk (8kHz, mono)
ffmpeg -i "$OUTPUT_MP3" -ar 8000 -ac 1 -f wav "$OUTPUT_WAV"
echo "[INFO] Áudio disponível para Playback: custom/tts_output"
Dica: renomeie os arquivos com identificadores únicos (como timestamps ou hash do texto) para evitar sobrescritas.
Exemplo de uso no Dialplan
Depois de gerar o áudio, adicione no seu extensions.conf
:
exten => 5,1,Playback(custom/tts_output)
exten => 5,2,Hangup()
Agora, ao discar para 5
, o Asterisk tocará o áudio gerado com a voz do Google.
Expansões possíveis
- Integração com banco de dados para gerar frases dinâmicas
- Fila de chamadas com retorno personalizado por cliente
- Painel web para operadores digitarem o que a URA deve dizer
- Cache de áudios por conteúdo para evitar reprocessamento
Considerações finais
Essa abordagem transforma completamente a forma como sua URA interage com o usuário. Você ganha flexibilidade, economia de tempo e uma experiência muito mais profissional — com qualidade digna de grandes sistemas de call center.
Se você já usa Asterisk, essa é uma atualização quase obrigatória.