Como Integrar o Google TTS com Asterisk para Criar uma URA Dinâmica e Profissional

Hoje você vai aprender a integrar o Google Cloud Text-to-Speech (TTS) ao seu ambiente Asterisk, criando uma URA com áudios gerados dinamicamente — com vozes naturais, fluentes e sem precisar gravar uma palavra.

Imagine sua URA dizendo:

“Olá, João. Sua próxima consulta é na terça-feira às 14 horas.”

Sem gravação manual, sem sofrimento. Apenas um comando e pronto: áudio gerado com voz profissional, direto do Google.


Vantagens da URA com Google TTS

  • Vozes naturais (Wavenet) em português do Brasil
  • Integração simples com shell script ou qualquer linguagem
  • Possibilidade de gerar áudios com dados dinâmicos (nome, saldo, datas, etc.)
  • Elimina necessidade de gravações manuais para conteúdos variáveis

Pré-requisitos

  • Conta no Google Cloud Console
  • Projeto com a API Text-to-Speech ativada
  • Credencial (JSON) de uma conta de serviço com permissão para TTS
  • Pacotes instalados: gcloud, ffmpeg (ou sox)
  • Asterisk funcional com acesso ao diretório de áudios

Script de Integração com Google TTS

Abaixo, um exemplo de script em bash para gerar o áudio e convertê-lo para o formato aceito pelo Asterisk:

#!/bin/bash

TEXT="$1"
VOICE="pt-BR-Wavenet-A"
OUTPUT_MP3="/tmp/tts_output.mp3"
OUTPUT_WAV="/var/lib/asterisk/sounds/custom/tts_output.wav"

# Gera o áudio via Google TTS
gcloud text-to-speech synthesize \
  --text="$TEXT" \
  --voice="$VOICE" \
  --audio-encoding=MP3 \
  --output-file="$OUTPUT_MP3"

# Converte para WAV compatível com Asterisk (8kHz, mono)
ffmpeg -i "$OUTPUT_MP3" -ar 8000 -ac 1 -f wav "$OUTPUT_WAV"

echo "[INFO] Áudio disponível para Playback: custom/tts_output"

Dica: renomeie os arquivos com identificadores únicos (como timestamps ou hash do texto) para evitar sobrescritas.


Exemplo de uso no Dialplan

Depois de gerar o áudio, adicione no seu extensions.conf:

exten => 5,1,Playback(custom/tts_output)
exten => 5,2,Hangup()

Agora, ao discar para 5, o Asterisk tocará o áudio gerado com a voz do Google.


Expansões possíveis

  • Integração com banco de dados para gerar frases dinâmicas
  • Fila de chamadas com retorno personalizado por cliente
  • Painel web para operadores digitarem o que a URA deve dizer
  • Cache de áudios por conteúdo para evitar reprocessamento

Considerações finais

Essa abordagem transforma completamente a forma como sua URA interage com o usuário. Você ganha flexibilidade, economia de tempo e uma experiência muito mais profissional — com qualidade digna de grandes sistemas de call center.

Se você já usa Asterisk, essa é uma atualização quase obrigatória.

Rolar para cima