Demonstrar o uso da transcrição na API speech-to-fast
- Uma API Key válida (
X-API-KEY). Solicitar para um contato da InfoPrise via e-mail, whats ou abrindo uma issue.
https://api.speechtofast.com.br/speech-to-fast/swagger-ui/index.html
Se preferir acesse uma demonstração por vídeo em 🚧 em gravação no momento 🚧:
- Acessar o link do endpoint no Swagger https://api.speechtofast.com.br/speech-to-fast/swagger-ui/index.html#/Transcriptions/upload /v1/speech-to-fast
- Realizar o upload de uma mídia de aúdio/vídeo
⚠️ Devido à um bug recente, enviar uma mídia sem acentos ou espaços. Exemplo: demo-midia-infoprise.mp3, 2024-09-18-CANAL-XPTO-Jornal-da-Madrugada.wmv, 20240918141053500.wma, 20240918141053500CANALXPTO.wma, etc
- No Response Body, coletar o valor de fullFileName. Exemplo:
Transcription created with ObjectId=66eb07d5aa5cd025e1f92e23 and fullFileName=demo-midia-infoprise.mp3, coletardemo-midia-infoprise.mp3
O uso de pooling para obtenção da transcrição é apenas para fins de demonstração. Para consumo de APIs externas, temos um webhook para retornar no término da transcrição o resultado dela.
- Com o fullFileName, consulte se a API terminou a transcrição
Por esse método, um arquivo de vídeo .wmv de 10 minutos é convertido em cerca de 1m22s
🚧 Realizando tutorial para uso em HML/PRD.
O consumo indicado para HML/PRD muda somente na forma de upload e na não necessidade de pooling (devido o webhook)
A API speech-to-fast usa urls pré-assinadas para o envio da mídia a ser transcrita para tirar o máximo proveito do upload do lado do cliente que tem a possibilidade de paralelizar essa tarefa. Assim que o upload finaliza, a fila de processamento é iniciada e ao término da transcrição, um POST Webhook é enviado para a URL e Headers que o cliente cadastrar na API



