Configurar o armazenamento de dados da CLI de Fala
A CLI de Fala pode depender das definições nos arquivos de configuração, que podem ser referenciados usando um símbolo @
. A CLI de Fala salva uma nova configuração em um novo subdiretório ./spx/data
criado no diretório de trabalho atual para a CLI de Fala. A CLI de Fala primeiro procura um valor de configuração no diretório de trabalho atual, depois no repositório de dados em ./spx/data
e, em seguida, em outros repositórios de dados, incluindo um repositório de dados final somente leitura no spx
binário.
No início rápido da CLI de Fala, você usou o repositório de dados para salvar seus @key
valores and@region
, portanto, não foi necessário especificá-los com cada spx
comando. Tenha em mente que você pode usar arquivos de configuração para armazenar as próprias definições de configuração ou até mesmo usá-las para passar URLs ou outro conteúdo dinâmico gerado em runtime.
Para obter mais detalhes sobre arquivos do armazenamento de dados, incluindo o uso de arquivos de configuração padrão (@spx.default
, @default.config
e @*.default.config
para configurações padrão específicas de comando), digite este comando:
spx help advanced setup
nodefaults
O exemplo a seguir limpa o arquivo de configuração @my.defaults
, adiciona pares chave-valor para chave e região no arquivo e usa a configuração em uma chamada para spx recognize
.
spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus
spx config @my.defaults
spx recognize --nodefaults @my.defaults --file hello.wav
Configuração dinâmica
Você também pode gravar o conteúdo dinâmico em um arquivo de configuração usando a opção --output
.
Por exemplo, o comando a seguir cria um modelo de fala personalizada e armazena a URL do novo modelo em um arquivo de configuração. O próximo comando aguarda até que o modelo na URL esteja pronto para ser usado antes de retornar.
spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait
O exemplo a seguir grava duas URLs no arquivo de configuração @my.datasets.txt
. Nesse cenário, --output
pode incluir uma palavra-chave adicionar opcional para criar um arquivo de configuração ou acrescentar à existente.
spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt
spx config @my.datasets.txt
Adicionar configuração do SPX
Para legibilidade, flexibilidade e conveniência, você pode usar uma configuração predefinida com opções de saída selecionadas.
Por exemplo, você pode ter os seguintes requisitos de legendagem:
- Fazer o reconhecimento do arquivo de entrada
caption.this.mp4
. - Emitir legendas WebVTT e SRT para os arquivos
caption.vtt
ecaption.srt
, respectivamente. - Emitir o
offset
,duration
,resultid
etext
de cada evento de reconhecimento para o arquivoeach.result.tsv
.
Você pode criar uma configuração predefinida chamada @caption.defaults
conforme é mostrado aqui:
spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt
As configurações são salvas no diretório atual em um arquivo chamado caption.defaults
. Este é o conteúdo do arquivo:
output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt
Depois, para gerar legendas, você pode executar este comando que importa as configurações da configuração predefinida @caption.defaults
:
spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults
O uso da configuração predefinida, como já mostrado, é semelhante à execução do seguinte comando:
spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text