Este artigo lista as principais dúvidas que você pode ter relacionadas ao Microsoft Genomics. Para obter mais informações sobre o serviço do Microsoft Genomics, consulte O que é Microsoft Genomics?. Para obter mais informações sobre Solução de problemas, consulte nosso Guia de solução de problemas.
Como executo os fluxos de trabalho do GATK4 no Microsoft Genomics?
No arquivo config.txt do serviço do Microsoft Genomics, especifique o process_name como gatk4
. Observe que você será cobrado de acordo com as taxas de faturamento normais.
Como habilito a compactação de saída?
Você pode compactar a saída vcf ou gvcf usando um argumento opcional para a compactação de saída. É equivalente a executar -bgzip
seguido por -tabix
na saída vcf ou gvcf para produzir arquivos .gz
(saída bgzip) e .tbi
(saída tabix). O bgzip
compacta o arquivo vcf ou gvcf, e o tabix
cria um índice para o arquivo compactado. O argumento é um booliano, que é definido como false
por padrão na saída vcf e como true
por padrão na saída gvcf. Para usar na linha de comando, especifique -bz
ou --bgzip-output
como true
(execute o bgzip e o tabix) ou false
. Para usar esse argumento no arquivo config.txt, adicione bgzip_output: true
ou bgzip_output: false
ao arquivo.
O que é o SLA para Microsoft Genomics?
Garantimos que em 99,9% do tempo o serviço Microsoft Genomics estará disponível para receber solicitações de API de fluxo de trabalho. Para saber mais, veja SLA.
Como o uso do Microsoft Genomics aparece na minha fatura?
O Microsoft Genomics é faturado de acordo com o número de gigabases processados por fluxo de trabalho. Para saber mais, consulte Preços.
Onde é possível encontrar uma lista de todos os comandos e argumentos possíveis para o cliente `msgen`?
Você pode obter uma lista completa dos comandos e argumentos disponíveis executando msgen help
. Se nenhum argumento adicional é fornecido, ele mostra uma lista de seções de ajuda disponíveis, uma para cada um dos submit
, list
, cancel
, e status
. Para obter ajuda para um comando específico, digite msgen help command
; por exemplo, msgen help submit
lista todas as opções de envio.
Quais são os comandos mais comumente usados para o cliente `msgen`?
Os comandos mais usados são argumentos para o msgen
cliente incluem:
Comando | Descrição do campo |
---|---|
list |
Retorna uma lista de trabalhos que você enviou. Para argumentos, consulte msgen help list . |
submit |
Envia uma solicitação de fluxo de trabalho para o serviço. Para argumentos, consulte msgen help submit . |
status |
Retorna o status do fluxo de trabalho especificado por --workflow-id . Consulte também msgen help status . |
cancel |
Envia uma solicitação para cancelar o processamento do fluxo de trabalho especificado por --workflow-id . Consulte também msgen help cancel . |
Onde é possível obter o valor de `--api-url-base`?
Vá ao portal do Azure e abra a página da sua conta do Genomics. No cabeçalho Gerenciamento, escolha Chaves de acesso. Lá, você encontra a URL de API e suas chaves de acesso.
Onde é possível obter o valor de `--access-key`?
Vá ao portal do Azure e abra a página da sua conta do Genomics. No cabeçalho Gerenciamento, escolha Chaves de acesso. Lá, você encontra a URL de API e suas chaves de acesso.
Por que preciso duas chaves de acesso?
São necessárias duas chaves de acesso no caso de você desejar atualizá-las (gerá-las novamente) sem interromper o uso do serviço. Por exemplo, se você quiser atualizar a primeira chave, você deve ter todos os novos fluxos de trabalho usa a segunda chave. Em seguida, aguarde para todos os fluxos de trabalho usando a primeira chave para concluir antes de atualizar a primeira chave.
Você salva minhas chaves de conta de armazenamento?
Sua chave de conta de armazenamento é usada para criar tokens de acesso de curto prazo para o serviço Microsoft Genomics ler os arquivos de entrada e gravar os arquivos de saída. A vida útil padrão do token é de 48 horas. A duração do token pode ser alterada com a -sas/--sas-duration
opção do comando Enviar; o valor é em horas.
O Microsoft Genomics armazena dados do cliente?
Não. O Microsoft Genomics não armazena nenhum dado do cliente.
Quais referências de genoma posso usar?
Há suporte para essas referências:
Referência | Valor de -pa/--process-args |
---|---|
b37 | R=b37m1 |
hg38 | R=hg38m1 |
hg38 (nenhuma análise alt) | R=hg38m1x |
hg19 | R=hg19m1 |
Como formato meus argumentos de linha de comando como um arquivo de configuração?
msgen compreende os arquivos de configuração no seguinte formato:
Todas as opções são fornecidas como pares chave-valor com valores separados de chaves por dois-pontos. Espaço em branco é ignorado.
Linhas que começam com
#
serão ignoradas.Qualquer argumento de linha de comando no formato longo pode ser convertido a uma chave retirando seus principais traços e substituindo traços entre palavras com sublinhados. Aqui estão alguns exemplos de conversão:
Argumento de linha de comando Linha de arquivo de configuração -u/--api-url-base https://url
api_url_base:https://url -k/--access-key KEY
access_key:KEY -pa/--process-args R=B37m1
process_args:R-b37m1
Próximas etapas
Use os seguintes recursos para começar com o Microsoft Genomics:
- Comece executando o seu primeiro fluxo de trabalho pelo serviço do Microsoft Genomics. Executar um fluxo de trabalho por meio do serviço Microsoft Genomics
- Envie seus próprios dados para processamento pelo serviço do Microsoft Genomics: FASTQ emparelhado | BAM | FASTQ múltiplos ou BAM