Pacote de recursos GATK

Nota

Atualização importante 19/09/2024: Todos os URLs estão mudando. Estamos permitindo o acesso público a todos os contêineres do Genomics Data Lake. As "URLs assinadas" (assinaturas de acesso compartilhado) existentes serão desativadas em: 2024-11-04T00:00:00Z. Após esse período, os URLs sem uma cadeia de caracteres de consulta continuarão a funcionar, no entanto, os "URLs assinados" não funcionarão mais e retornarão um código de status HTTP 403. Planeie em conformidade aceder aos URLs públicos sem uma cadeia de caracteres de consulta após esta data (remova os carateres '?' e à direita).

O pacote de recursos GATK é uma coleção de arquivos padrão para trabalhar com dados de resequenciamento humano com o GATK.

Nota

A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Data source

Este conjunto de dados é um espelho do arquivo de dados em https://gatk.broadinstitute.org/hc/articles/360035890811-Resource-bundle

Volumes de dados e frequência de atualização

  1. datasetgatkbestpractices : 542 GB
  2. datasetgatklegacybundles : 61 GB
  3. datasetgatktestdata : 2 TB
  4. conjunto de dadospublicbroadref : 477 GB
  5. conjunto de dadosbroadpublic : 3 TB

Os conjuntos de dados são atualizados mensalmente durante a primeira semana de cada mês.

Localização de armazenamento

Este conjunto de dados está armazenado nas regiões E.U.A. Oeste 2 e E.U.A. Centro-Oeste do Azure. A alocação de recursos de computação nas regiões E.U.A. Oeste 2 ou E.U.A. Centro-Oeste é recomendada por questões de afinidade.

Acesso a Dados

  1. DataSetGatkBestPractices

    Oeste dos EUA 2: 'https://datasetgatkbestpractices.blob.core.windows.net/dataset'

    Centro-Oeste dos EUA: 'https://datasetgatkbestpractices-secondary.blob.core.windows.net/dataset'

    Token de SAS: ?sv=2020-04-08&si=prod&sr=c&sig=6SaDfKtXAIfdpO%2BkvNA%2FsTNmNij%2Byh%2F%2F%2Bf98WAUqs7I%3D

  2. DataSetGatikLegacyBundles

    Oeste dos EUA 2: 'https://datasetgatklegacybundles.blob.core.windows.net/dataset'

    Centro-Oeste dos EUA: 'https://datasetgatklegacybundles-secondary.blob.core.windows.net/dataset'

    Token de SAS: ?sv=2020-04-08&si=prod&sr=c&sig=xBfxOPBqHKUCszzwbNCBYF0k9osTQjKnZbEjXCW7gU0%3D

  3. DataSetGatkTestData

    Oeste dos EUA 2: 'https://datasetgatktestdata.blob.core.windows.net/dataset'

    Centro-Oeste dos EUA: 'https://datasetgatktestdata-secondary.blob.core.windows.net/dataset'

    Token de SAS: ?sv=2020-04-08&si=prod&sr=c&sig=fzLts1Q2vKjuvR7g50vE4HteEHBxTcJbNvf%2FZCeDMO4%3D

  4. conjunto de dadospublicbroadref

    Oeste dos EUA 2: 'https://datasetpublicbroadref.blob.core.windows.net/dataset'

    Centro-Oeste dos EUA: 'https://datasetpublicbroadref-secondary.blob.core.windows.net/dataset'

    Token de SAS: ?sv=2020-04-08&si=prod&sr=c&sig=DQxmjB4D1lAfOW9AxIWbXwZx6ksbwjlNkixw597JnvQ%3D

    Centro-Sul dos EUA: 'https://datasetpublicbroadrefsc.blob.core.windows.net/dataset'

    Token SAS: ?sv=2023-01-03&st=2024-02-12T19%3A56%3A11Z&se=2029-02-13T19%3A56%3A00Z&sr=c&sp=rl&sig=oGiNUGZ08PaabHVNtIiVEpJ1kcyqcL6ZadQcuN2ns%2FM%3D

  5. conjunto de dadosbroadpublic

    Oeste dos EUA 2: 'https://datasetbroadpublic.blob.core.windows.net/dataset'

    Centro-Oeste dos EUA: 'https://datasetbroadpublic-secondary.blob.core.windows.net/dataset'

    Token de SAS: ?sv=2020-04-08&si=prod&sr=c&sig=u%2Bg2Ab7WKZEGiAkwlj6nKiEeZ5wdoJb10Az7uUwis%2Fg%3D

    Centro-Sul dos EUA: 'https://datasetbroadpublicsc.blob.core.windows.net/dataset'

    Token SAS: ?sv=2023-01-03&st=2024-02-12T19%3A58%3A33Z&se=2029-02-13T19%3A58%3A00Z&sr=c&sp=rl&sig=C2lDhe1uwu%2FJnC9rbQO65G6%2BdEUQ%2Fl0VheXrlnIQVAs%3D

Termos de Utilização

Visite o site oficial do pacote de recursos GATK.

Contacto

Visite o site oficial do pacote de recursos GATK.

Próximos passos

Exiba o restante dos conjuntos de dados no catálogo Open Datasets.