Base de dados ImmuneCODE

O banco de™ dados ImmuneCODE, que inclui centenas de milhões de sequências de recetores de células T (TCR) de mais de 1.400 indivíduos expostos ou infetados com o vírus SARS-CoV-2, e mais de 160.000 TCRs específicos para SARS-CoV-2 de alta confiança. A base de dados é acessível gratuitamente. Seus dados podem ser analisados para auxiliar iniciativas globais destinadas a compreender a resposta imune ao vírus SARS-CoV-2 e elaborar novas intervenções. Para saber mais sobre o conjunto de dados, consulte a publicação associada .

Os conjuntos de dados ImmuneCODE mais recentes disponíveis contém: Release 002.

  • Os 1.486 indivíduos expostos ou infetados pelo vírus SARSCoV-2: ImmuneCODE-Repertoires-002.2.
  • Os metadados de exemplo: ImmuneCODE-Repertoire-Tags-002.2.tsv (572 KB) Release 002.2.
  • O SARS-CoV-2-específico de alta confiança (Mais de 160.000): ImmuneCODE-MIRA-Release 002.1.
  • Os metadados de exemplo: ImmuneCODE-Repertoire-Tags-002.2.xlsx (352 KB) Release 002.2.

Nota

A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Data source

Este conjunto de dados é um espelho de https://clients.adaptivebiotech.com/pub/covid-2020

Volumes de dados e frequência de atualização

Este conjunto de dados contém aproximadamente 228 GB de dados e é atualizado diariamente.

Localização de armazenamento

Esse conjunto de dados é armazenado nas regiões do Azure Oeste dos EUA 2. A alocação de recursos de computação no oeste dos EUA 2 é recomendada por afinidade.

Acesso a dados

Oeste dos EUA 2: 'https://dataset1000genomes.blob.core.windows.net/dataset'

Centro-Oeste dos EUA: 'https://dataset1000genomes-secondary.blob.core.windows.net/dataset'

Token de SAS: sv=2019-10-10&si=prod&sr=c&sig=9nzcxaQn0NprMPlSh4RhFQHcXedLQIcFgbERiooHEqM%3D

Termos de utilização

Para saber mais sobre os termos de uso de dados, consulte a publicação e os Termos de Uso.

Contacto

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7418738/

Próximos passos

Exiba o restante dos conjuntos de dados no catálogo Open Datasets.