Conjunto de dados sobre diabetes

O conjunto de dados Diabetes tem 442 amostras com 10 funcionalidades, o que faz com que seja ideal para começar a trabalhar com algoritmos de aprendizagem automática. É um dos conjuntos de dados de brinquedos Scikit Learn mais populares.

Descrição | original do conjunto de dados Arquivo de dados original

Nota

A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Colunas

Name Tipo de dados Exclusivo Values (sample)
IDADE bigint 58 53 60
BMI duplo 163 24.1 23.5
BP duplo 100 93.0 83.0
S1 bigint 141 162 184
S2 duplo 302 125.8 114.8
S3 duplo 63 46.0 38.0
S4 duplo 66 3.0 4.0
S5 duplo 184 4.4427 4.3041
S6 bigint 56 92 96
SEX bigint 2 1 2
Y bigint 214 72 200

Pré-visualizar

IDADE SEX BMI BP S1 S2 S3 S4 S5 S6 Y
59 2 32.1 101 157 93.2 38 4 4.8598 87 151
48 1 21.6 87 183 103.2 70 3 3.8918 69 75
72 2 30,5 93 156 93.6 41 4 4.6728 85 141
24 1 25,3 84 198 131.4 40 5 4.8903 89 206
50 1 23 101 192 125.4 52 4 4.2905 80 135
23 1 22.6 89 139 64.8 61 2 4.1897 68 97
36 2 22 90 160 99,6 50 3 3.9512 82 138
66 2 26,2 114 255 185 56 4.55 4.2485 92 63
60 2 32.1 83 179 119.4 42 4 4.4773 94 110
29 1 30 85 180 93,4 43 4 5.3845 88 310

Acesso a dados

Use os exemplos de código a seguir para acessar esse conjunto de dados no Azure Notebooks, Azure Databricks ou Azure Synapse.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Amostra não disponível para esta combinação de plataforma/pacote.

Próximos passos

Exiba o restante dos conjuntos de dados no catálogo Open Datasets.