StochastiQdata

Documentation — Indicateurs Santé Diabète (CDC BRFSS)

Référence complète pour utiliser ce dataset

Santé ML
Retour au dataset

Description

253 680 réponses à l'enquête CDC BRFSS 2015 avec indicateur diabète et 21 variables de santé. Idéal pour la classification risque diabète, modélisation de prévalence et segmentation risque santé.

Source

Kaggle

Lignes

253 680

Colonnes

22

Taille

Licence

cc0

Variable cible

Diabetes_binary

Date création

10/03/2026

Format

CSV

Domaines

Santé, ML

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/2bda6025-daf4-4aea-9d9f-20cb92856a7e/9700ad76-2570-471a-a628-f8cc67bae730.csv")

# Aperçu rapide
print(df.shape)        # (253680, 22)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["Diabetes_binary"])
y = df["Diabetes_binary"]

Citation & Licence

Licence

cc0

Format BibTeX

@dataset{indicateurs_sant_diab_te_cdc_brfss_2026,
  title  = {Indicateurs Santé Diabète (CDC BRFSS)},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/2bda6025-daf4-4aea-9d9f-20cb92856a7e},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Indicateurs Santé Diabète (CDC BRFSS) [Dataset].
  https://stochastiqdata.com/modeling/2bda6025-daf4-4aea-9d9f-20cb92856a7e