StochastiQdata

Documentation — Assurance Santé USA

Référence complète pour utiliser ce dataset

Santé Pricing
Retour au dataset

Description

1 338 enregistrements d'assurance santé américaine. Variables similaires au dataset Medical Cost mais avec profil de risque étendu. Idéal pour la régression des primes et l'analyse actuarielle santé.

Source

Kaggle

Lignes

1 338

Colonnes

7

Taille

Licence

cc0

Variable cible

charges

Date création

10/03/2026

Format

CSV

Domaines

Santé, Pricing

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/edd4fc2b-ff03-47fb-8c19-0568479926ce/6a09d978-bc8e-410b-954f-77c27bf457c1.csv")

# Aperçu rapide
print(df.shape)        # (1338, 7)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["charges"])
y = df["charges"]

Citation & Licence

Licence

cc0

Format BibTeX

@dataset{assurance_sant_usa_2026,
  title  = {Assurance Santé USA},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/edd4fc2b-ff03-47fb-8c19-0568479926ce},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Assurance Santé USA [Dataset].
  https://stochastiqdata.com/modeling/edd4fc2b-ff03-47fb-8c19-0568479926ce