StochastiQdata

Documentation — Prédiction Prime Assurance Santé

Référence complète pour utiliser ce dataset

Santé Pricing
Retour au dataset

Description

Dataset de tarification assurance santé avec variables de risque (âge, antécédents, conditions chroniques). Modélisation de la prime pure et segmentation des risques.

Source

Kaggle

Lignes

50 000

Colonnes

11

Taille

Licence

cc0

Variable cible

PremiumPrice

Date création

10/03/2026

Format

CSV

Domaines

Santé, Pricing

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/a403f03f-2a8d-4800-a2ae-299f24f50e04/79c1d3d0-5828-4e20-8d99-3a9ad31595e3.csv")

# Aperçu rapide
print(df.shape)        # (50000, 11)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["PremiumPrice"])
y = df["PremiumPrice"]

Citation & Licence

Licence

cc0

Format BibTeX

@dataset{pr_diction_prime_assurance_sant_2026,
  title  = {Prédiction Prime Assurance Santé},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/a403f03f-2a8d-4800-a2ae-299f24f50e04},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Prédiction Prime Assurance Santé [Dataset].
  https://stochastiqdata.com/modeling/a403f03f-2a8d-4800-a2ae-299f24f50e04