StochastiQdata

Documentation — Prime Assurance Santé — Impact Tabagisme

Référence complète pour utiliser ce dataset

Santé Pricing GLM
Retour au dataset

Description

Dataset de primes d'assurance santé avec focus sur l'impact du tabagisme et de l'IMC. Modélisation actuarielle de la sinistralité santé et étude des facteurs de risque.

Source

Kaggle

Lignes

50 000

Colonnes

13

Taille

Licence

cc0

Variable cible

PremiumPrice

Date création

10/03/2026

Format

Domaines

Santé, Pricing, GLM

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("URL_DU_FICHIER")

# Aperçu rapide
print(df.shape)        # (50000, 13)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["PremiumPrice"])
y = df["PremiumPrice"]

Citation & Licence

Licence

cc0

Format BibTeX

@dataset{prime_assurance_sant_impact_tabagisme_2026,
  title  = {Prime Assurance Santé — Impact Tabagisme},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/a2cbcf18-f87a-4aa3-a3ea-15b900f9a922},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Prime Assurance Santé — Impact Tabagisme [Dataset].
  https://stochastiqdata.com/modeling/a2cbcf18-f87a-4aa3-a3ea-15b900f9a922