StochastiQdata

Documentation — Prédiction Sinistres Assurance Auto

Référence complète pour utiliser ce dataset

IARD Pricing
Retour au dataset

Description

58 592 polices avec indicateur de sinistre (0/1). Variables démographiques et comportementales. Cas typique de déséquilibre de classes pour la modélisation de fréquence sinistre.

Source

Kaggle

Lignes

58 592

Colonnes

18

Taille

Licence

cc0

Variable cible

is_claim

Date création

10/03/2026

Format

Domaines

IARD, Pricing

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("URL_DU_FICHIER")

# Aperçu rapide
print(df.shape)        # (58592, 18)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["is_claim"])
y = df["is_claim"]

Citation & Licence

Licence

cc0

Format BibTeX

@dataset{pr_diction_sinistres_assurance_auto_2026,
  title  = {Prédiction Sinistres Assurance Auto},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/e6b5c9c9-eace-4002-b575-7f059b5e7dea},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Prédiction Sinistres Assurance Auto [Dataset].
  https://stochastiqdata.com/modeling/e6b5c9c9-eace-4002-b575-7f059b5e7dea