StochastiQdata

Sinistres Assurance Auto

Kaggle

10 302 contrats d'assurance automobile avec variables sociodémographiques (âge, revenu, éducation, état civil) et historique de sinistres. Idéal pour la segmentation clientèle, la propension au sinistre et la détection de fraude.

IARD Pricing Fraude

Score qualité — 0/100

  • · Complétude des métadonnées
  • · Taux de valeurs nulles
  • · Présence d'un dictionnaire
  • · Avis et téléchargements
  • · Disponibilité des benchmarks
0

Informations sur les données

10 302

Lignes

19

Colonnes

1.21

MB

0

Avis

Variable cible

OUTCOME

Licence

CC0 1.0 (domaine public)

Intégrité SHA256

f33708d6e65178b2b18576ba678b82976ff766dadb3b94077dc013f464298971

Ce que vous pouvez apprendre avec ce dataset

Compétences techniques

  • Modélisation GLM (Poisson, Gamma, Tweedie)
  • Calcul de la prime pure et technique
  • Classification binaire et gestion du déséquilibre
  • Feature engineering pour détection d'anomalies
  • Validation croisée et évaluation des modèles

Applications métier

  • Tarification automobile ou MRH
  • Analyse de sinistralité
  • Système de scoring anti-fraude
  • Priorisation des dossiers à contrôler

Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir

Statistiques & Profil des données

Distributions des variables

Matrice de corrélation (variables numériques)

−1 (corrélation négative) → +1 (corrélation positive)

Visualisations des données

Basées sur les données réelles du dataset

Chargement…