Résiliation Clients Carte de Crédit
Kaggle10 127 clients bancaires avec indicateur d'attrition (churn). 19 variables : solde, utilisation, transactions, contacts, historique. Modélisation de la fidélisation client et prédiction de l'attrition bancaire.
Uploader le fichier (CSV, Parquet, Excel — max 50 MB)
Score qualité — 0/100
- · Complétude des métadonnées
- · Taux de valeurs nulles
- · Présence d'un dictionnaire
- · Avis et téléchargements
- · Disponibilité des benchmarks
Informations sur les données
10 127
Lignes
23
Colonnes
1.44
MB
0
Avis
Variable cible
Attrition_Flag
Licence
CC0 1.0 (domaine public)
Intégrité SHA256
c91b525a2a6755a1b0b80dad1d0d008ca97ec4df34552c8f47ffa12b6184b779
Ce que vous pouvez apprendre avec ce dataset
Compétences techniques
- Exploration et analyse de données
- Modélisation prédictive
- Validation croisée et évaluation des modèles
Applications métier
- Analyse de données actuarielles
- Prise de décision data-driven
Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir
Statistiques & Profil des données
Distributions des variables
Matrice de corrélation (variables numériques)
Visualisations des données
Basées sur les données réelles du dataset
Parcours data complet — de A à Z
Suivez chaque étape du travail data science appliqué sur ce dataset.
Actions concrètes
- Importer le dataset
- Analyser les types et dimensions
- Identifier la variable cible
Librairies & outils
Exemple de code
df = pd.read_csv("dataset.csv")
print(df.shape, df.dtypes)
Actions concrètes
- Gérer les NaN
- Supprimer les outliers
- Encoder les catégories
Librairies & outils
Exemple de code
df.fillna(df.median()) df = df[df["value"] < df["value"].quantile(0.99)]
Actions concrètes
- Statistiques descriptives
- Matrices de corrélation
- Visualisations
Librairies & outils
Exemple de code
import seaborn as sns sns.heatmap(df.corr(), annot=True) df.describe()
Actions concrètes
- Choisir les features
- Entraîner baseline
- Optimiser les hyperparamètres
Librairies & outils
Exemple de code
from sklearn.ensemble import GradientBoostingRegressor model = GradientBoostingRegressor().fit(X_train, y_train)
Actions concrètes
- Calculer RMSE, MAE, Gini
- Courbes de lift
- SHAP pour l'interprétabilité
Librairies & outils
Exemple de code
from sklearn.metrics import mean_squared_error rmse = mean_squared_error(y_test, y_pred, squared=False)
Actions concrètes
- Rédiger le rapport technique
- Exporter le modèle
- Mettre en place le monitoring
Librairies & outils
Exemple de code
import joblib joblib.dump(model, "model_v1.pkl")
Accès au dataset
import pandas as pd # Chargement direct depuis StochastiQdata url = "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/e30ae10d-1d6b-451a-aae3-02e393c7393e/4c8bd254-0c1e-4afb-8f35-9799ab94f674.csv" df = pd.read_csv(url) # Aperçu print(df.shape) # (10 127 lignes, 23 colonnes) print(df.head())
Benchmarks — Performance des modèles
Aucun benchmark disponible pour ce dataset.
Soyez le premier à soumettre vos résultats !
Modèles
Aucun modèle affilié pour le moment.
Soyez le premier à partager un modèle entraîné sur ce dataset.
Notebooks
Aucun notebook disponible pour ce dataset.
Partagez votre analyse et contribuez à la communauté !
Avis de la communauté
Aucun avis pour ce dataset.
Soyez le premier à donner votre avis !
Questions à explorer avec ce dataset
Quelles sont les variables les plus prédictives de la variable cible ?
Existe-t-il des corrélations fortes entre variables pouvant induire de la multicolinéarité ?
Quel algorithme (GLM, GBM, Random Forest) donne les meilleures performances ?
Comment traiter les valeurs aberrantes identifiées dans les statistiques ?
La variable cible nécessite-t-elle une transformation (log, Box-Cox) ?
Quelle stratégie de validation croisée est la plus adaptée ?
Découvrez plus de cas d'usage et méthodologies sur notre page Modélisation
Voir tous les parcoursVous aimerez aussi
Citer ce dataset
Historique des versions 1 version
Seed initial : BankChurners.csv