Détection Fraude Paiements en Ligne

Kaggle

6.3 millions de transactions de paiement en ligne avec indicateur de fraude. Incluant type de transaction, montant, soldes initiaux et finaux. Dataset synthétique haute fidélité pour la modélisation de fraude bancaire.

Fraude ML

Open in Kaggle Documentation Comparer Notebooks

Score qualité — 0/100

· Complétude des métadonnées
· Taux de valeurs nulles
· Présence d'un dictionnaire
· Avis et téléchargements
· Disponibilité des benchmarks

Informations sur les données

6 362 620

Lignes

Colonnes

37.16

Avis

Variable cible

isFraud

Période couverte

2020 – ?

Licence

CC BY 4.0

Intégrité SHA256

e10b97f233cb885be1fff3843da9a600

Ce que vous pouvez apprendre avec ce dataset

Compétences techniques

Classification binaire et gestion du déséquilibre
Feature engineering pour détection d'anomalies
Validation croisée et évaluation des modèles

Applications métier

Système de scoring anti-fraude
Priorisation des dossiers à contrôler

Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir

Statistiques & Profil des données

Distributions des variables

Matrice de corrélation (variables numériques)

−1 (corrélation négative) → +1 (corrélation positive)

Visualisations des données

Basées sur les données réelles du dataset

Chargement…

Parcours data complet — de A à Z

Suivez chaque étape du travail data science appliqué sur ce dataset.

Accès au dataset

import pandas as pd

# Chargement direct depuis StochastiQdata
url = "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/34be2e42-53d8-48b4-9c1c-b2e1937775b3/fbec7872-d4b2-4d72-a65d-4dbd76b82509.csv"
df  = pd.read_csv(url)

# Aperçu
print(df.shape)   # (6 362 620 lignes, 10 colonnes)
print(df.head())

library(readr)

# Chargement direct depuis StochastiQdata
url <- "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/34be2e42-53d8-48b4-9c1c-b2e1937775b3/fbec7872-d4b2-4d72-a65d-4dbd76b82509.csv"
df  <- read_csv(url)

# Aperçu
dim(df)
head(df)

curl -L -o "détection_fraude_paiements_en_ligne.csv" \
  "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/34be2e42-53d8-48b4-9c1c-b2e1937775b3/fbec7872-d4b2-4d72-a65d-4dbd76b82509.csv"

Benchmarks — Performance des modèles

Aucun benchmark disponible pour ce dataset.

Soyez le premier à soumettre vos résultats !

Modèles

Chargement des modèles…

Notebooks

Aucun notebook disponible pour ce dataset.

Partagez votre analyse et contribuez à la communauté !

Avis de la communauté

Aucun avis pour ce dataset.

Soyez le premier à donner votre avis !

Donner votre avis

Commentaires

Chargement…

Écrire un commentaire

Questions à explorer avec ce dataset

Quels patterns comportementaux distinguent les déclarations frauduleuses ?

Comment optimiser le seuil de détection (précision vs rappel) selon le coût métier ?

Le déséquilibre de classes impacte-t-il significativement la performance du modèle ?

Quelles techniques de rééchantillonnage (SMOTE, undersampling) donnent les meilleurs résultats ?

Les fraudes sont-elles regroupées géographiquement ou temporellement ?

Comment interpréter les décisions du modèle pour les équipes d'investigation ?

Découvrez plus de cas d'usage et méthodologies sur notre page Modélisation

Voir tous les parcours

Détection Fraude Paiements en Ligne

Informations sur les données

Ce que vous pouvez apprendre avec ce dataset

Compétences techniques

Applications métier

Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir

Statistiques & Profil des données

Distributions des variables

Matrice de corrélation (variables numériques)

Visualisations des données

Parcours data complet — de A à Z

Import & Analyse du déséquilibre

Actions concrètes

Librairies & outils

Exemple de code

Feature Engineering anti-fraude

Actions concrètes

Librairies & outils

Exemple de code

EDA — Patterns de fraude

Actions concrètes

Librairies & outils

Exemple de code

Modélisation & Gestion du déséquilibre

Actions concrètes

Librairies & outils

Exemple de code

Calibration du seuil de décision

Actions concrètes

Librairies & outils

Exemple de code

Déploiement & Monitoring

Actions concrètes

Librairies & outils

Exemple de code

Accès au dataset

Benchmarks — Performance des modèles

Modèles

Soumettre un modèle

Notebooks

Avis de la communauté

Donner votre avis

Commentaires

Écrire un commentaire

Questions à explorer avec ce dataset

Vous aimerez aussi

Citer ce dataset