Données Historiques S&P 500
KagglePrix historiques de toutes les actions du S&P 500 depuis 1966. Colonnes : date, ouverture, fermeture, plus haut, plus bas, volume. Calcul de VaR, CVaR, volatilité, corrélations et stress-tests.
Uploader le fichier (CSV, Parquet, Excel — max 50 MB)
Score qualité — 0/100
- · Complétude des métadonnées
- · Taux de valeurs nulles
- · Présence d'un dictionnaire
- · Avis et téléchargements
- · Disponibilité des benchmarks
Informations sur les données
619 040
Lignes
7
Colonnes
57.51
MB
0
Avis
Variable cible
close
Licence
CC0 1.0 (domaine public)
Intégrité SHA256
6aea253cd19de60b568143991aaf1fa482456565c389205658d236e595e716cf
Ce que vous pouvez apprendre avec ce dataset
Compétences techniques
- Exploration et analyse de données
- Modélisation prédictive
- Validation croisée et évaluation des modèles
Applications métier
- Analyse de données actuarielles
- Prise de décision data-driven
Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir
Statistiques & Profil des données
Distributions des variables
Matrice de corrélation (variables numériques)
Visualisations des données
Basées sur les données réelles du dataset
Parcours data complet — de A à Z
Suivez chaque étape du travail data science appliqué sur ce dataset.
Actions concrètes
- Importer le dataset
- Analyser les types et dimensions
- Identifier la variable cible
Librairies & outils
Exemple de code
df = pd.read_csv("dataset.csv")
print(df.shape, df.dtypes)
Actions concrètes
- Gérer les NaN
- Supprimer les outliers
- Encoder les catégories
Librairies & outils
Exemple de code
df.fillna(df.median()) df = df[df["value"] < df["value"].quantile(0.99)]
Actions concrètes
- Statistiques descriptives
- Matrices de corrélation
- Visualisations
Librairies & outils
Exemple de code
import seaborn as sns sns.heatmap(df.corr(), annot=True) df.describe()
Actions concrètes
- Choisir les features
- Entraîner baseline
- Optimiser les hyperparamètres
Librairies & outils
Exemple de code
from sklearn.ensemble import GradientBoostingRegressor model = GradientBoostingRegressor().fit(X_train, y_train)
Actions concrètes
- Calculer RMSE, MAE, Gini
- Courbes de lift
- SHAP pour l'interprétabilité
Librairies & outils
Exemple de code
from sklearn.metrics import mean_squared_error rmse = mean_squared_error(y_test, y_pred, squared=False)
Actions concrètes
- Rédiger le rapport technique
- Exporter le modèle
- Mettre en place le monitoring
Librairies & outils
Exemple de code
import joblib joblib.dump(model, "model_v1.pkl")
Accès au dataset
import pandas as pd # Chargement direct depuis StochastiQdata url = "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/2f6ffa51-bbad-41b9-a198-3ef8372d3c4e/a2ab5b90-e0cd-4d37-b2f2-fbf975ae01dd.csv" df = pd.read_csv(url) # Aperçu print(df.shape) # (619 040 lignes, 7 colonnes) print(df.head())
Benchmarks — Performance des modèles
Aucun benchmark disponible pour ce dataset.
Soyez le premier à soumettre vos résultats !
Modèles
Aucun modèle affilié pour le moment.
Soyez le premier à partager un modèle entraîné sur ce dataset.
Notebooks
Aucun notebook disponible pour ce dataset.
Partagez votre analyse et contribuez à la communauté !
Avis de la communauté
Aucun avis pour ce dataset.
Soyez le premier à donner votre avis !
Questions à explorer avec ce dataset
Quelles sont les variables les plus prédictives de la variable cible ?
Existe-t-il des corrélations fortes entre variables pouvant induire de la multicolinéarité ?
Quel algorithme (GLM, GBM, Random Forest) donne les meilleures performances ?
Comment traiter les valeurs aberrantes identifiées dans les statistiques ?
La variable cible nécessite-t-elle une transformation (log, Box-Cox) ?
Quelle stratégie de validation croisée est la plus adaptée ?
Découvrez plus de cas d'usage et méthodologies sur notre page Modélisation
Voir tous les parcoursVous aimerez aussi
Citer ce dataset
Historique des versions 1 version
Seed initial : all_stocks_5yr.csv