Contenu pour les étudiants du Master Data Management de Paris School of Business

Olivier Mamavi d16a82b15c Mise à jour de 'README.md'		3 years ago
SCRUM	Ajouter 'SCRUM/livre blanc'	4 years ago
LICENSE	Initial commit	4 years ago
README.md	Mise à jour de 'README.md'	3 years ago

README.md

GUIDE DU DATA MANAGER (édition 2022)

Ce repo contient des éléments pour les étudiants du master 2 en Data Management de Paris School of Management.

L'objectif finale est de réaliser un livre blanc qui servira de support de cours.

Sommaire

PARTIE 1: Organiser un projet Data
PARTIE 2: Construire une base de données
PARTIE 3: Analyser les données
PARTIE 4: Exploiter les données (Business Intelligence)
- Chapitre 13 : Définir les indicateurs de performanace
- Chapitre 14 : Construire le tableau de bord
PARTIE 5: Utiliser l'intelligence artifcielle (Machine Learning)
- Chapitre 15 : Apprentissage supervisé
- Chapitre 16 : Apprentissage non supervisé

Partie 1 : Organiser un projet Data

Chapitre 1: Fondements de management de projet

Pourquoi il faut manager un projet ?
Qu’est-ce qu’un projet ?
Qu’est-ce que manager un projet
Quels sont les cycles de gestion de projet ?
Qu’est-ce que l’organigramme des tâches d’un projet ?
Comment maîtriser les délais ?
Qu’est-ce qu’un diagramme de GANTT ?
Qu’est-ce qu’un diagramme de PERT ?
Comment allouer les ressources d’un projet ?
Qu’est-ce qu’un cahier des charges fonctionnelles ?

Chapitre 2: Apports d'une démarche Agile

Pourquoi passer à une méthode agile pour gérer un projet ?
Quelles sont les avantages de la méthode agile ?
Quels sont les différents types de méthode agile ?
Quand choisir une méthode agile ?
Quelles sont les différences entre méthode classique et méthode agile ?
Qu’est-ce que l’agilité ?
Comment devenir agile ?
Qu’est-ce que la méthode SCRUM ?
Quelles sont les valeurs de la méthode SCRUM ?
Quelles sont les principes de la méthode SCRUM ?
Quel est la démarche pour mettre en place une méthode SCRUM ?

Chapitre 3 : Caractéristiques de la méthode SCRUM

Quel est l'environnement d'un projet avec la méthode SCRUM ?

A quoi sert le Scrum Master ?
A quoi sert le Product Owner ?
A quoi sert l’équipe de développement ?

Quels sont les objets d'un projet avec la méthode SCRUM ?

A quoi servent les Stories (cas d’usage) ?
Comment organiser les stories ?
A quoi servent les Product Backlog (carnet de produit) ?
Comment organiser les backllog ?

Quels sont les évènements d'un projet avec la méthode SCRUM ?

Qu’est-ce qu’un Scrum meeting ?
Qu’est-ce qu’un Sprint ?
Comment organiser un sprint ?
Qu’est-ce qu’un Sprint Review ?

Quels sont les outils pour déployer une méthode Scrum ?

Comment utiliser Discord pour gérer un projet ?
Comment utiliser Trello pour gérer un projet ?
Existe-il une solution gratuite à Jira Software ?
A quoi sert un système de versionning (Git) ?
Comment utiliser Gitea pour gérer les livrables ?

PARTIE 2: Construire une base de données

Chapitre 4: Base de données relationnelles

Projet

le contexte
la mission
le livrable

Tachés réalisées

l'organisation du projet : l'environnement, les objets, les évènements, les outils
la préparation du Sprint 1 : objectifs, acteurs, tâches

Ce qu'il faut retenir

Qu'est-ce qu'une donnée ?
Qu'est-ce qu'une base de données ?
Qu'est-ce qu'un système de gestion de base de données (SGBD) ?

Chapitre 5: Collecter les données

Présentation du Sprint

objectifs
acteurs
évènements
support et outils utilisés

Tachés réalisées

identifier des sources de données
sélectionner des jeux de données
collecter les données

Résultats obtenus

Difficultés rencontrées

Ce qu'il faut retenir

Qu'est-ce que l'open data ?
Qu'est-ce que le webscraping ?
Comment collecter des données sur le web ?

Chapitre 6: Préparer les données

Présentation du Sprint

objectifs
acteurs
évènements
support et outils utilisés

Tachés réalisées

présenter les jeux de données
descrire des variables
transformer des variables
indexer le jeu de données

Résultats obtenus

Difficultés rencontrées

Ce qu'il faut retenir

Qu'est-ce qu'une clé primaire ?
Comment réaliser une jointure entre 2 tables de données ?

Chapitre 7: Organiser les données

Présentation du Sprint

objectifs
acteurs
évènements
support et outils utilisés

Tachés réalisées

formater les variables (convertir) : dates, adresses, montant, ...
nettoyer la base de données : doublons, valeurs extêmes ou abbérentes, valeurs manquantes, ...
organiser les variables dans des tables
concevoir une architecture de la base de données

Résultats obtenus

Difficultés rencontrées

Ce qu'il faut retenir

Qu'est-ce qu'une architecture de base de données ?

Chapitre 8: Présenter les données (data paper)

Présentation du Sprint

objectifs
acteurs
évènements
support et outils utilisés

Tachés réalisées

Résumé
Contexte et objectifs
démarche et organisation de la base de données
Description des variables
Exploitation et usages

Difficultés rencontrées

Ce qu'il faut retenir

Qu'est-ce qu'un data paper ?

PARTIE 3: Analyser les données

Chapitre 9 : Décrire les données

les différents types de données
- les données quantitatives
- les données qualitatives
- la transformation de données qualitatives en données quantitatives
- variables à expliquer et variables explicatives
les mesures de tendance centrale
- le mode
- la médiane
- la moyenne
les mesures de dispersion et de position
- l'écart-types
- la variance
- l'étendue
- le minimum
- le maximum
- le percentile

Chapitre 10 : Explorer les données

Relations entre 2 variables
- 2 variables numériques
- 2 variables catégorielles
- 1 variable numérique et 1 variable catégorielle
Analyse des corrélations
- Coefficient de corrélation de Pearson et de Spearman
- Tableau des correlations
Analyse de la variance (ANOVA)
Analyse factorielle et réduction des dimensions

Chapitre 11 : Trouver un modèle

La régression linéaire
La régression logistique

Chapitre 12 Evaluer un modèle

évaluer les modèles de régression linéaire
- le coefficient de détermination (R2)
- l'erreur quadratique moyenne (MSE)
évaluer les modèles de régression logistique
- la matrice de confusion

PARTIE 4: Exploiter les données (BI)

Chapitre 13 : Définir les indicateurs de performanace

Chapitre 14 : Construire le tableau de bord

PARTIE 5: Utiliser l'intelligence artifcielle (Machine Learning)

Chapitre 15 : Apprentissage supervisé

Qu'est-ce que l'apprentissage supervisé ?
Comment faire une prédiction grâce à l'apprentissage supervisé ?
Quels sont les modèles d'apprentissage supervisé ?
Comment optimiser une prédiction en faisant du "feature engineering" ?
Comment évaluer un modèle de prédiction ?

README.md

GUIDE DU DATA MANAGER (édition 2022)

Sommaire

Partie 1 : Organiser un projet Data

Chapitre 1: Fondements de management de projet

Chapitre 2: Apports d'une démarche Agile

Chapitre 3 : Caractéristiques de la méthode SCRUM

Quel est l'environnement d'un projet avec la méthode SCRUM ?

Quels sont les objets d'un projet avec la méthode SCRUM ?

Quels sont les évènements d'un projet avec la méthode SCRUM ?

Quels sont les outils pour déployer une méthode Scrum ?

PARTIE 2: Construire une base de données

Chapitre 4: Base de données relationnelles

Projet

Tachés réalisées

Ce qu'il faut retenir

Chapitre 5: Collecter les données

Présentation du Sprint

Tachés réalisées

Résultats obtenus

Difficultés rencontrées

Ce qu'il faut retenir

Chapitre 6: Préparer les données

Présentation du Sprint

Tachés réalisées

Résultats obtenus

Difficultés rencontrées

Ce qu'il faut retenir

Chapitre 7: Organiser les données

Présentation du Sprint

Tachés réalisées

Résultats obtenus

Difficultés rencontrées

Ce qu'il faut retenir

Chapitre 8: Présenter les données (data paper)

Présentation du Sprint

Tachés réalisées

Difficultés rencontrées

Ce qu'il faut retenir

PARTIE 3: Analyser les données

Chapitre 9 : Décrire les données

Chapitre 10 : Explorer les données

Chapitre 11 : Trouver un modèle

Chapitre 12 Evaluer un modèle

PARTIE 4: Exploiter les données (BI)

Chapitre 13 : Définir les indicateurs de performanace

Chapitre 14 : Construire le tableau de bord

PARTIE 5: Utiliser l'intelligence artifcielle (Machine Learning)

Chapitre 15 : Apprentissage supervisé

Chapitre 16 : Apprentissage non supervisé