Contenu pour les étudiants du Master Data Management de Paris School of Business
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

210 lines
8.4 KiB

  1. # GUIDE DU DATA MANAGER (édition 2022)
  2. Ce repo contient des éléments pour les étudiants du master 2 en Data Management de Paris School of Management.
  3. L'objectif finale est de réaliser un livre blanc qui servira de support de cours.
  4. ## Sommaire
  5. 1. [PARTIE 1: Organiser un projet Data](##Partie_1:_Organiser_un_projet_Data)
  6. * [Chapitre 1: Fondements de management de projet](###Chapitre_1:_Fondements_de_management_de_projet)
  7. * [Chapitre 2: Apports d'une démarche Agile](###Chapitre_2:_Apports_d'une_démarche_Agile)
  8. * [Chapitre 3 : Caractéristiques de la méthode SCRUM](###Chapitre_3:_Caractéristiques_de_la_méthode_SCRUM)
  9. 2. [PARTIE 2: Construire une base de données](##PARTIE_2:_Construire_une_base_de_données)
  10. * [Chapitre 4: Base de données relationnelles](###Chapitre_4:_Base_de_données_relationnelles)
  11. * [Chapitre 5: Collecter les données](###Chapitre_5:_Collecter_les_données)
  12. * [Chapitre 6: Préparer les données](###Chapitre_6:_Préparer_les_données)
  13. * [Chapitre 7: Organiser les données](###Chapitre_7:_Organiser_les_données)
  14. * [Chapitre 8: Présenter les données - data paper](###Chapitre_8:_Présenter_les_données_(data_paper))
  15. 3. [PARTIE 3: Analyser les données](##PARTIE_3:_Analyser_les_données)
  16. * [Chapitre 9 : Décrire les données](###Chapitre_9:_Décrire_les_données)
  17. * [Chapitre 10 : Explorer les données](###Chapitre_10:_Explorer_les_données)
  18. * [Chapitre 11 : Trouver un modèle](###Chapitre_11:_Trouver_un_modèle)
  19. * [Chapitre 12 : Evaluer un modèle](###Chapitre_12:_Evaluer_un_modèle)
  20. 4. [PARTIE 4: Exploiter les données (BI)](##PARTIE_4:_Exploiter_les_données_(BI))
  21. * [Chapitre 13 : Définir les indicateurs de performanace](###Chapitre_14:_Definir_les_indicateurs_de_performanace)
  22. * [Chapitre 14 : Construire le tableau de bord](###Chapitre_13:_Construire_le_tableau_de_bord )
  23. 5. [PARTIE 5: Utiliser l'intelligence artifcielle (machine learning)](##PARTIE_5:_Utiliser_l'intelligence_artifcielle)
  24. * [Chapitre 15 : Apprentissage supervisé](###Chapitre_15:_Apprentissage_supervisé)
  25. * [Chapitre 16 : Apprentissage non supervisé](###Chapitre_15:_Apprentissage_non_supervisé)
  26. ## Partie 1 : Organiser un projet Data
  27. ### Chapitre 1: Fondements de management de projet
  28. * Pourquoi il faut manager un projet ?
  29. * Qu’est-ce qu’un projet ?
  30. * Qu’est-ce que manager un projet
  31. * Quels sont les cycles de gestion de projet ?
  32. * Qu’est-ce que l’organigramme des tâches d’un projet ?
  33. * Comment maîtriser les délais ?
  34. * Qu’est-ce qu’un diagramme de GANTT ?
  35. * Qu’est-ce qu’un diagramme de PERT ?
  36. * Comment allouer les ressources d’un projet ?
  37. * Qu’est-ce qu’un cahier des charges fonctionnelles ?
  38. ### Chapitre 2: Apports d'une démarche Agile
  39. * Pourquoi passer à une méthode agile pour gérer un projet ?
  40. * Quelles sont les avantages de la méthode agile ?
  41. * Quels sont les différents types de méthode agile ?
  42. * Quand choisir une méthode agile ?
  43. * Quelles sont les différences entre méthode classique et méthode agile ?
  44. * Qu’est-ce que l’agilité ?
  45. * Comment devenir agile ?
  46. * Qu’est-ce que la méthode SCRUM ?
  47. * Quelles sont les valeurs de la méthode SCRUM ?
  48. * Quelles sont les principes de la méthode SCRUM ?
  49. * Quel est la démarche pour mettre en place une méthode SCRUM ?
  50. ### Chapitre 3 : Caractéristiques de la méthode SCRUM
  51. #### Quel est l'environnement d'un projet avec la méthode SCRUM ?
  52. * A quoi sert le Scrum Master ?
  53. * A quoi sert le Product Owner ?
  54. * A quoi sert l’équipe de développement ?
  55. #### Quels sont les objets d'un projet avec la méthode SCRUM ?
  56. * A quoi servent les Stories (cas d’usage) ?
  57. * Comment organiser les stories ?
  58. * A quoi servent les Product Backlog (carnet de produit) ?
  59. * Comment organiser les backllog ?
  60. #### Quels sont les évènements d'un projet avec la méthode SCRUM ?
  61. * Qu’est-ce qu’un Scrum meeting ?
  62. * Qu’est-ce qu’un Sprint ?
  63. * Comment organiser un sprint ?
  64. * Qu’est-ce qu’un Sprint Review ?
  65. #### Quels sont les outils pour déployer une méthode Scrum ?
  66. * Comment utiliser Discord pour gérer un projet ?
  67. * Comment utiliser Trello pour gérer un projet ?
  68. * Existe-il une solution gratuite à Jira Software ?
  69. * A quoi sert un système de versionning (Git) ?
  70. * Comment utiliser Gitea pour gérer les livrables ?
  71. ## PARTIE 2: Construire une base de données
  72. ### Chapitre 4: Base de données relationnelles
  73. #### Projet
  74. * le contexte
  75. * la mission
  76. * le livrable
  77. #### Tachés réalisées
  78. * l'organisation du projet : l'environnement, les objets, les évènements, les outils
  79. * la préparation du Sprint 1 : objectifs, acteurs, tâches
  80. #### Ce qu'il faut retenir
  81. * Qu'est-ce qu'une donnée ?
  82. * Qu'est-ce qu'une base de données ?
  83. * Qu'est-ce qu'un système de gestion de base de données (SGBD) ?
  84. ### Chapitre 5: Collecter les données
  85. #### Présentation du Sprint
  86. * objectifs
  87. * acteurs
  88. * évènements
  89. * support et outils utilisés
  90. #### Tachés réalisées
  91. * identifier des sources de données
  92. * sélectionner des jeux de données
  93. * collecter les données
  94. #### Résultats obtenus
  95. #### Difficultés rencontrées
  96. #### Ce qu'il faut retenir
  97. * Qu'est-ce que l'open data ?
  98. * Qu'est-ce que le webscraping ?
  99. * Comment collecter des données sur le web ?
  100. ### Chapitre 6: Préparer les données
  101. #### Présentation du Sprint
  102. * objectifs
  103. * acteurs
  104. * évènements
  105. * support et outils utilisés
  106. #### Tachés réalisées
  107. * présenter les jeux de données
  108. * descrire des variables
  109. * transformer des variables
  110. * indexer le jeu de données
  111. #### Résultats obtenus
  112. #### Difficultés rencontrées
  113. #### Ce qu'il faut retenir
  114. * Qu'est-ce qu'une clé primaire ?
  115. * Comment réaliser une jointure entre 2 tables de données ?
  116. ### Chapitre 7: Organiser les données
  117. #### Présentation du Sprint
  118. * objectifs
  119. * acteurs
  120. * évènements
  121. * support et outils utilisés
  122. #### Tachés réalisées
  123. * formater les variables (convertir) : dates, adresses, montant, ...
  124. * nettoyer la base de données : doublons, valeurs extêmes ou abbérentes, valeurs manquantes, ...
  125. * organiser les variables dans des tables
  126. * concevoir une architecture de la base de données
  127. #### Résultats obtenus
  128. #### Difficultés rencontrées
  129. #### Ce qu'il faut retenir
  130. * Qu'est-ce qu'une architecture de base de données ?
  131. ### Chapitre 8: Présenter les données (data paper)
  132. #### Présentation du Sprint
  133. * objectifs
  134. * acteurs
  135. * évènements
  136. * support et outils utilisés
  137. #### Tachés réalisées
  138. * Résumé
  139. * Contexte et objectifs
  140. * démarche et organisation de la base de données
  141. * Description des variables
  142. * Exploitation et usages
  143. #### Difficultés rencontrées
  144. #### Ce qu'il faut retenir
  145. * Qu'est-ce qu'un data paper ?
  146. ## PARTIE 3: Analyser les données
  147. ### Chapitre 9 : Décrire les données
  148. * les différents types de données
  149. * les données quantitatives
  150. * les données qualitatives
  151. * la transformation de données qualitatives en données quantitatives
  152. * variables à expliquer et variables explicatives
  153. * les mesures de tendance centrale
  154. * le mode
  155. * la médiane
  156. * la moyenne
  157. * les mesures de dispersion et de position
  158. * l'écart-types
  159. * la variance
  160. * l'étendue
  161. * le minimum
  162. * le maximum
  163. * le percentile
  164. ### Chapitre 10 : Explorer les données
  165. * Relations entre 2 variables
  166. * 2 variables numériques
  167. * 2 variables catégorielles
  168. * 1 variable numérique et 1 variable catégorielle
  169. * Analyse des corrélations
  170. * Coefficient de corrélation de Pearson et de Spearman
  171. * Tableau des correlations
  172. * Analyse de la variance (ANOVA)
  173. * Analyse factorielle et réduction des dimensions
  174. ### Chapitre 11 : Trouver un modèle
  175. * La régression linéaire
  176. * La régression logistique
  177. ### Chapitre 12 Evaluer un modèle
  178. * évaluer les modèles de régression linéaire
  179. * le coefficient de détermination (R2)
  180. * l'erreur quadratique moyenne (MSE)
  181. * évaluer les modèles de régression logistique
  182. * la matrice de confusion
  183. ## PARTIE 4: Exploiter les données (BI)
  184. ### Chapitre 13 : Définir les indicateurs de performanace
  185. ### Chapitre 14 : Construire le tableau de bord
  186. ## PARTIE 5: Utiliser l'intelligence artifcielle (machine learning)
  187. ### Chapitre 15 : Apprentissage supervisé
  188. * Qu'est-ce que l'apprentissage supervisé ?
  189. * Comment prédire grâce à l'apprentissage supervisé ?
  190. * Quels sont les modèles d'apprentissage supervisé ?
  191. * Comment optimiser une prédiction en faisant du "feature engineering" ?
  192. * Comment évaluer un modèle de prédiction ?
  193. ### Chapitre 16 : Apprentissage non supervisé