Contenu pour les étudiants du Master Data Management de Paris School of Business
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

201 lines
7.8 KiB

  1. # GUIDE DU DATA MANAGER (édition 2022)
  2. Ce repo contient des éléments pour les étudiants du master 2 en Data Management de Paris School of Management.
  3. L'objectif finale est de réaliser un livre blanc qui servira de support de cours.
  4. ## Table des matières
  5. 1. [PARTIE 1: Organiser un projet Data](##Partie_1:_Organiser_un_projet_Data)
  6. * [Chapitre 1: Fondements de management de projet](###Chapitre_1:_Fondements_de_management_de_projet)
  7. * [Chapitre 2: Apports d'une démarche Agile](###Chapitre_2:_Apports_d'une_démarche_Agile)
  8. * [Chapitre 3 : Caractéristiques de la méthode SCRUM](###Chapitre_3:_Caractéristiques_de_la_méthode_SCRUM)
  9. 2. [PARTIE 2: Construire une base de données](##PARTIE_2:_Construire_une_base_de_données)
  10. * [Chapitre 4: Base de données relationnelles](###Chapitre_4:_Base_de_données_relationnelles)
  11. * [Chapitre 5: Collecter les données](###Chapitre_5:_Collecter_les_données)
  12. * [Chapitre 6: Préparer les données](###Chapitre_6:_Préparer_les_données)
  13. * [Chapitre 7: Organiser les données](###Chapitre_7:_Organiser_les_données)
  14. * [Chapitre 8: Présenter les données - data paper](###Chapitre_8:_Présenter_les_données_(data_paper))
  15. 3. [PARTIE 3: Analyser les données](##PARTIE_3:_Analyser_les_données)
  16. * [Chapitre 9 : Décrire les données](###Chapitre_9:_Décrire_les_données)
  17. * [Chapitre 10 : Explorer les données](###Chapitre_10:_Explorer_les_données)
  18. * [Chapitre 11 : Trouver un modèle](###Chapitre_11:_Trouver_un_modèle)
  19. * [Chapitre 12 Evaluer un modèle](###Chapitre_12:_Evaluer_un_modèle)
  20. 4. [PARTIE 4: Exploiter les données (BI)](##PARTIE_4:_Exploiter_les_données_(BI))
  21. * [Chapitre 13 : Concevoir un indicateur de performanace](###Chapitre_13:_Concevoir_un_indicateur_de_performanace)
  22. * [Chapitre 14 : Construire le tableau de bord](###Chapitre_14:_Construire_le_tableau_de_bord )
  23. ## Partie 1 : Organiser un projet Data
  24. ### Chapitre 1: Fondements de management de projet
  25. * Pourquoi il faut manager un projet ?
  26. * Qu’est-ce qu’un projet ?
  27. * Qu’est-ce que manager un projet
  28. * Quels sont les cycles de gestion de projet ?
  29. * Qu’est-ce que l’organigramme des tâches d’un projet ?
  30. * Comment maîtriser les délais ?
  31. * Qu’est-ce qu’un diagramme de GANTT ?
  32. * Qu’est-ce qu’un diagramme de PERT ?
  33. * Comment allouer les ressources d’un projet ?
  34. * Qu’est-ce qu’un cahier des charges fonctionnelles ?
  35. ### Chapitre 2: Apports d'une démarche Agile
  36. * Pourquoi passer à une méthode agile pour gérer un projet ?
  37. * Quelles sont les avantages de la méthode agile ?
  38. * Quels sont les différents types de méthode agile ?
  39. * Quand choisir une méthode agile ?
  40. * Quelles sont les différences entre méthode classique et méthode agile ?
  41. * Qu’est-ce que l’agilité ?
  42. * Comment devenir agile ?
  43. * Qu’est-ce que la méthode SCRUM ?
  44. * Quelles sont les valeurs de la méthode SCRUM ?
  45. * Quelles sont les principes de la méthode SCRUM ?
  46. * Quel est la démarche pour mettre en place une méthode SCRUM ?
  47. ### Chapitre 3 : Caractéristiques de la méthode SCRUM
  48. #### Quel est l'environnement d'un projet avec la méthode SCRUM ?
  49. * A quoi sert le Scrum Master ?
  50. * A quoi sert le Product Owner ?
  51. * A quoi sert l’équipe de développement ?
  52. #### Quels sont les objets d'un projet avec la méthode SCRUM ?
  53. * A quoi servent les Stories (cas d’usage) ?
  54. * Comment organiser les stories ?
  55. * A quoi servent les Product Backlog (carnet de produit) ?
  56. * Comment organiser les backllog ?
  57. #### Quels sont les évènements d'un projet avec la méthode SCRUM ?
  58. * Qu’est-ce qu’un Scrum meeting ?
  59. * Qu’est-ce qu’un Sprint ?
  60. * Comment organiser un sprint ?
  61. * Qu’est-ce qu’un Sprint Review ?
  62. #### Quels sont les outils pour déployer une méthode Scrum ?
  63. * Comment utiliser Discord pour gérer un projet ?
  64. * Comment utiliser Trello pour gérer un projet ?
  65. * Existe-il une solution gratuite à Jira Software ?
  66. * A quoi sert un système de versionning (Git) ?
  67. * Comment utiliser Gitea pour gérer les livrables ?
  68. ## PARTIE 2: Construire une base de données
  69. ### Chapitre 4: Base de données relationnelles
  70. #### Projet
  71. * le contexte
  72. * la mission
  73. * le livrable
  74. #### Tachés réalisées
  75. * l'organisation du projet : l'environnement, les objets, les évènements, les outils
  76. * la préparation du Sprint 1 : objectifs, acteurs, tâches
  77. #### Ce qu'il faut retenir
  78. * Qu'est-ce qu'une donnée ?
  79. * Qu'est-ce qu'une base de données ?
  80. * Qu'est-ce qu'un système de gestion de base de données (SGBD) ?
  81. ### Chapitre 5: Collecter les données
  82. #### Présentation du Sprint
  83. * objectifs
  84. * acteurs
  85. * évènements
  86. * support et outils utilisés
  87. #### Tachés réalisées
  88. * identifier des sources de données
  89. * sélectionner des jeux de données
  90. * collecter les données
  91. #### Résultats obtenus
  92. #### Difficultés rencontrées
  93. #### Ce qu'il faut retenir
  94. * Qu'est-ce que l'open data ?
  95. * Qu'est-ce que le webscraping ?
  96. * Comment collecter des données sur le web ?
  97. ### Chapitre 6: Préparer les données
  98. #### Présentation du Sprint
  99. * objectifs
  100. * acteurs
  101. * évènements
  102. * support et outils utilisés
  103. #### Tachés réalisées
  104. * présenter les jeux de données
  105. * descrire des variables
  106. * transformer des variables
  107. * indexer le jeu de données
  108. #### Résultats obtenus
  109. #### Difficultés rencontrées
  110. #### Ce qu'il faut retenir
  111. * Qu'est-ce qu'une clé primaire ?
  112. * Comment réaliser une jointure entre 2 tables de données ?
  113. ### Chapitre 7: Organiser les données
  114. #### Présentation du Sprint
  115. * objectifs
  116. * acteurs
  117. * évènements
  118. * support et outils utilisés
  119. #### Tachés réalisées
  120. * formater les variables (convertir) : dates, adresses, montant, ...
  121. * nettoyer la base de données : doublons, valeurs extêmes ou abbérentes, valeurs manquantes, ...
  122. * organiser les variables dans des tables
  123. * concevoir une architecture de la base de données
  124. #### Résultats obtenus
  125. #### Difficultés rencontrées
  126. #### Ce qu'il faut retenir
  127. * Qu'est-ce qu'une architecture de base de données ?
  128. ### Chapitre 8: Présenter les données (data paper)
  129. #### Présentation du Sprint
  130. * objectifs
  131. * acteurs
  132. * évènements
  133. * support et outils utilisés
  134. #### Tachés réalisées
  135. * Résumé
  136. * Contexte et objectifs
  137. * démarche et organisation de la base de données
  138. * Description des variables
  139. * Exploitation et usages
  140. #### Difficultés rencontrées
  141. #### Ce qu'il faut retenir
  142. * Qu'est-ce qu'un data paper ?
  143. ## PARTIE 3: Analyser les données
  144. ### Chapitre 9 : Décrire les données
  145. * échantillonage
  146. * la population et l'échantillon
  147. * effectif et fréquence
  148. * les techniques d'échantillonage (par commodité, par hasard, par quota)
  149. * inférences statitiques
  150. * les différents types de données
  151. * les données quantitatives
  152. * les données qualitatives
  153. * la transformation de données qualitatives en données quantitatives
  154. * variables à expliquer et variables explicatives
  155. * les mesures de tendance centrale
  156. * le mode
  157. * la médiane
  158. * la moyenne
  159. * les mesures de dispersion et de position
  160. * l'écart-types
  161. * la variance
  162. * l'étendue
  163. * le minimum
  164. * le maximum
  165. * le percentile
  166. ### Chapitre 10 : Explorer les données
  167. * Relations entre 2 variables
  168. * 2 variables numériques
  169. * 2 variables catégorielles
  170. * 1 variable numérique et 1 variable catégorielle
  171. * Analyse des corrélations
  172. * Coefficient de corrélation de Pearson et de Spearman
  173. * Tableau des correlations
  174. * Analyse de la variance (ANOVA)
  175. * Analyse factorielle et réduction des dimensions
  176. ### Chapitre 11 : Trouver un modèle
  177. * La régression linéaire
  178. * La régression logistique
  179. ### Chapitre 12 Evaluer un modèle
  180. * évaluer les modèles de régression linéaire
  181. * le coefficient de détermination (R2)
  182. * l'erreur quadratique moyenne (MSE)
  183. * évaluer les modèles de régression logistique
  184. * la matrice de confusion
  185. ## PARTIE 4: Exploiter les données (BI)
  186. ### Chapitre 13 : Concevoir un indicateur de performanace
  187. ### Chapitre 14 : Construire le tableau de bord
  188. *