Contenu pour les étudiants du Master Data Management de Paris School of Business
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

185 lines
6.3 KiB

  1. # GUIDE DU DATA MANAGER (édition 2022)
  2. Ce repo contient des éléments pour les étudiants du master 2 en Data Management de Paris School of Management.
  3. L'objectif finale est de réaliser un livre blanc qui servira de support pour mes cours.
  4. ## Table des matières
  5. [PARTIE 1: Organiser un projet Data](PARTIE 1: Organiser un projet Data)
  6. ## PARTIE 1: Organiser un projet Data
  7. ### Chapitre 1: Fondements de management de projet
  8. * Pourquoi il faut manager un projet ?
  9. * Qu’est-ce qu’un projet ?
  10. * Qu’est-ce que manager un projet
  11. * Quels sont les cycles de gestion de projet ?
  12. * Qu’est-ce que l’organigramme des tâches d’un projet ?
  13. * Comment maîtriser les délais ?
  14. * Qu’est-ce qu’un diagramme de GANTT ?
  15. * Qu’est-ce qu’un diagramme de PERT ?
  16. * Comment allouer les ressources d’un projet ?
  17. * Qu’est-ce qu’un cahier des charges fonctionnelles ?
  18. ### Chapitre 2: Apports d'une démarche Agile
  19. * Pourquoi passer à une méthode agile pour gérer un projet ?
  20. * Quelles sont les avantages de la méthode agile ?
  21. * Quels sont les différents types de méthode agile ?
  22. * Quand choisir une méthode agile ?
  23. * Quelles sont les différences entre méthode classique et méthode agile ?
  24. * Qu’est-ce que l’agilité ?
  25. * Comment devenir agile ?
  26. * Qu’est-ce que la méthode SCRUM ?
  27. * Quelles sont les valeurs de la méthode SCRUM ?
  28. * Quelles sont les principes de la méthode SCRUM ?
  29. * Quel est la démarche pour mettre en place une méthode SCRUM ?
  30. ### Chapitre 3 : Caractéristiques de la méthode SCRUM
  31. #### Quel est l'environnement d'un projet avec la méthode SCRUM ?
  32. * A quoi sert le Scrum Master ?
  33. * A quoi sert le Product Owner ?
  34. * A quoi sert l’équipe de développement ?
  35. #### Quels sont les objets d'un projet avec la méthode SCRUM ?
  36. * A quoi servent les Stories (cas d’usage) ?
  37. * Comment organiser les stories ?
  38. * A quoi servent les Product Backlog (carnet de produit) ?
  39. * Comment organiser les backllog ?
  40. #### Quels sont les évènements d'un projet avec la méthode SCRUM ?
  41. * Qu’est-ce qu’un Scrum meeting ?
  42. * Qu’est-ce qu’un Sprint ?
  43. * Comment organiser un sprint ?
  44. * Qu’est-ce qu’un Sprint Review ?
  45. #### Quels sont les outils pour déployer une méthode Scrum ?
  46. * Comment utiliser Discord pour gérer un projet ?
  47. * Comment utiliser Trello pour gérer un projet ?
  48. * Existe-il une solution gratuite à Jira Software ?
  49. * A quoi sert un système de versionning (Git) ?
  50. * Comment utiliser Gitea pour gérer les livrables ?
  51. ## PARTIE 2: Construire une base de données
  52. ### Chapitre 4: Base de données relationnelles
  53. #### Projet
  54. * le contexte
  55. * la mission
  56. * le livrable
  57. #### Tachés réalisées
  58. * l'organisation du projet : l'environnement, les objets, les évènements, les outils
  59. * la préparation du Sprint 1 : objectifs, acteurs, tâches
  60. #### Ce qu'il faut retenir
  61. * Qu'est-ce qu'une donnée ?
  62. * Qu'est-ce qu'une base de données ?
  63. * Qu'est-ce qu'un système de gestion de base de données (SGBD) ?
  64. ### Chapitre 5: Collecter les données
  65. #### Présentation du Sprint
  66. * objectifs
  67. * acteurs
  68. * évènements
  69. * support et outils utilisés
  70. #### Tachés réalisées
  71. * identifier des sources de données
  72. * sélectionner des jeux de données
  73. * collecter les données
  74. #### Résultats obtenus
  75. #### Difficultés rencontrées
  76. #### Ce qu'il faut retenir
  77. * Qu'est-ce que l'open data ?
  78. * Qu'est-ce que le webscraping ?
  79. * Comment collecter des données sur le web ?
  80. ### Chapitre 6: Préparer les données
  81. #### Présentation du Sprint
  82. * objectifs
  83. * acteurs
  84. * évènements
  85. * support et outils utilisés
  86. #### Tachés réalisées
  87. * présenter les jeux de données
  88. * descrire des variables
  89. * transformer des variables
  90. * indexer le jeu de données
  91. #### Résultats obtenus
  92. #### Difficultés rencontrées
  93. #### Ce qu'il faut retenir
  94. * Qu'est-ce qu'une clé primaire ?
  95. * Comment réaliser une jointure entre 2 tables de données ?
  96. ### Chapitre 7: Organiser les données
  97. #### Présentation du Sprint
  98. * objectifs
  99. * acteurs
  100. * évènements
  101. * support et outils utilisés
  102. #### Tachés réalisées
  103. * formater les variables (convertir) : dates, adresses, montant, ...
  104. * nettoyer la base de données : doublons, valeurs extêmes ou abbérentes, valeurs manquantes, ...
  105. * organiser les variables dans des tables
  106. * concevoir une architecture de la base de données
  107. #### Résultats obtenus
  108. #### Difficultés rencontrées
  109. #### Ce qu'il faut retenir
  110. * Qu'est-ce qu'une architecture de base de données ?
  111. ### Chapitre 8: Présenter les données (data paper)
  112. #### Présentation du Sprint
  113. * objectifs
  114. * acteurs
  115. * évènements
  116. * support et outils utilisés
  117. #### Tachés réalisées
  118. * Résumé
  119. * Contexte et objectifs
  120. * démarche et organisation de la base de données
  121. * Description des variables
  122. * Exploitation et usages
  123. #### Difficultés rencontrées
  124. #### Ce qu'il faut retenir
  125. * Qu'est-ce qu'un data paper ?
  126. ## PARTIE 3: Analyser les données
  127. ### Chapitre 9 : Décrire les données
  128. * échantillonage
  129. * la population et l'échantillon
  130. * effectif et fréquence
  131. * les techniques d'échantillonage (par commodité, par hasard, par quota)
  132. * inférences statitiques
  133. * les différents types de données
  134. * les données quantitatives
  135. * les données qualitatives
  136. * la transformation de données qualitatives en données quantitatives
  137. * variables à expliquer et variables explicatives
  138. * les mesures de tendance centrale
  139. * le mode
  140. * la médiane
  141. * la moyenne
  142. * les mesures de dispersion et de position
  143. * l'écart-types
  144. * la variance
  145. * l'étendue
  146. * le minimum
  147. * le maximum
  148. * le percentile
  149. ### Chapitre 10 : Explorer les données
  150. * Relations entre 2 variables
  151. * 2 variables numériques
  152. * 2 variables catégorielles
  153. * 1 variable numérique et 1 variable catégorielle
  154. * Analyse des corrélations
  155. * Coefficient de corrélation de Pearson et de Spearman
  156. * Tableau des correlations
  157. * Analyse de la variance (ANOVA)
  158. * Analyse factorielle et réduction des dimensions
  159. ### Chapitre 11 : Trouver un modèle
  160. * La régression linéaire
  161. * La régression logistique
  162. ### Chapitre 12 Evaluer un modèle :
  163. * évaluer les modèles de régression linéaire
  164. * le coefficient de détermination (R2)
  165. * l'erreur quadratique moyenne (MSE)
  166. * évaluer les modèles de régression logistique
  167. * la matrice de confusion
  168. ## PARTIE 4: Exploiter les données (BI)
  169. ### Chapitre 13 : Définir un indicateur de performanace
  170. ### Chapitre 14 : Construire le tableau de bord
  171. *