Contenu pour les étudiants du Master Data Management de Paris School of Business
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

206 lines
8.0 KiB

  1. # GUIDE DU DATA MANAGER (édition 2022)
  2. Ce repo contient des éléments pour les étudiants du master 2 en Data Management de Paris School of Management.
  3. L'objectif finale est de réaliser un livre blanc qui servira de support de cours.
  4. ## Sommaire
  5. 1. [PARTIE 1: Organiser un projet Data](##Partie_1:_Organiser_un_projet_Data)
  6. * [Chapitre 1: Fondements de management de projet](###Chapitre_1:_Fondements_de_management_de_projet)
  7. * [Chapitre 2: Apports d'une démarche Agile](###Chapitre_2:_Apports_d'une_démarche_Agile)
  8. * [Chapitre 3 : Caractéristiques de la méthode SCRUM](###Chapitre_3:_Caractéristiques_de_la_méthode_SCRUM)
  9. 2. [PARTIE 2: Construire une base de données](##PARTIE_2:_Construire_une_base_de_données)
  10. * [Chapitre 4: Base de données relationnelles](###Chapitre_4:_Base_de_données_relationnelles)
  11. * [Chapitre 5: Collecter les données](###Chapitre_5:_Collecter_les_données)
  12. * [Chapitre 6: Préparer les données](###Chapitre_6:_Préparer_les_données)
  13. * [Chapitre 7: Organiser les données](###Chapitre_7:_Organiser_les_données)
  14. * [Chapitre 8: Présenter les données - data paper](###Chapitre_8:_Présenter_les_données_(data_paper))
  15. 3. [PARTIE 3: Analyser les données](##PARTIE_3:_Analyser_les_données)
  16. * [Chapitre 9 : Décrire les données](###Chapitre_9:_Décrire_les_données)
  17. * [Chapitre 10 : Explorer les données](###Chapitre_10:_Explorer_les_données)
  18. * [Chapitre 11 : Trouver un modèle](###Chapitre_11:_Trouver_un_modèle)
  19. * [Chapitre 12 : Evaluer un modèle](###Chapitre_12:_Evaluer_un_modèle)
  20. 4. [PARTIE 4: Exploiter les données (BI)](##PARTIE_4:_Exploiter_les_données_(BI))
  21. * [Chapitre 13 : Concevoir un indicateur de performanace](###Chapitre_13:_Concevoir_un_indicateur_de_performanace)
  22. * [Chapitre 14 : Construire le tableau de bord](###Chapitre_14:_Construire_le_tableau_de_bord )
  23. 5. [PARTIE 5: Utiiser l'intelligence artifcielle](##PARTIE_5:_Utiiser_l'intelligence_artifcielle)
  24. ## Partie 1 : Organiser un projet Data
  25. ### Chapitre 1: Fondements de management de projet
  26. * Pourquoi il faut manager un projet ?
  27. * Qu’est-ce qu’un projet ?
  28. * Qu’est-ce que manager un projet
  29. * Quels sont les cycles de gestion de projet ?
  30. * Qu’est-ce que l’organigramme des tâches d’un projet ?
  31. * Comment maîtriser les délais ?
  32. * Qu’est-ce qu’un diagramme de GANTT ?
  33. * Qu’est-ce qu’un diagramme de PERT ?
  34. * Comment allouer les ressources d’un projet ?
  35. * Qu’est-ce qu’un cahier des charges fonctionnelles ?
  36. ### Chapitre 2: Apports d'une démarche Agile
  37. * Pourquoi passer à une méthode agile pour gérer un projet ?
  38. * Quelles sont les avantages de la méthode agile ?
  39. * Quels sont les différents types de méthode agile ?
  40. * Quand choisir une méthode agile ?
  41. * Quelles sont les différences entre méthode classique et méthode agile ?
  42. * Qu’est-ce que l’agilité ?
  43. * Comment devenir agile ?
  44. * Qu’est-ce que la méthode SCRUM ?
  45. * Quelles sont les valeurs de la méthode SCRUM ?
  46. * Quelles sont les principes de la méthode SCRUM ?
  47. * Quel est la démarche pour mettre en place une méthode SCRUM ?
  48. ### Chapitre 3 : Caractéristiques de la méthode SCRUM
  49. #### Quel est l'environnement d'un projet avec la méthode SCRUM ?
  50. * A quoi sert le Scrum Master ?
  51. * A quoi sert le Product Owner ?
  52. * A quoi sert l’équipe de développement ?
  53. #### Quels sont les objets d'un projet avec la méthode SCRUM ?
  54. * A quoi servent les Stories (cas d’usage) ?
  55. * Comment organiser les stories ?
  56. * A quoi servent les Product Backlog (carnet de produit) ?
  57. * Comment organiser les backllog ?
  58. #### Quels sont les évènements d'un projet avec la méthode SCRUM ?
  59. * Qu’est-ce qu’un Scrum meeting ?
  60. * Qu’est-ce qu’un Sprint ?
  61. * Comment organiser un sprint ?
  62. * Qu’est-ce qu’un Sprint Review ?
  63. #### Quels sont les outils pour déployer une méthode Scrum ?
  64. * Comment utiliser Discord pour gérer un projet ?
  65. * Comment utiliser Trello pour gérer un projet ?
  66. * Existe-il une solution gratuite à Jira Software ?
  67. * A quoi sert un système de versionning (Git) ?
  68. * Comment utiliser Gitea pour gérer les livrables ?
  69. ## PARTIE 2: Construire une base de données
  70. ### Chapitre 4: Base de données relationnelles
  71. #### Projet
  72. * le contexte
  73. * la mission
  74. * le livrable
  75. #### Tachés réalisées
  76. * l'organisation du projet : l'environnement, les objets, les évènements, les outils
  77. * la préparation du Sprint 1 : objectifs, acteurs, tâches
  78. #### Ce qu'il faut retenir
  79. * Qu'est-ce qu'une donnée ?
  80. * Qu'est-ce qu'une base de données ?
  81. * Qu'est-ce qu'un système de gestion de base de données (SGBD) ?
  82. ### Chapitre 5: Collecter les données
  83. #### Présentation du Sprint
  84. * objectifs
  85. * acteurs
  86. * évènements
  87. * support et outils utilisés
  88. #### Tachés réalisées
  89. * identifier des sources de données
  90. * sélectionner des jeux de données
  91. * collecter les données
  92. #### Résultats obtenus
  93. #### Difficultés rencontrées
  94. #### Ce qu'il faut retenir
  95. * Qu'est-ce que l'open data ?
  96. * Qu'est-ce que le webscraping ?
  97. * Comment collecter des données sur le web ?
  98. ### Chapitre 6: Préparer les données
  99. #### Présentation du Sprint
  100. * objectifs
  101. * acteurs
  102. * évènements
  103. * support et outils utilisés
  104. #### Tachés réalisées
  105. * présenter les jeux de données
  106. * descrire des variables
  107. * transformer des variables
  108. * indexer le jeu de données
  109. #### Résultats obtenus
  110. #### Difficultés rencontrées
  111. #### Ce qu'il faut retenir
  112. * Qu'est-ce qu'une clé primaire ?
  113. * Comment réaliser une jointure entre 2 tables de données ?
  114. ### Chapitre 7: Organiser les données
  115. #### Présentation du Sprint
  116. * objectifs
  117. * acteurs
  118. * évènements
  119. * support et outils utilisés
  120. #### Tachés réalisées
  121. * formater les variables (convertir) : dates, adresses, montant, ...
  122. * nettoyer la base de données : doublons, valeurs extêmes ou abbérentes, valeurs manquantes, ...
  123. * organiser les variables dans des tables
  124. * concevoir une architecture de la base de données
  125. #### Résultats obtenus
  126. #### Difficultés rencontrées
  127. #### Ce qu'il faut retenir
  128. * Qu'est-ce qu'une architecture de base de données ?
  129. ### Chapitre 8: Présenter les données (data paper)
  130. #### Présentation du Sprint
  131. * objectifs
  132. * acteurs
  133. * évènements
  134. * support et outils utilisés
  135. #### Tachés réalisées
  136. * Résumé
  137. * Contexte et objectifs
  138. * démarche et organisation de la base de données
  139. * Description des variables
  140. * Exploitation et usages
  141. #### Difficultés rencontrées
  142. #### Ce qu'il faut retenir
  143. * Qu'est-ce qu'un data paper ?
  144. ## PARTIE 3: Analyser les données
  145. ### Chapitre 9 : Décrire les données
  146. * échantillonage
  147. * la population et l'échantillon
  148. * effectif et fréquence
  149. * les techniques d'échantillonage (par commodité, par hasard, par quota)
  150. * inférences statitiques
  151. * les différents types de données
  152. * les données quantitatives
  153. * les données qualitatives
  154. * la transformation de données qualitatives en données quantitatives
  155. * variables à expliquer et variables explicatives
  156. * les mesures de tendance centrale
  157. * le mode
  158. * la médiane
  159. * la moyenne
  160. * les mesures de dispersion et de position
  161. * l'écart-types
  162. * la variance
  163. * l'étendue
  164. * le minimum
  165. * le maximum
  166. * le percentile
  167. ### Chapitre 10 : Explorer les données
  168. * Relations entre 2 variables
  169. * 2 variables numériques
  170. * 2 variables catégorielles
  171. * 1 variable numérique et 1 variable catégorielle
  172. * Analyse des corrélations
  173. * Coefficient de corrélation de Pearson et de Spearman
  174. * Tableau des correlations
  175. * Analyse de la variance (ANOVA)
  176. * Analyse factorielle et réduction des dimensions
  177. ### Chapitre 11 : Trouver un modèle
  178. * La régression linéaire
  179. * La régression logistique
  180. ### Chapitre 12 Evaluer un modèle
  181. * évaluer les modèles de régression linéaire
  182. * le coefficient de détermination (R2)
  183. * l'erreur quadratique moyenne (MSE)
  184. * évaluer les modèles de régression logistique
  185. * la matrice de confusion
  186. ## PARTIE 4: Exploiter les données (BI)
  187. ### Chapitre 13 : Concevoir un indicateur de performanace
  188. ### Chapitre 14 : Construire le tableau de bord
  189. ## PARTIE 5: Utiiser l'intelligence artifcielle