Contenu pour les étudiants du Master Data Management de Paris School of Business
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

191 lines
6.4 KiB

3 years ago
  1. # PSB
  2. Ce repo contient des éléments pour les étudiants du master 2 en Data Management de Paris School of Management.
  3. L'objectif finale est de réaliser un livre blanc qui servira de support pour mes cours.
  4. Le sommaire du livre blanc est le suivant:
  5. # GUIDE DU DATA MANAGER (édition 2022)
  6. ### Introduction
  7. * objectifs du livre blanc
  8. * organisation de l'ouvrage
  9. * présentation et contribution des auteurs
  10. ## PARTIE 1: Organiser un projet Data
  11. ### Chapitre 1: Fondements de management de projet
  12. * Pourquoi il faut manager un projet ?
  13. * Qu’est-ce qu’un projet ?
  14. * Qu’est-ce que manager un projet
  15. * Quels sont les cycles de gestion de projet ?
  16. * Qu’est-ce que l’organigramme des tâches d’un projet ?
  17. * Comment maîtriser les délais ?
  18. * Qu’est-ce qu’un diagramme de GANTT ?
  19. * Qu’est-ce qu’un diagramme de PERT ?
  20. * Comment allouer les ressources d’un projet ?
  21. * Qu’est-ce qu’un cahier des charges fonctionnelles ?
  22. ### Chapitre 2: Apports d'une démarche Agile
  23. * Pourquoi passer à une méthode agile pour gérer un projet ?
  24. * Quelles sont les avantages de la méthode agile ?
  25. * Quels sont les différents types de méthode agile ?
  26. * Quand choisir une méthode agile ?
  27. * Quelles sont les différences entre méthode classique et méthode agile ?
  28. * Qu’est-ce que l’agilité ?
  29. * Comment devenir agile ?
  30. * Qu’est-ce que la méthode SCRUM ?
  31. * Quelles sont les valeurs de la méthode SCRUM ?
  32. * Quelles sont les principes de la méthode SCRUM ?
  33. * Quel est la démarche pour mettre en place une méthode SCRUM ?
  34. ### Chapitre 3 : Caractéristiques de la méthode SCRUM
  35. #### Quel est l'environnement d'un projet avec la méthode SCRUM ?
  36. * A quoi sert le Scrum Master ?
  37. * A quoi sert le Product Owner ?
  38. * A quoi sert l’équipe de développement ?
  39. #### Quels sont les objets d'un projet avec la méthode SCRUM ?
  40. * A quoi servent les Stories (cas d’usage) ?
  41. * Comment organiser les stories ?
  42. * A quoi servent les Product Backlog (carnet de produit) ?
  43. * Comment organiser les backllog ?
  44. #### Quels sont les évènements d'un projet avec la méthode SCRUM ?
  45. * Qu’est-ce qu’un Scrum meeting ?
  46. * Qu’est-ce qu’un Sprint ?
  47. * Comment organiser un sprint ?
  48. * Qu’est-ce qu’un Sprint Review ?
  49. #### Quels sont les outils pour déployer une méthode Scrum ?
  50. * Comment utiliser Discord pour gérer un projet ?
  51. * Comment utiliser Trello pour gérer un projet ?
  52. * Existe-il une solution gratuite à Jira Software ?
  53. * A quoi sert un système de versionning (Git) ?
  54. * Comment utiliser Gitea pour gérer les livrables ?
  55. ## PARTIE 2: Construire une base de données
  56. ### Chapitre 4: Base de données relationnelles
  57. #### Projet
  58. * le contexte
  59. * la mission
  60. * le livrable
  61. #### Tachés réalisées
  62. * l'organisation du projet : l'environnement, les objets, les évènements, les outils
  63. * la préparation du Sprint 1 : objectifs, acteurs, tâches
  64. #### Ce qu'il faut retenir
  65. * Qu'est-ce qu'une donnée ?
  66. * Qu'est-ce qu'une base de données ?
  67. * Qu'est-ce qu'un système de gestion de base de données (SGBD) ?
  68. ### Chapitre 5: Collecter les données
  69. #### Présentation du Sprint
  70. * objectifs
  71. * acteurs
  72. * évènements
  73. * support et outils utilisés
  74. #### Tachés réalisées
  75. * identifier des sources de données
  76. * sélectionner des jeux de données
  77. * collecter les données
  78. #### Résultats obtenus
  79. #### Difficultés rencontrées
  80. #### Ce qu'il faut retenir
  81. * Qu'est-ce que l'open data ?
  82. * Qu'est-ce que le webscraping ?
  83. * Comment collecter des données sur le web ?
  84. ### Chapitre 6: Préparer les données
  85. #### Présentation du Sprint
  86. * objectifs
  87. * acteurs
  88. * évènements
  89. * support et outils utilisés
  90. #### Tachés réalisées
  91. * présenter les jeux de données
  92. * descrire des variables
  93. * transformer des variables
  94. * indexer le jeu de données
  95. #### Résultats obtenus
  96. #### Difficultés rencontrées
  97. #### Ce qu'il faut retenir
  98. * Qu'est-ce qu'une clé primaire ?
  99. * Comment réaliser une jointure entre 2 tables de données ?
  100. ### Chapitre 7: Organiser les données
  101. #### Présentation du Sprint
  102. * objectifs
  103. * acteurs
  104. * évènements
  105. * support et outils utilisés
  106. #### Tachés réalisées
  107. * formater les variables (convertir) : dates, adresses, montant, ...
  108. * nettoyer la base de données : doublons, valeurs extêmes ou abbérentes, valeurs manquantes, ...
  109. * organiser les variables dans des tables
  110. * concevoir une architecture de la base de données
  111. #### Résultats obtenus
  112. #### Difficultés rencontrées
  113. #### Ce qu'il faut retenir
  114. * Qu'est-ce qu'une architecture de base de données ?
  115. ### Chapitre 8: Présenter les données (data paper)
  116. #### Présentation du Sprint
  117. * objectifs
  118. * acteurs
  119. * évènements
  120. * support et outils utilisés
  121. #### Tachés réalisées
  122. * Résumé
  123. * Contexte et objectifs
  124. * démarche et organisation de la base de données
  125. * Description des variables
  126. * Exploitation et usages
  127. #### Difficultés rencontrées
  128. #### Ce qu'il faut retenir
  129. * Qu'est-ce qu'un data paper ?
  130. ## PARTIE 3: Analyser les données
  131. ### Chapitre 9 : Décrire les données
  132. * échantillonage
  133. * la population et l'échantillon
  134. * effectif et fréquence
  135. * les techniques d'échantillonage (par commodité, par hasard, par quota)
  136. * inférences statitiques
  137. * les différents types de données
  138. * les données quantitatives
  139. * les données qualitatives
  140. * la transformation de données qualitatives en données quantitatives
  141. * variables à expliquer et variables explicatives
  142. * les mesures de tendance centrale
  143. * le mode
  144. * la médiane
  145. * la moyenne
  146. * les mesures de dispersion et de position
  147. * l'écart-types
  148. * la variance
  149. * l'étendue
  150. * le minimum
  151. * le maximum
  152. * le percentile
  153. ### Chapitre 10 : Explorer les données
  154. * Relations entre 2 variables
  155. * 2 variables numériques
  156. * 2 variables catégorielles
  157. * 1 variable numérique et 1 variable catégorielle
  158. * Analyse des corrélations
  159. * Coefficient de corrélation de Pearson et de Spearman
  160. * Tableau des correlations
  161. * Analyse de la variance (ANOVA)
  162. * Analyse factorielle et réduction des dimensions
  163. ### Chapitre 11 : Trouver un modèle
  164. * La régression linéaire
  165. * La régression logistique
  166. ### Chapitre 12 Evaluer un modèle :
  167. * évaluer les modèles de régression linéaire
  168. ** le coefficient de détermination (R2)
  169. ** l'erreur quadratique moyenne (MSE)
  170. * évaluer les modèles de régression logistique
  171. ** la matrice de confusion
  172. ## PARTIE 4: Exploiter les données (BI)
  173. ### Chapitre 13 : Définir un indicateur de performanace
  174. ### Chapitre 14 : Construire le tableau de bord
  175. *