Script Python nettoyant des jeux de donnée
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

67 lines
1.1 KiB

2 years ago
  1. #!/usr/bin/env python
  2. # coding: utf-8
  3. # In[35]:
  4. #Importer les librairies
  5. import pandas as pd
  6. # In[36]:
  7. #Ouvrir un fichier CSV
  8. df = pd.read_csv (r'/Users/marinegalanth/Desktop/inondation_bdd/bd_inondation/_n_commune_s.csv')
  9. print(df)
  10. # In[37]:
  11. #Renommer les colonnes sélectionnées
  12. df = df.rename(columns={'code_insee,C,80': 'codepostal', 'nom_com,C,80': 'nomcommune', 'id_si_ext,C,80': 'id', 'id_tri,C,80': 'id_tri'})
  13. # In[39]:
  14. #Dupliquer la colonne : code_postal > créer une nouvelle colonne nommée dep_code
  15. #avec les valeurs de code_postal
  16. df=df.assign(codedept=df['codepostal'])
  17. # In[40]:
  18. #Supprimer les 8 premiers caractères des valeurs de la colonne id_tri
  19. #Supprimer les caractères inutiles suivant : FRM_TRI_
  20. df["id_tri"]=df["id_tri"].str[8:]
  21. # In[41]:
  22. #Garder uniquement les 2 premiers caractères des valeurs de la colonne dept
  23. df["codedept"]=df["codedept"].str[:2]
  24. # In[44]:
  25. #Conserver uniquement les colonnes utiles
  26. df2=df[["codepostal","nomcommune","id","id_tri","codedept"]]
  27. # In[45]:
  28. #Afficher le dataframe
  29. df2
  30. # In[ ]: