Script Python nettoyant des jeux de donnée
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

51 lines
811 B

  1. #!/usr/bin/env python
  2. # coding: utf-8
  3. # In[2]:
  4. #importer la librairie Pandas
  5. import pandas as pd
  6. # In[3]:
  7. #ouvrir un fichier CSV
  8. df = pd.read_csv (r'/Users/marinegalanth/Desktop/inondation_bdd/_n_commune_s.csv')
  9. print(df)
  10. # In[5]:
  11. #créer un dataframe
  12. df=pd.DataFrame(df)
  13. # In[6]:
  14. #afficher le dataframe
  15. df
  16. # In[7]:
  17. df2=df[["code_insee,C,80","nom_com,C,80"]]
  18. # In[8]:
  19. #afficher la nouvelle ataframe df2
  20. df2
  21. # In[9]:
  22. #dupliquer la colonne : code_insee,C,80 > créer une nouvelle colonne nommée dep_code
  23. #avec les valeurs de code_insee,C,80
  24. df2=df.assign(dep_code=df['code_insee,C,80'])
  25. # In[10]:
  26. #afficher le nouveau DataFrame
  27. df2
  28. # In[11]:
  29. #selectionner uniquement les colonnes choisies dans une nouveau df3
  30. df3=df2[["code_insee,C,80","nom_com,C,80","dep_code"]]
  31. # In[12]:
  32. #afficher df3
  33. df3