Script Python nettoyant des jeux de donnée
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

31 lines
752 B

  1. #Importer les librairies
  2. import pandas as pd
  3. #Ouvrir un fichier CSV
  4. df = pd.read_csv (r'/Users/marinegalanth/Desktop/inondation_bdd/db_siren/te_siren_adresse.csv')
  5. print(df)
  6. #Renommer les colonnes sélectionnées
  7. df = df.rename(columns={"codeCommuneEtablissement":"codepostal","libelleCommuneEtablissement":"nomcommune"})
  8. #Dupliquer la colonne : code_postal > créer une nouvelle colonne nommée dep_code
  9. #avec les valeurs de code_postal
  10. df=df.assign(codedept=df['codepostal'])
  11. #Garder uniquement les 2 premiers caractères des valeurs de la colonne dept
  12. df["codedept"]=df["codedept"].str[:2]
  13. #Conserver uniquement les colonnes utiles
  14. df2=df[['siren','siret','codepostal','codedept','nomcommune']]
  15. #Afficher le dataframe
  16. df2
  17. # In[ ]: