Script Python nettoyant des jeux de donnée
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

31 lines
752 B

#Importer les librairies
import pandas as pd
#Ouvrir un fichier CSV
df = pd.read_csv (r'/Users/marinegalanth/Desktop/inondation_bdd/db_siren/te_siren_adresse.csv')
print(df)
#Renommer les colonnes sélectionnées
df = df.rename(columns={"codeCommuneEtablissement":"codepostal","libelleCommuneEtablissement":"nomcommune"})
#Dupliquer la colonne : code_postal > créer une nouvelle colonne nommée dep_code
#avec les valeurs de code_postal
df=df.assign(codedept=df['codepostal'])
#Garder uniquement les 2 premiers caractères des valeurs de la colonne dept
df["codedept"]=df["codedept"].str[:2]
#Conserver uniquement les colonnes utiles
df2=df[['siren','siret','codepostal','codedept','nomcommune']]
#Afficher le dataframe
df2
# In[ ]: