Script Python nettoyant des jeux de donnée
You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
#Importer les librairies import pandas as pd
#Ouvrir un fichier CSV df = pd.read_csv (r'/Users/marinegalanth/Desktop/inondation_bdd/db_siren/te_siren_adresse.csv') print(df)
#Renommer les colonnes sélectionnées df = df.rename(columns={"codeCommuneEtablissement":"codepostal","libelleCommuneEtablissement":"nomcommune"})
#Dupliquer la colonne : code_postal > créer une nouvelle colonne nommée dep_code #avec les valeurs de code_postal df=df.assign(codedept=df['codepostal'])
#Garder uniquement les 2 premiers caractères des valeurs de la colonne dept df["codedept"]=df["codedept"].str[:2]
#Conserver uniquement les colonnes utiles df2=df[['siren','siret','codepostal','codedept','nomcommune']]
#Afficher le dataframe df2
# In[ ]:
|