Script Python nettoyant des jeux de donnée
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

67 lines
1.1 KiB

#!/usr/bin/env python
# coding: utf-8
# In[35]:
#Importer les librairies
import pandas as pd
# In[36]:
#Ouvrir un fichier CSV
df = pd.read_csv (r'/Users/marinegalanth/Desktop/inondation_bdd/bd_inondation/_n_commune_s.csv')
print(df)
# In[37]:
#Renommer les colonnes sélectionnées
df = df.rename(columns={'code_insee,C,80': 'codepostal', 'nom_com,C,80': 'nomcommune', 'id_si_ext,C,80': 'id', 'id_tri,C,80': 'id_tri'})
# In[39]:
#Dupliquer la colonne : code_postal > créer une nouvelle colonne nommée dep_code
#avec les valeurs de code_postal
df=df.assign(codedept=df['codepostal'])
# In[40]:
#Supprimer les 8 premiers caractères des valeurs de la colonne id_tri
#Supprimer les caractères inutiles suivant : FRM_TRI_
df["id_tri"]=df["id_tri"].str[8:]
# In[41]:
#Garder uniquement les 2 premiers caractères des valeurs de la colonne dept
df["codedept"]=df["codedept"].str[:2]
# In[44]:
#Conserver uniquement les colonnes utiles
df2=df[["codepostal","nomcommune","id","id_tri","codedept"]]
# In[45]:
#Afficher le dataframe
df2
# In[ ]: