version beta

3 years ago · 6f2da2f5f7
6 changed files with 1564 additions and 0 deletions
--- a/Colonnes.py
+++ b/Colonnes.py
@ -0,0 +1,70 @@
+#Importation des données dont nous aurons besoin
+from typing import List
+import pandas as pd
+import numpy as np
+import requests
+import csv
+import re
+
+#Afficher les tableaux de données
+datafram : pd.read_csv("C:\\Users\\luigg\\Data_cleaning\\Table_final.csv")
+datafram.head(5)
+
+#Supprimer les colonnes inutilisées ou non pertinentes
+to_drop :  [''identifiant
+            ','adresse
+            ','commune
+            ','coordonnees_x
+            ','coordonnees_y
+            ','code_epsg
+            ','code_ape
+            ','libelle_ape
+            ','code_eprtr
+            ','libelle_eprtr
+            ','sigleUniteLegale_imp
+            ','activitePrincipaleUniteLegale_imp
+            ','Catégorie_entreprise_imp
+            ','numeroVoieEtablissement_imp
+            ','typeVoieEtablissement_imp
+            ','libelleVoieEtablissement_imp
+            ','libelleCommuneEtablissement_imp
+            ','codeCommuneEtablissement_imp
+            ','adresse_imp
+            ','geo_imp
+            ','com_code_imp
+            ','code_commune_imp
+            ','Code Officiel_EPCI_imp
+            ','Code_Officiel_region_imp
+            ','codenaffix_imp
+            ','Intitule_NAF_imp
+            ','groupe_imp
+            ','division_imp
+            ','nom_etablissement_tndan
+            ','code_operation_eliminatio_valorisation_tndan
+            ','libelle_operation_eliminatio_valorisation_tndan
+            ','code_departement_tndan
+            ','pays_tndan
+            ','pays_pdan
+            ','code_dechet_pdan
+            ','libelle_dechet_pdan
+            ','quantite_pdan
+            ','unite_pdan
+            ','code_operation_eliminatio_valorisation_pndan
+            ','libelle_operation_eliminatio_valorisation_pndan
+            ','code_departement_pndan
+            ','pays_pndan
+            ','code_dechet_pndan
+            ','libelle_dechet_pndan
+            ','quantite_pndan
+            ','unite_pndan
+            ','code_operation_eliminatio_valorisation_tdan
+            ','libelle_operation_eliminatio_valorisation_tdan
+            ','code_departement_tdan
+            ','pays_tdan
+            ','code_dechet_tdan
+            ','libelle_dechet_tdan
+            ']
+
+datafram.drop(to_drop, inplace = True, axis = 1)
+datafram.head(5)
+
--- a/Doublons.py
+++ b/Doublons.py
@ -0,0 +1,16 @@
+import panda as pd
+import numpy as np
+import csv
+import re
+
+#Afficher les tableaux de données
+datafram = pd.read_csv(r"C:\Users\luigg\Data_cleaning\Table_final.csv")
+datafram.head(5)
+
+#Supprimer les doublons dans excel
+nouvelle_table = datafram.drop_duplicates(
+  subset = ['order_id', 'customer_id'],
+  keep = 'last').reset_index(drop = True)
+
+#Afficher la nouvelle table
+print(nouvelle_table)
--- a/Table_final.csv
+++ b/Table_final.csv
--- a/Values.py
+++ b/Values.py
@ -0,0 +1,19 @@
+import pandas as pd
+import numpy as np
+import csv
+
+#Afficher les tableaux de données
+table = pd.read_csv("C:\Users\luigg\Data_cleaning\Table_final.csv")
+table.head(5)
+
+#Remplacer les valeurs des lignes
+
+Replace_values = {0: 'Non', 1: 'Oui'}
+
+table = table.replace({"engagement_manifeste_imp
+                        ","engagement_data_imp
+                        ","prelevements_eaux_souterraines_pre
+                        ","prelevements_mer_pre
+                        ": replace_values})
+
+table.head(5)
--- a/main.py
+++ b/main.py
@ -0,0 +1,69 @@
+#Importation des données dont nous aurons besoin
+import pandas as pd
+import numpy as np
+import csv
+import re
+
+#Afficher les tableaux de données
+df = pd.read_csv("C:\Users\luigg\Data_cleaning\Table_final.csv")
+df.head(5)
+
+#Supprimer les colonnes inutilisées ou non pertinentes
+
+to_drop = ['identifiant
+','adresse
+','commune
+','coordonnees_x
+','coordonnees_y
+','code_epsg
+','code_ape
+','libelle_ape
+','code_eprtr
+','libelle_eprtr
+','sigleUniteLegale_imp
+','activitePrincipaleUniteLegale_imp
+','Catégorie_entreprise_imp
+','numeroVoieEtablissement_imp
+','typeVoieEtablissement_imp
+','libelleVoieEtablissement_imp
+','libelleCommuneEtablissement_imp
+','codeCommuneEtablissement_imp
+','adresse_imp
+','geo_imp
+','com_code_imp
+','code_commune_imp
+','Code Officiel_EPCI_imp
+','Code_Officiel_region_imp
+','codenaffix_imp
+','Intitule_NAF_imp
+','groupe_imp
+','division_imp
+','nom_etablissement_tndan
+','code_operation_eliminatio_valorisation_tndan
+','libelle_operation_eliminatio_valorisation_tndan
+','code_departement_tndan
+','pays_tndan
+','pays_pdan
+','code_dechet_pdan
+','libelle_dechet_pdan
+','quantite_pdan
+','unite_pdan
+','code_operation_eliminatio_valorisation_pndan
+','libelle_operation_eliminatio_valorisation_pndan
+','code_departement_pndan
+','pays_pndan
+','code_dechet_pndan
+','libelle_dechet_pndan
+','quantite_pndan
+','unite_pndan
+','code_operation_eliminatio_valorisation_tdan
+','libelle_operation_eliminatio_valorisation_tdan
+','code_departement_tdan
+','pays_tdan
+','code_dechet_tdan
+','libelle_dechet_tdan
+']
+
+df.drop(to_drop, inplace = True, axis = 1)
+df.head(5)
+
--- a/requirements.txt
+++ b/requirements.txt
@ -0,0 +1,4 @@
+pandas
+numpy
+csv
+re