Introduction
Pandas, une bibliothèque Python de premier plan pour la manipulation et l’analyse de données, offre une multitude d’outils pour altérer et actualiser les informations au sein d’un DataFrame. Cet article explore les diverses méthodes permettant de modifier les lignes et les colonnes à l’aide de Python Pandas, en abordant les approches simples comme les plus complexes.
Mise à jour des lignes
Remplacement d’une seule ligne
Pour remplacer une ligne spécifique par de nouvelles données, la méthode loc
, associée à l’index de la ligne cible, est la solution :
import pandas as pd
df = pd.DataFrame({‘Nom’: [‘Alice’, ‘Bob’, ‘Charles’], ‘Âge’: [20, 25, 30]})
#Remplacer la ligne d’index 1
df.loc[1] = [‘David’, 22]
print(df)
Résultat :
Nom | Âge |
Alice | 20 |
David | 22 |
Charles | 30 |
Modification de plusieurs lignes
Pour modifier plusieurs lignes simultanément, utilisez la méthode loc
avec une liste ou un tableau contenant les index des lignes :
# Mettre à jour les lignes d'indices 0 et 2
df.loc[[0, 2], 'Nom'] = ['Alice Martin', 'Charles Dubois']
print(df)
Résultat :
Nom | Âge |
Alice Martin | 20 |
David | 22 |
Charles Dubois | 30 |
Ajout d’une nouvelle ligne
Pour insérer une ligne à un emplacement spécifique, employez la méthode insert
:
# Insérer une nouvelle colonne 'Ville' à l'index 1
df.insert(1, 'Ville', ['Paris', 'Londres', 'Berlin'])
print(df)
Résultat :
Nom | Âge | Ville |
Alice Martin | 20 | Paris |
David | 22 | Londres |
Charles Dubois | 30 | Berlin |
Suppression d’une ligne
Pour retirer une ligne, la méthode drop
est appropriée :
# Supprimer la ligne d'index 1
df.drop(1, inplace=True)
print(df)
Résultat :
Nom | Âge | Ville |
Alice Martin | 20 | Paris |
Charles Dubois | 30 | Berlin |
Mise à jour des colonnes
Remplacement d’une colonne
Pour remplacer une colonne unique par une nouvelle série de données, utilisez la méthode assign
:
# Remplacer la colonne "Âge"
df = df.assign(Âge=df['Âge'] + 1)
print(df)
Résultat :
Nom | Âge | Ville |
Alice Martin | 21 | Paris |
Charles Dubois | 31 | Berlin |
Modification de plusieurs colonnes
Pour modifier plusieurs colonnes en même temps, employez la méthode assign
avec un dictionnaire :
# Mettre à jour les colonnes "Nom" et "Ville"
df = df.assign(
Nom=df['Nom'].str.upper(),
Ville=df['Ville'].str.title()
)
print(df)
Résultat :
Nom | Âge | Ville |
ALICE MARTIN | 21 | Paris |
CHARLES DUBOIS | 31 | Berlin |
Ajout d’une nouvelle colonne
Pour insérer une nouvelle colonne, la méthode insert
est la solution :
# Insérer une nouvelle colonne "Pays"
df.insert(2, 'Pays', ['France', 'Allemagne'])
print(df)
Résultat :
Nom | Âge | Pays | Ville |
ALICE MARTIN | 21 | France | Paris |
CHARLES DUBOIS | 31 | Allemagne | Berlin |
Suppression d’une colonne
Pour retirer une colonne, utilisez la méthode drop
:
# Supprimer la colonne "Ville"
df.drop('Ville', axis=1, inplace=True)
print(df)
Résultat :
Nom | Âge | Pays |
ALICE MARTIN | 21 | France |
CHARLES DUBOIS | 31 | Allemagne |
Conclusion
L’actualisation des lignes et des colonnes dans Pandas est une procédure fréquente dans le traitement des données. Cet exposé a exploré les différentes techniques pour effectuer ces mises à jour, allant des opérations fondamentales aux plus avancées. En maîtrisant ces méthodes, vous serez en mesure d’adapter efficacement vos DataFrames Pandas à vos besoins spécifiques d’analyse et de transformation de données.
FAQ
- Comment modifier une valeur unique dans une cellule ?
Utilisez la méthodeat
pour accéder à une cellule spécifique et la modifier. - Comment actualiser plusieurs cellules simultanément ?
Employez la méthodeloc
avec une liste d’index de lignes et de colonnes. - Comment ajouter une nouvelle ligne à la fin du DataFrame ?
La méthodeappend
permet d’ajouter une nouvelle ligne au DataFrame. - Comment supprimer plusieurs lignes à la fois ?
Utilisez la méthodedrop
avec une liste d’index de lignes ou un tableau booléen. - Comment modifier les colonnes en fonction des valeurs d’autres colonnes ?
Des fonctions lambda peuvent être utilisées avec la méthodeassign
pour réaliser des mises à jour conditionnelles. - Comment renommer une colonne ?
La méthoderename
est dédiée à cette tâche. - Comment éliminer les doublons de lignes ?
La méthodedrop_duplicates
permet de retirer les lignes en double. - Comment regrouper les données par une colonne spécifique et effectuer des modifications ?
Utilisez la méthodegroupby
pour regrouper les données et appliquer des mises à jour sur chaque groupe.