Comment mettre à jour les lignes et les colonnes à l’aide de Python Pandas
Introduction
Pandas est une bibliothèque Python largement utilisée pour la manipulation et l’analyse de données. Elle fournit un éventail de méthodes et de fonctions pour modifier et mettre à jour les données dans un DataFrame. Cet article vous guidera à travers les différentes techniques de mise à jour des lignes et des colonnes à l’aide de Python Pandas, en couvrant à la fois les approches simples et avancées.
Mise à jour des lignes
Remplacement d’une ligne unique
Pour remplacer une ligne unique par une nouvelle valeur, utilisez la méthode loc
avec l’index de la ligne :
python
import pandas as pd
df = pd.DataFrame({'Nom': ['Alice', 'Bob', 'Charles'], 'Âge': [20, 25, 30]})
Table des matières
Remplacer la ligne d'index 1
df.loc[1] = ['David', 22]
print(df)
Sortie :
Nom Âge
0 Alice 20
1 David 22
2 Charles 30
Mise à jour de plusieurs lignes
Pour mettre à jour plusieurs lignes en même temps, utilisez la méthode loc
avec une liste ou un tableau d’index :
python
Mettre à jour les lignes d'indices 0 et 2
df.loc[[0, 2], 'Nom'] = ['Alice Martin', 'Charles Dubois']
print(df)
Sortie :
Nom Âge
0 Alice Martin 20
1 David 22
2 Charles Dubois 30
Insertion d’une nouvelle ligne
Pour insérer une nouvelle ligne à une position spécifique, utilisez la méthode insert
:
python
Insérer une nouvelle ligne à l'index 1
df.insert(1, 'Ville', ['Paris', 'Londres', 'Berlin'])
print(df)
Sortie :
Nom Âge Ville
0 Alice Martin 20 Paris
1 David 22 Londres
2 Charles Dubois 30 Berlin
Suppression d’une ligne
Pour supprimer une ligne, utilisez la méthode drop
:
python
Supprimer la ligne d'index 1
df.drop(1, inplace=True)
print(df)
Sortie :
Nom Âge Ville
0 Alice Martin 20 Paris
2 Charles Dubois 30 Berlin
Mise à jour des colonnes
Remplacement d’une colonne unique
Pour remplacer une colonne unique par une nouvelle série, utilisez la méthode assign
:
python
Remplacer la colonne "Âge"
df = df.assign(Âge=df['Âge'] + 1)
print(df)
Sortie :
Nom Âge Ville
0 Alice Martin 21 Paris
1 Charles Dubois 31 Berlin
Mise à jour de plusieurs colonnes
Pour mettre à jour plusieurs colonnes en même temps, utilisez la méthode assign
avec un dictionnaire :
python
Mettre à jour les colonnes "Nom" et "Ville"
df = df.assign(
Nom=df['Nom'].str.upper(),
Ville=df['Ville'].str.title()
)
print(df)
Sortie :
Nom Âge Ville
0 ALICE MARTIN 21 Paris
1 CHARLES DUBOIS 31 Berlin
Insertion d’une nouvelle colonne
Pour insérer une nouvelle colonne, utilisez la méthode insert
:
python
Insérer une nouvelle colonne "Pays"
df.insert(2, 'Pays', ['France', 'Allemagne'])
print(df)
Sortie :
Nom Âge Ville Pays
0 Alice Martin 21 Paris France
1 Charles Dubois 31 Berlin Allemagne
Suppression d’une colonne
Pour supprimer une colonne, utilisez la méthode drop
:
python
Supprimer la colonne "Ville"
df.drop('Ville', axis=1, inplace=True)
print(df)
Sortie :
Nom Âge Pays
0 Alice Martin 21 France
1 Charles Dubois 31 Allemagne
Conclusion
Mettre à jour les lignes et les colonnes dans Pandas est une tâche courante lors de la manipulation de données. Cet article a passé en revue les différentes techniques pour effectuer ces mises à jour, couvrant à la fois les opérations de base et avancées. En maîtrisant ces techniques, vous pouvez modifier efficacement vos DataFrames Pandas pour répondre à vos besoins spécifiques d’analyse et de transformation de données.
FAQ
* Comment mettre à jour une valeur spécifique dans une cellule ?
Utilisez la méthode at
pour accéder à une cellule spécifique et la mettre à jour.
* Comment mettre à jour plusieurs cellules à la fois ?
Utilisez la méthode loc
avec une liste d’index de lignes et de colonnes.
* Comment ajouter une nouvelle ligne à la fin du DataFrame ?
Utilisez la méthode append
pour ajouter une nouvelle ligne au DataFrame.
* Comment supprimer plusieurs lignes en même temps ?
Utilisez la méthode drop
avec une liste d’index de lignes ou un tableau booléen.
* Comment mettre à jour les colonnes en fonction des valeurs d’autres colonnes ?
Utilisez des fonctions lambda avec la méthode assign
pour effectuer des mises à jour conditionnelles.
* Comment renommer une colonne ?
Utilisez la méthode rename
pour renommer une colonne.
* Comment supprimer les doublons de lignes ?
Utilisez la méthode drop_duplicates
pour supprimer les lignes en double.
* Comment regrouper les données par une certaine colonne et effectuer des mises à jour ?
Utilisez la méthode groupby
pour regrouper les données et appliquer des mises à jour sur chaque groupe.