Comment mettre à jour les lignes et les colonnes à l’aide de Python Pandas

Comment mettre à jour les lignes et les colonnes à l’aide de Python Pandas

Introduction

Pandas est une bibliothèque Python largement utilisée pour la manipulation et l’analyse de données. Elle fournit un éventail de méthodes et de fonctions pour modifier et mettre à jour les données dans un DataFrame. Cet article vous guidera à travers les différentes techniques de mise à jour des lignes et des colonnes à l’aide de Python Pandas, en couvrant à la fois les approches simples et avancées.

Mise à jour des lignes

Remplacement d’une ligne unique

Pour remplacer une ligne unique par une nouvelle valeur, utilisez la méthode loc avec l’index de la ligne :

python
import pandas as pd

df = pd.DataFrame({'Nom': ['Alice', 'Bob', 'Charles'], 'Âge': [20, 25, 30]})

Remplacer la ligne d'index 1

df.loc[1] = ['David', 22]

print(df)

Sortie :


Nom Âge
0 Alice 20
1 David 22
2 Charles 30

Mise à jour de plusieurs lignes

Pour mettre à jour plusieurs lignes en même temps, utilisez la méthode loc avec une liste ou un tableau d’index :

python

Mettre à jour les lignes d'indices 0 et 2

df.loc[[0, 2], 'Nom'] = ['Alice Martin', 'Charles Dubois']

print(df)

Sortie :


Nom Âge
0 Alice Martin 20
1 David 22
2 Charles Dubois 30

Insertion d’une nouvelle ligne

Pour insérer une nouvelle ligne à une position spécifique, utilisez la méthode insert :

python

Insérer une nouvelle ligne à l'index 1

df.insert(1, 'Ville', ['Paris', 'Londres', 'Berlin'])

print(df)

Sortie :


Nom Âge Ville
0 Alice Martin 20 Paris
1 David 22 Londres
2 Charles Dubois 30 Berlin

Suppression d’une ligne

Pour supprimer une ligne, utilisez la méthode drop :

python

Supprimer la ligne d'index 1

df.drop(1, inplace=True)

print(df)

Sortie :


Nom Âge Ville
0 Alice Martin 20 Paris
2 Charles Dubois 30 Berlin

Mise à jour des colonnes

Remplacement d’une colonne unique

Pour remplacer une colonne unique par une nouvelle série, utilisez la méthode assign :

python

Remplacer la colonne "Âge"

df = df.assign(Âge=df['Âge'] + 1)

print(df)

Sortie :


Nom Âge Ville
0 Alice Martin 21 Paris
1 Charles Dubois 31 Berlin

Mise à jour de plusieurs colonnes

Pour mettre à jour plusieurs colonnes en même temps, utilisez la méthode assign avec un dictionnaire :

python

Mettre à jour les colonnes "Nom" et "Ville"

df = df.assign(
Nom=df['Nom'].str.upper(),
Ville=df['Ville'].str.title()
)

print(df)

Sortie :


Nom Âge Ville
0 ALICE MARTIN 21 Paris
1 CHARLES DUBOIS 31 Berlin

Insertion d’une nouvelle colonne

Pour insérer une nouvelle colonne, utilisez la méthode insert :

python

Insérer une nouvelle colonne "Pays"

df.insert(2, 'Pays', ['France', 'Allemagne'])

print(df)

Sortie :


Nom Âge Ville Pays
0 Alice Martin 21 Paris France
1 Charles Dubois 31 Berlin Allemagne

Suppression d’une colonne

Pour supprimer une colonne, utilisez la méthode drop :

python

Supprimer la colonne "Ville"

df.drop('Ville', axis=1, inplace=True)

print(df)

Sortie :


Nom Âge Pays
0 Alice Martin 21 France
1 Charles Dubois 31 Allemagne

Conclusion

Mettre à jour les lignes et les colonnes dans Pandas est une tâche courante lors de la manipulation de données. Cet article a passé en revue les différentes techniques pour effectuer ces mises à jour, couvrant à la fois les opérations de base et avancées. En maîtrisant ces techniques, vous pouvez modifier efficacement vos DataFrames Pandas pour répondre à vos besoins spécifiques d’analyse et de transformation de données.

FAQ

* Comment mettre à jour une valeur spécifique dans une cellule ?
Utilisez la méthode at pour accéder à une cellule spécifique et la mettre à jour.

* Comment mettre à jour plusieurs cellules à la fois ?
Utilisez la méthode loc avec une liste d’index de lignes et de colonnes.

* Comment ajouter une nouvelle ligne à la fin du DataFrame ?
Utilisez la méthode append pour ajouter une nouvelle ligne au DataFrame.

* Comment supprimer plusieurs lignes en même temps ?
Utilisez la méthode drop avec une liste d’index de lignes ou un tableau booléen.

* Comment mettre à jour les colonnes en fonction des valeurs d’autres colonnes ?
Utilisez des fonctions lambda avec la méthode assign pour effectuer des mises à jour conditionnelles.

* Comment renommer une colonne ?
Utilisez la méthode rename pour renommer une colonne.

* Comment supprimer les doublons de lignes ?
Utilisez la méthode drop_duplicates pour supprimer les lignes en double.

* Comment regrouper les données par une certaine colonne et effectuer des mises à jour ?
Utilisez la méthode groupby pour regrouper les données et appliquer des mises à jour sur chaque groupe.