Pandas Renommer la colonne et l’index



Introduction

Pandas, une librairie Python incontournable pour la manipulation et l’analyse de données, met à disposition une fonctionnalité souple pour ajuster les noms des colonnes et des index de ses DataFrames. Cette capacité permet aux utilisateurs de modifier les étiquettes par défaut ou existantes afin d’améliorer la lisibilité, la clarté et l’uniformité des données. Dans cet article, nous allons examiner en détail comment renommer une colonne et un index dans Pandas, en fournissant des illustrations pratiques et des explications exhaustives.

Changer le nom d’une colonne

Il existe diverses manières de modifier le nom d’une colonne dans un DataFrame Pandas :

Méthode 1 : Emploi de la fonction rename()

La fonction rename() est la méthode la plus fréquente pour renommer une colonne. Elle prend en charge un dictionnaire ou une fonction qui met en correspondance les anciens noms de colonne avec les nouveaux.

import pandas as pd
df = pd.DataFrame({'Nom': ['John', 'Mary', 'Bob'], 'Âge': [20, 25, 30]})

Renommer la colonne « Nom » en « Nom_utilisateur » via un dictionnaire


df = df.rename(columns={'Nom': 'Nom_utilisateur'})

Afficher le DataFrame avec le nom de colonne modifié


print(df)

Méthode 2 : Utilisation de l’argument columns

Lors de la création d’un DataFrame à partir d’un dictionnaire ou d’une liste de dictionnaires, on peut employer l’argument columns pour préciser les noms des colonnes.


df = pd.DataFrame({'Nom_utilisateur': ['John', 'Mary', 'Bob'], 'Âge': [20, 25, 30]}, columns=['Nom_utilisateur', 'Âge'])

Afficher le DataFrame avec les noms de colonnes spécifiés


print(df)

Modifier le nom d’un index

Pour changer le nom de l’index d’un DataFrame, on peut recourir à la fonction set_index(). Cette fonction accepte un nom de colonne existant ou une nouvelle valeur pour renommer l’index.


# Créer un DataFrame avec un index par défaut
df = pd.DataFrame({'Nom_utilisateur': ['John', 'Mary', 'Bob'], 'Âge': [20, 25, 30]})
# Changer l'index en "ID_utilisateur"
df = df.set_index('Nom_utilisateur')
# Afficher le DataFrame avec l'index renommé
print(df)

Changer plusieurs noms de colonnes ou d’index

Pour renommer plusieurs colonnes ou index simultanément, on peut utiliser la fonction rename() avec un dictionnaire qui associe les anciens noms aux nouveaux.


# Modifier plusieurs noms de colonnes
df = df.rename(columns={'Nom_utilisateur': 'Nom', 'Âge': 'Age'})
# Afficher le DataFrame avec les colonnes renommées
print(df)
# Modifier plusieurs index
df = df.set_index(['Nom', 'Age'])
# Afficher le DataFrame avec l'index renommé
print(df)

Conclusion

Renommer les colonnes et les index dans Pandas est une opération fréquente qui peut être réalisée de différentes manières. Les fonctions rename() et set_index() permettent aux utilisateurs de modifier les noms par défaut ou existants pour améliorer la lisibilité, la clarté et la manipulation des données. En utilisant les méthodes exposées dans cet article, les utilisateurs de Pandas peuvent facilement personnaliser les noms des colonnes et des index selon leurs besoins particuliers.

FAQ

1. Comment changer le nom d’une seule colonne dans un DataFrame ?
– Employez la fonction rename() avec un dictionnaire associant l’ancien nom de la colonne au nouveau.

2. Comment changer le nom de toutes les colonnes d’un DataFrame ?
– Utilisez la fonction rename() avec un dictionnaire associant tous les anciens noms de colonne aux nouveaux.

3. Comment modifier l’index entier d’un DataFrame ?
– Utilisez la fonction set_index() avec un nom de colonne existant ou une nouvelle valeur.

4. Comment changer le nom de plusieurs colonnes dans un DataFrame ?
– Utilisez la fonction rename() avec un dictionnaire associant les anciens noms de colonne aux nouveaux.

5. Comment modifier le nom de plusieurs index dans un DataFrame ?
– Utilisez la fonction set_index() avec une liste comprenant les nouveaux noms d’index.

6. Peut-on renommer une colonne avec un nom déjà présent dans le DataFrame ?
– Non, cela engendrera une erreur car les noms de colonne doivent être uniques.

7. Comment renommer une colonne à partir d’une expression ou d’une fonction ?
– Utilisez la fonction rename() avec une fonction qui met en correspondance les anciens noms de colonne avec les nouveaux.

8. Comment renommer les noms de colonne en majuscules ou minuscules ?
– Utilisez les fonctions str.upper() ou str.lower() dans la fonction rename() ou set_index().

9. Comment renommer les colonnes et les index simultanément ?
– Utilisez la fonction rename() avec un dictionnaire associant les anciens noms de colonne et d’index aux nouveaux.

10. Comment renommer les colonnes et les index en fonction de leur type de données ?
– Utilisez la fonction rename() avec une fonction qui met en correspondance les anciens noms de colonne et d’index aux nouveaux en fonction de leur type de données.