Travail avec les bibliothèques Python : NumPy et Pandas

Travail avec les bibliothèques Python : NumPy et Pandas
Les bibliothèques NumPy et Pandas en Python sont essentielles pour l’analyse et la manipulation des données.
NumPy facilite le travail avec des tableaux multidimensionnels et des calculs mathématiques, tandis que Pandas permet de gérer facilement des tableaux de données (DataFrame) pour analyser et traiter des informations rapidement.
1. Introduction à NumPy
NumPy est une bibliothèque pour la manipulation de tableaux et le calcul scientifique.
import numpy as np
# Création d'un tableau NumPy
tableau = np.array([1, 2, 3, 4, 5])
print("Tableau :", tableau)
# Opérations mathématiques sur le tableau
print("Somme :", np.sum(tableau))
print("Moyenne :", np.mean(tableau))
👉 Pour débuter en Python, consultez notre article :
Introduction à la programmation.
2. Introduction à Pandas
Pandas est une bibliothèque permettant de travailler avec des données structurées, comme des tableaux ou des fichiers CSV.
import pandas as pd
# Création d'un DataFrame
donnees = {
"Nom": ["Ahmed", "Leila", "Sami"],
"Âge": [20, 22, 21],
"Ville": ["Tunis", "Sfax", "Sousse"]
}
df = pd.DataFrame(donnees)
print(df)
# Sélection d'une colonne
print(df["Nom"])
3. Lire et écrire des fichiers avec Pandas
Pandas facilite l’importation et l’exportation des données.
# Lire un fichier CSV
df = pd.read_csv("donnees.csv")
print(df.head())
# Exporter vers CSV
df.to_csv("donnees_modifiees.csv", index=False)
4. Manipulation des données
Pandas permet de filtrer, trier, grouper et analyser les données très facilement.
# Filtrer les lignes où l'âge > 20
df_filtre = df[df["Âge"] > 20]
print(df_filtre)
# Trier par nom
df_trie = df.sort_values("Nom")
print(df_trie)
5. Exercices pratiques
- Créer un tableau NumPy et calculer la somme et la moyenne des éléments.
- Créer un DataFrame Pandas avec vos informations et afficher certaines colonnes.
- Lire un fichier CSV avec Pandas et filtrer les lignes selon un critère.
- Exporter le DataFrame modifié dans un nouveau fichier CSV.
Conclusion
Travailler avec les bibliothèques NumPy et Pandas en Python permet de traiter et analyser des données de manière rapide et efficace.
Ces outils sont indispensables pour les développeurs et analystes qui souhaitent exploiter pleinement le potentiel de Python dans le domaine des données.