Skip to article frontmatterSkip to article content

Notions intervenant dans ce TP

1. import

  1. importez les librairies pandas et numpy

# votre code

2. read

  1. lisez le fichier de données data/objects-on-the-moon.csv

  2. affichez sa taille et regardez quelques premières lignes

# votre code

3. drop

  1. vous remarquez une première colonne franchement inutile
    utiliser la méthode drop des dataframes pour supprimer cette colonne de votre dataframe

# votre code

4. info

  1. appelez la méthode info des dataframes (non-null signifie non-nan i.e. non manquant)

  2. remarquez une colonne entièrement vide

# votre code

5. dropna

  1. utilisez la méthode dropna des dataframes pour supprimer en place les colonnes qui ont toutes leurs valeurs manquantes
    (ici on s’interdit un code qui ferait explicitement référence à la colonne 'Size')

  2. vérifiez que vous avez bien enlevé la colonne 'Size'

# votre code

6. dropna (2)

  1. affichez la ligne d’index 88, que remarquez-vous ?

  2. utilisez la méthode dropna des dataframes pour supprimer en place les lignes qui ont toutes leurs valeurs manquantes (et de nouveau sans faire référence à une ligne en particulier)

# votre code

7. dtypes

  1. utilisez l’attribut dtypes des dataframes pour voir le type de vos colonnes

  2. que remarquez vous sur la colonne des masses ?

# votre code

8. unique

  1. utilisez la méthode unique des Seriespour en regarder le contenu de la colonne des masses

  2. que remarquez vous ?

# votre code

9. to_numeric

  1. conservez la colonne 'Mass (lb)' d’origine
    (par exemple dans une colonne de nom 'Mass (lb) orig')

  2. utilisez la fonction pd.to_numeric pour convertir la colonne 'Mass (lb)' en numérique
    en remplaçant les valeurs invalides par la valeur manquante (NaN)

  3. naturellement vous vérifiez votre travail en affichant le type de la série df['Mass (lb)']

  4. combien y a-t-il de données manquantes dans cette colonne ?

# votre code

10. replace

  1. cette solution ne vous satisfait pas, vous ne voulez perdre aucune valeur
    (même au prix de valeurs approchées)

  2. vous décidez vaillamment de modifier les str en leur enlevant les caractères < et >
    afin de pouvoir en faire des entiers
    remplacez les < et les > par des ‘’ (chaîne vide)

  3. utilisez la méthode astype des Series pour la convertir finalement en int

  4. (optionnel) pour les avancés: sauriez-vous convertir la série en entiers tout en conservant les nan ?

# votre code

11. convert

  1. sachant que 1 kg = 2.205 lb
    créez une nouvelle colonne 'Mass (kg)' en convertissant les lb en kg
    arrondissez les flottants en entiers en utilisant astype

# votre code

12. countries

  1. Quels sont les pays qui ont laissé des objets sur la lune ?

  2. Combien en ont-ils laissé en pourcentage (pas en nombre) ?

# votre code

13. total

  1. quel est le poids total des objets sur la lune en kg ?

  2. quel est le poids total des objets laissés par les United States ?

# votre code

14. blame

  1. quel pays a laissé l’objet le plus léger ?

# votre code

15. memorial

  1. y-a-t-il un Memorial sur la lune ?

  2. quel est le pays qui a mis ce mémorial ?

# votre code

16. tolist

  1. faites la liste Python des objets sur la lune

# votre code