Pandas Aufgabe

US - Baby Names

Source: https://github.com/guipsamora/pandas_exercises

Einleitung:

Wir verwenden eine Teilmenge der US Baby Names von Kaggle.
In der Datei sind die Namen von 2004 bis 2014

Step 1. Importieren Sie die notwendigen Bibliotheken


In [ ]:

Step 2. Importieren Sie die Daten aus dem data Ordner oder von dieser Adresse.


In [ ]:

Step 3. Weisen Sie die Daten der Variable baby_names zu.


In [ ]:

Step 4. Betrachten Sie die ersten 10 Einträge


In [ ]:

Step 5. Löschen Sie die Spalten 'Unnamed: 0' und 'Id'


In [ ]:

Step 6. Gibt es in den Daten mehr männliche oder weibliche Namen?


In [ ]:

Step 7. Gruppieren Sie die Daten nach name und weisen Sie dies der Variablen names zu


In [ ]:

Step 8. Wie viele unterschiedliche Namen gibt esin den Daten?


In [ ]:

Step 9. Welcher Name tritt am häufigsten auf?


In [ ]:

Step 10. Wie viele unterschiedliche Namen haben die geringste Anzahl?


In [ ]:

Step 11.Was ist die durchschnittliche Häufigkeit der Namen?


In [ ]:

Step 12. Was ist die Standardabweichung von names?


In [ ]:

Step 13. Geben Sie eine Statistische Übersicht mit mean, min, max, std und quartiles aus.


In [ ]: