notebook.community

Pandas Aufgabe

US - Baby Names

Source: https://github.com/guipsamora/pandas_exercises

Einleitung:

Wir verwenden eine Teilmenge der US Baby Names von Kaggle.
In der Datei sind die Namen von 2004 bis 2014

Step 1. Importieren Sie die notwendigen Bibliotheken



In [ ]:

Step 2. Importieren Sie die Daten aus dem data Ordner oder von dieser Adresse.



In [ ]:

Step 3. Weisen Sie die Daten der Variable baby_names zu.



In [ ]:

Step 4. Betrachten Sie die ersten 10 Einträge



In [ ]:

Step 5. Löschen Sie die Spalten 'Unnamed: 0' und 'Id'



In [ ]:

Step 6. Gibt es in den Daten mehr männliche oder weibliche Namen?



In [ ]:

Step 7. Gruppieren Sie die Daten nach name und weisen Sie dies der Variablen names zu



In [ ]:

Step 8. Wie viele unterschiedliche Namen gibt esin den Daten?



In [ ]:

Step 9. Welcher Name tritt am häufigsten auf?



In [ ]:

Step 10. Wie viele unterschiedliche Namen haben die geringste Anzahl?



In [ ]:

Step 11.Was ist die durchschnittliche Häufigkeit der Namen?



In [ ]:

Step 12. Was ist die Standardabweichung von names?



In [ ]:

Step 13. Geben Sie eine Statistische Übersicht mit mean, min, max, std und quartiles aus.



In [ ]: