A Megoldás
mappában megtalálható az osztaly.csv
fájl. Ez egy osztály öt témazáróra [T1,T2,T3,T4,T5]
kapott jegyeit tartalmazza néhány plusz információval (Nem
, Kor
, Fakt
) kiegészítve. A Fakt
oszlopban az 1-es azt jelöli, hogy az adott ember jár matekfaktra.
Olvasd be a fájlt egy DataFrame-be! Vigyázz arra, hogy a szövegfájlban a mezők a #
jellel vannak elválasztva. (Ha a fejlécet és az indexet automatikusan készíted (nem adsz meg semmit), akkor az index 0-tól növekvő számsorozat, a fejléc pedig a szövegfájl első sora lesz.)
Rendezd a táblázatot névsor szerint úgy, hogy az az előző, nem rendezett táblázatot felülírja!
Minden emberhez számold ki az 5 dolgozatának átlagát! Ezt akkor könnyű megtenned, ha előtte a .set_index() függvény segítségével beállítod, hogy az indexoszlop a nevek oszlopa legyen.
Hány darab faktos lány van?
Írasd ki a 16 évesek neveit!
☠ Hányféle férfi keresztnév szerepel a táblázatban?
☠ Készíts egy táblázatot, amelyben a sorok a különböző korcsoportok, az oszlopok a nemek, az értékek pedig a kor/nem szerinti dolgozatátlagok!
Olvasd be egy pandas DataFrame-be a mintapéldában is használt érettségikről szóló adatfájlt!
Mely városok dobogósak, ha a 2015-ös emelt szintű érettségik átlagos százalékát nézzük? És mely megyék vannak az utolsó ötben?
Az ember gyakran hallja, hogy a lányok szóban jobban teljesítenek, mint a fiúk. Vegyük évenként csoportosítva az emelt szintű érettségik szóbeli pontszámának átlagát a lányokra és a fiúkra egy külön DataFrame-be! Vonjuk ki egymásból a két értéket, majd az eredményt ábrázoljuk oszlopdiagramon. Megjelenik-e a nemek közötti különbség a szóbeli pontszámában? Figyelj a szépen formázott, megfelelő tengelyfeliratokra, és a megfelelő ábraméretre!
A két szinten hogyan oszlanak el a nemek? Ábrázold két kördiagramon a fiúk és a lányok arányát, a körcikkekre írd rá a százalékos értéket 1 tizedesjegyre kerekítve! Figyelj a szépen formázott, megfelelő tengelyfeliratokra, és a megfelelő ábraméretre! (Megjegyzés: a "nő" szóban az "ő" helyett "õ" szerepel.)
Ábrázold hisztogramon 2014-es középszintű érettségi jegyeloszlását, a pandas DataFrame-hez tartozó plot parancsot használva. Az x tengely felirata legyen az 5 lehetséges érdemjegy, az ábrán csak az ezekhez tartozó oszlopok látszódjanak (puska)! Figyelj a szépen formázott, megfelelő tengelyfeliratokra, és a megfelelő ábraméretre!
☠ Találj ki egy számodra érdekes kérdést ezzel az adathalmazzal kapcsolatban, és válaszold meg pandas segítségével! (Ötletek érdekes adatokra: előrehozott érettségi, szintemelő érettségi, levelező képzés stb.)
☠ Mennyi volt iskolatípusonként az emelt szintű dolgozatok átlagpontszáma 2011 és 2015 között évenként? Ábrázold oszlopdiagramon az eredményt, figyelj a szépen formázott, megfelelő tengelyfeliratokra, és a megfelelő ábraméretre! (Segítség: év és iskolatípus szerint is kell majd csoportosítani, majd pedig pivot_table
-t készíteni, miután a megfelelő oszlopokat kivettük az indexből.)
☠ Oldd megy a 2. feladatot apply
segítségével! Vázlat segítségül:
pivot_table
-t, az oszlopok legyenek a nemek.apply
segítségével hozz létre egy új oszlopot, amely a férfi és a nő oszlop különbsége lesz minden sorban.