Zadania
Normalizacji zmiennych
Do danych z ostatnich zajęć (gratka.pl):
- Użyj gradient descent, jak zachowuje się regresja według ceny bez normalizacji danych. Dla wybranch ustawień, stwórz wykresy pokazujące wartości funkcji kosztu dla pierwszych N kroków.
- Wykonaj normalizację zmiennych tak jak przedstawiono na wykładzie
- Użyj ponownie gradient descent na znormalizowanych danych, sprawdź podobne ustawienie i wygeneruj nowe wykresy.
Regresja logistyczna
Zamiast przywidywania ceny, spróbuj przewidzieć lokalizację mieszkania: Centrum/Nie-Centrum za pomocą regresji logistcznej.
- Podziel dane trenujące na nowe dane trenjuące (4/5 danych) i nowe dane testujące (1/5 danych)
- Stwórz nową kolumnę zero-jedynkową, która ma wartość 1 jeśli lokalizacja zawiera słowo "centrum" lub "Centrum", 0 w przeciwnym przypadku. Usuń słowa "centrum"/"Centrum" z kolumny z lokalizacją. Cena mieszkania może teraz być cechą.
- Stwórz dwuklasowy model regresji logistycznej Centrum/Nie-Centrum za pomocą nowego zestawu danych trenujących. Podaj procent poprawnych wyników dla nowego zestawu testującego.