Zadania

Normalizacji zmiennych

Do danych z ostatnich zajęć (gratka.pl):

  1. Użyj gradient descent, jak zachowuje się regresja według ceny bez normalizacji danych. Dla wybranch ustawień, stwórz wykresy pokazujące wartości funkcji kosztu dla pierwszych N kroków.
  2. Wykonaj normalizację zmiennych tak jak przedstawiono na wykładzie
  3. Użyj ponownie gradient descent na znormalizowanych danych, sprawdź podobne ustawienie i wygeneruj nowe wykresy.

Regresja logistyczna

Zamiast przywidywania ceny, spróbuj przewidzieć lokalizację mieszkania: Centrum/Nie-Centrum za pomocą regresji logistcznej.

  1. Podziel dane trenujące na nowe dane trenjuące (4/5 danych) i nowe dane testujące (1/5 danych)
  2. Stwórz nową kolumnę zero-jedynkową, która ma wartość 1 jeśli lokalizacja zawiera słowo "centrum" lub "Centrum", 0 w przeciwnym przypadku. Usuń słowa "centrum"/"Centrum" z kolumny z lokalizacją. Cena mieszkania może teraz być cechą.
  3. Stwórz dwuklasowy model regresji logistycznej Centrum/Nie-Centrum za pomocą nowego zestawu danych trenujących. Podaj procent poprawnych wyników dla nowego zestawu testującego.