Obsah cvičení

  • Algoritmus K-průměrů
  • Výběr optimálního počtu shluků pomocí metriky WCSS
  • Výpočet informačního zisku
  • Seznámení se software: bigml.com
  • Logistická regrese v programu BigML

On-line video přednášky

Demonstrace

Podklady

Domácí úkol (nebodovaný)

  1. Proveďte shlukování pomocí metody K-Means (Lloydův algoritmus) na stejných datech a se stejným nastavením jako na cvičení (k=3, instance s id1-3 budou použity jako počáteční centroidy).
  2. Nejdříve proveďte normalizaci hodnot všech atributů x, y na interval <0,1> dle vzorce x´=(x-min(x))/(max(x)-min(x))