Program přednášek

  1. Úvodní informace a přednáška na téma asociační pravidla
  2. Rozhodovací stromy I (ID3) a evaluace modelů
  3. Shlukování
  4. Regrese, logistická regrese, metoda největšího spádu
  5. Regex
  6. Rozhodovací stromy II (C4.5)
  7. Indexování textových dokumentů
  8. Vektorový a booleovský model vyhledávání
  9. PageRank a HITS
  10. Datové formáty
  11. Zvaná přednáška
  12. Příklady aplikací

Přednášející

Prof. Jan Rauch, Ing. Tomáš Kliegr

Přesný harmonogram pro aktuální semestr je zveřejněn v systému Insis.

Rozšiřující on-line materiály

  • Data minig (shlukování, asociační pravidla, rozhodovací stromy): on-line kurz s přednáškami na internetu Machine learning (Stanfordská univerzita), Data science (University Washington)
  • Analýza velkých dat (shlukování, asociační pravidla, Pagerank ): slidy a kniha ke kurzu Mining Massive Dataset (Stanfordská univerzita)
  • Information retrieval (vektorový model, invertovaný soubor, regulární výrazy): otevřený on-line kurz Information Retrieval (Stanfordská univerzita)

Obsah těchto webových stránek by neměl být interpretován jako doporučení konkrétních webových stránek, knihy nebo softwaru Vysokou školou ekonomickou v Praze.