3. cvičení - Rozhodovací stromy
Obsah cvičení
- Algoritmus ID3
- Výpočet entropie
- Výpočet informačního zisku
- Seznámení se software: bigml.com
Podklady
Domácí úkol (nebodovaný)
Dataset 7 instancí obsahuje 4 binární rysy (atributy) A, B, C, D a hodnotu cílového atributu (sloupec Class), který je též binární (T - True, F - False).
A | B | C | D | Class |
---|---|---|---|---|
T | F | T | F | F |
T | F | F | F | T |
F | F | F | T | F |
T | F | F | T | T |
F | T | T | T | T |
T | T | F | T | F |
F | F | F | T | T |
Úlohy
- Který atribut by zvolil algoritmus ID3 jako kořenový? Pokud je více stejně kvalitních atributů, uveďte všechny a pro další výpočet jeden vyberte.
- Vyberte si libovolnou větev s nenulovou entropií a určete atribut, který algoritmus ID3 použije pro další větvení. Pro nejlepší procvičení odvoďte celý strom.
- Pomůcka: Příklad výpočtu - výběr atributu v ID3