GAT2018 ||
Teema lehele
||
English
- Millised neli puistutüüpi eristab klasteranalüüs (k-means clustering, k = 4) lisatud tabelis olevatest andmetest?
- Kui suure osa puude leviku erinevustest need rühmad ära kirjeldavad?
- Kui suur on tõenäosus, et nii suur või veel suurem osa erinevustest saab sama arvu klastrite abil ära kirjeldatud, kui puud paikneksid juhuslikult?
- Kas klastrid sõltuvad vaatluste sarnasuse/erinevuse mõõdikust (Euclidean, Block, SQ Euclidean jt)?
- Milline mõõdik annab teistsugused klastrid?
- Lisa vastusele mõõdik, mida kasutasid esimesele ja teisele küsimusele vastamisel.
Selgitus ja lahendamisjuhised
Ülesandes antud rühmitamisviis (
k-means, k = 4) tähendab, et klastrite arv on ette antud ja peab olema neli.
Analüüsitavateks tunnusteks tuleks valida kõik puud alates kuusest kuni muude puudeni. Pane tähele, et ülesandes küsitakse puistutüüpe, mitte puid.
RASA kalkulaatori klasteranalüüsi kasutamisel kopeeri need veerud kalkulaatori sisendaknasse. Kui kopeerisid veerud koos tunnuste nimedega, siis märgi linnuke lahtrisse
Esimeses reas on tunnuste nimed. Igasse klastrisse kuuluvaid objekte näed tulemuste paneeli parempoolses veerus.
Statistica programmi kasutamisel on need tulemuste vormi
Advanced osa paneelis
Members of each cluster distances.
Kuna küsitakse puistutüüpe, siis peaks vastuseks olema metsade nimed, mitte puude nimed — näiteks männikud ja mitte mänd.
Varieeruvusest ära kirjeldatud osa ja klastrite statistilise olulisuse ehk puude juhuslikul paiknemisel nelja klastri abil ära kirjeldatud varieeruvuse saab RASA kalkulaatori tulemuste veerust.
Kuidas klastrid sõltuvad erinevuse mõõdikust, seda saad ise võrrelda.
Vastamiseks ning teiste saadetud ja andmebaasis oleva vastuse vaatamiseks tuleb selle ainega seotud kasutajana sisse logida.