Luo malleja ja ennusteita käyttämällä Leo Breimanin satunnaisen metsän algoritmia, joka on valvotun koneoppimismenetelmän muunnelma. Ennusteet voidaan tehdä sekä kategorisille muuttujille (luokittelu) ja jatkuville muuttujille (regressio). Selittävät muuttujat ovat koulutuskohteiden ominaisuustietotaulun kenttiä. Työkalun avulla voi luoda mallin suorituskyvyn arviointia varten tai luoda ensin mallin ja sitten ennustaa tulokset toiseen aineistoryhmään.
Määrittää työkalun käyttötilan. Työkalun avulla voi kouluttaa mallin vain suorituskyvyn arviointia varten tai kouluttaa ensin mallin ja sitten ennustaa kohteisiin. Ennustetyypit ovat seuraavat:
Käytä tätä tilaa, jos haluat sovittaa mallin ja tutkia sopivuutta.
Tämän vaihtoehdon avulla mallia koulutetaan käyttämällä lähtöaineiston karttatasoa. Tämän vaihtoehdon avulla voit arvioida mallin tarkkuutta ennen uuden aineistoryhmän ennusteiden luontia. Tämä vaihtoehto tulostaa mallin diagnostiikan viesti-ikkunaan ja käyttää mallia koulutusaineistossa.
Käytä tätä tilaa, jos haluat sovittaa mallin ja käyttää mallia aineistoryhmässä ennusteiden luontia varten.
Ennusteet ja luokittelut luodaan kohteille. Tämän vaihtoehdon tulosaineistona on kohdepalvelu, mallin diagnostiikka ja valinnaisen muuttujan tärkeystaulu.
Kohdekarttataso, joka sisältää ennustettavan muuttujan ja kentät, joita käytetään ennusteen luonnissa.
Sen lisäksi, että voit valita karttatason kartasta, voit valita Valitse analyysikarttataso -vaihtoehdon avattavan luettelon alareunasta ja selata Big Data -tiedostoresurssin aineistoryhmän tai karttatason sisältöön.
Kohdekarttataso, joka edustaa sijainteja, joissa ennusteet tehdään. Tämän kohdekarttatason on sisällettävä myös kaikki selittävät muuttujat, jotka on määritetty koulutuskohteiden kenttiä vastaavina kenttinä.
Sen lisäksi, että voit valita karttatason kartasta, voit valita Valitse analyysikarttataso -vaihtoehdon avattavan luettelon alareunasta ja selata Big Data -tiedostoresurssin aineistoryhmän tai karttatason sisältöön.
Koulutuskohteiden kenttä, joka sisältää mallin koulutuksessa käytettävät arvot. Tämä kenttä sisältää niiden muuttujien tunnetut (koulutus-) arvot, joita käytetään ennustamiseen tuntemattomissa sijainneissa. Jos arvot ovat kategoriset (esimerkiksi Vaahtera, Mänty, Tammi), valitse Kategorinen-valintaruutu.
Vähintään yksi selittäviä muuttujia (kenttiä) edustava kenttä, josta on apua ennustettavan muuttujan arvon tai luokan ennustamisessa. Käytä Kategorinen-valintaruutua kaikkien niiden muuttujien kohdalla, jotka edustavat luokkia tai kategorioita (kuten maanpeitettä, olemassaoloa tai puuttumista). Määritä muuttujien arvoksi tosi kaikkien niiden muuttujien kohdalla, jotka edustavat luokkia tai kategorioita, kuten maanpeitettä, olemassaoloa tai puuttumista, ja epätosi, jos muuttuja on jatkuva.
Mallissa luotavien puiden määrä. Mitä enemmän puita, sitä tarkempia tuloksia malli ennustaa, mutta mallin laskenta kestää kauemmin. Puiden oletusmäärä on 100.
Niiden havaintojen vähimmäismäärä, jotka tarvitaan lehden säilyttämiseen (lehti on puun päätesolmu, joka ei enää haaraudu). Oletusarvoinen vähimmäismäärä regressiossa on viisi (5) ja luokittelussa yksi (1). Hyvin suurissa aineistoissa näiden lukujen suurentaminen heikentää työkalun suoritusaikaa.
Niiden haarautumien enimmäismäärä, jotka tehdään puussa alaspäin. Jos käytetään suurta enimmäissyvyyttä, haarautumia luodaan enemmän, mikä voi lisätä mallin ylisovituksen mahdollisuutta. Oletusarvo on aineistoon perustuva ja riippuu luotavien puiden ja sisällytettävien muuttujien määrästä.
Määrittää koulutuskarttatason niiden kohteiden prosenttiosuuden, joita käytetään kussakin päätöspuussa. Oletusarvo on 100 prosenttia aineistosta. Kunkin puun otokset otetaan satunnaisesti kahdesta kolmasosasta määritetystä aineistosta.
Kukin metsän päätöspuu luodaan käyttämällä käytettävissä olevan koulutusaineiston satunnaisotosta tai osajoukkoa (noin kaksi kolmasosaa). Käyttämällä alhaisempaa lähtöaineiston prosenttiosuutta kussakin päätöspuussa nopeuttaa työkalua hyvin suurilla aineistoryhmillä.
Määrittää niiden selittävien muuttujien määrän, joita käytetään kunkin päätöspuun luonnissa.
Kukin metsän päätöspuu luodaan käyttämällä määritettyjen selittävien muuttujien satunnaista osajoukkoa. Lisäämällä kussakin päätöspuussa käytettävien muuttujien määrää lisää mallin ylisovituksen mahdollisuutta, erityisesti silloin, kun hallitsevia muuttujia on yksi tai muutama. Yleinen käytäntö on käyttää selittävien muuttujien kokonaismäärän neliöjuurta, jos ennustettava muuttuja on numeerinen, tai jakaa selittävien muuttujien kokonaismäärä kolmella (3), jos ennustettava muuttuja on kategorinen.
Määrittää, miten koulutuskarttatason vastaavat muuttujat täsmäävät ennustekarttatason muuttujien kanssa. Vain koulutuksessa käytetyt muuttujat sisältyvät tauluun.
Määrittää koulutuskarttatason niiden kohteiden prosenttiosuuden (0–50 prosenttia), jotka varataan validoinnin testiaineistoryhmäksi. Mallia koulutetaan ilman tätä satunnaista aineiston osajoukkoa ja kohteiden havaittuja arvoja verrataan ennustettuun arvoon. Oletusarvo on 10 prosenttia.
Sen tason nimi, joka luodaan kohtaan Oma sisältö ja joka lisätään karttaan. Oletusnimi perustuu työkalun nimeen ja lähtökarttatason nimeen. Jos taso on jo luotu, sinua pyydetään antamaan toinen nimi.
Palautettavat arvot määräytyvät analyysin tyypin perusteella. Jos koulutat mallin sopivuuden arviointia varten, tulokset sisältävät malliin sopivan koulutusaineiston karttatason ja tulostiedot, joissa arvioidaan mallin sopivuutta. Jos koulutat ja ennustat, tulokset sisältävät malliin sopivan koulutusaineiston karttatason, ennustettujen tulosten karttatason ja tulostiedot, joissa arvioidaan mallin sopivuutta.
Avattavan Tallenna tulos kohteeseen -valikon avulla voit määrittää sen Oma sisältö -kansion nimen, johon tulos tallennetaan.