Stvara modele i generira predviđanja pomoću adaptacije slučajnog algoritma za šume Lea Breimana, što je metoda strojnog učenja pod nadzorom. Predviđanja se mogu provesti i za kategoričke varijable (klasifikacija) i za kontinuirane varijable (regresija). Varijable za objašnjenje jesu polja u atributnoj tablici geoobjekata obuke. Alat se može pokrenuti kako bi se generirao model za procjenu izvedbe ili generirao model i predvidjeli rezultati za druge skupove podataka.
Određuje način rada alata. Alat se može pokrenuti kako bi se obučio model samo za procjenu izvedbe ili obučio model i za predviđanje za geoobjekte. Vrste predviđanja glase kako slijedi:
Upotrijebite ovaj način ako želite prilagoditi model i istražiti prikladnost.
S ovim će se odabirom model obučiti pomoću ulaznog sloja. Upotrijebite ovu opciju za procjenu točnosti modela prije generiranja predviđanja na novom skupu podataka. Ovom će se opcijom izvesti dijagnostike modela u prozoru poruka i primijeniti model na podatke o obuci.
Upotrijebite ovaj način ako želite prilagoditi model i primijeniti model na skup podataka za generiranje predviđanja.
Predviđanja ili klasifikacije generirat će se za geoobjekte. Izlazna vrijednost ove opcije bit će usluga geoobjekata, dijagnostike modela i opcionalna tablica promjenljive važnosti.
Sloj geoobjekata koji sadrži varijablu za predviđanje i polja koja će se upotrijebiti za generiranje predviđanja.
Osim odabira sloja s vaše karte, možete odabrati Izaberi sloj za analizu na dnu padajućeg popisa za pretraživanje vaših sadržaja za skup podataka za dijeljenje datoteka velikih podataka ili sloj geoobjekta.
Sloj geoobjekata koji predstavlja lokacije na kojima će se izraditi predviđanja. Taj sloj geoobjekata mora također sadržavati varijable za objašnjenje koje su navode kao polja koja odgovaraju onima koja se upotrebljavaju u geoobjektima obuke.
Osim odabira sloja s vaše karte, možete odabrati Izaberi sloj za analizu na dnu padajućeg popisa za pretraživanje vaših sadržaja za skup podataka za dijeljenje datoteka velikih podataka ili sloj geoobjekta.
Polje iz geoobjekata obuke koji sadrže vrijednosti koje će se upotrijebiti za obuku modela. Ovo polje sadrži poznate (za obuku) vrijednosti varijable koje će se upotrijebiti za predviđanje na nepoznatim lokacijama. Ako su vrijednosti kategorične (primjerice, javor, bor, hrast) označite potvrdni okvir Kategorički.
Jedno ili više polja koja predstavljaju varijable (polja) za objašnjenje koje pomažu predvidjeti vrijednost ili kategoriju varijable za predviđanje. Upotrijebite kategorički potvrdni okvir za sve varijable koje predstavljaju razrede ili kategorije (kao što su kopno ili prisutnost ili odsutnost). Navedite varijablu kao istinitu za sve one koje predstavljaju razrede ili kategorije kao što su kopno ili prisutnost ili odsutnost i kao neistinitu ako je varijabla neprekidna.
Broj stabala koji treba stvoriti u modelu. Više stabala općenito će rezultirati točnijim predviđanjem modela, ali će izračunavanje modela trajati duže. Zadani je broj stabala 100.
Minimalni broj opažanja potrebnih za zadržavanje lista (to je terminalni čvor na stablu bez daljnjih dijeljenja). Zadani je minimum za regresiju 5, a zadana je vrijednost za klasifikaciju 1. Za vrlo velike podatke, povećanje tih brojeva smanjit će vrijeme rada alata.
Maksimalni broj dijeljenja koji će se napraviti niz stablo. pomoću velike maksimalne dubine stvorit će se više dijeljenja, što može povećati šanse za prekomjernu prilagodbu modela. Zadane su postavke vođene podacima i ovise o broju stabala i broju uključenih varijabli.
Određuje postotak geoobjekata u sloju za obuku koje se upotrebljava za svako stablo odlučivanja. Zadana je vrijednost 100 posto podataka. Uzorci za svako drvo uzimaju se slučajnim odabirom iz dvije trećine specificiranih podataka.
Svako stablo odlučivanja u šumi stvara se pomoću slučajnog uzorka ili podskupa (približno dvije trećine) dostupnih podataka o obuci. Upotrebom nižeg postotka ulaznih podataka za svako stablo odlučivanja povećava se brzina alata za vrlo velike skupove podataka.
Određuje broj varijabli za objašnjenje koje se upotrebljavaju za stvaranje svakog stabla odlučivanja.
Svako od stabla odlučivanja u šumi stvara se pomoću slučajnog podskupa specificiranih varijabli za objašnjenje. Povećanje broja varijabli koje se upotrebljavaju u svakom stablu odlučivanja povećat će šanse za prekomjernu prilagodbu vašeg modela, posebice ako postoji jedna ili par dominantnih varijabli. Uobičajena je praksa upotrijebiti korijen od ukupnog broja varijabli za objašnjenje ako vaša varijabla za predviđanje broj ili podijeliti ukupan broj varijabli za objašnjenje s 3 ako je varijabla za predviđanje kategorična.
Kako će se odgovarajuće varijable u sloju za obuku podudarati s varijablama u sloju predviđanja. U tablici će biti uključene samo varijable upotrijebljene u obuci.
Određuje postotak (između 0 posto i 50 posto) geoobjekata u sloju za obuku koji treba rezervirati kao testni skup podataka za provjeru valjanosti. Model će se obučiti bez ovog slučajnog podskupa podataka, a promatrane vrijednosti za te geoobjekte usporedit će se s predviđenom vrijednošću. Zadana je vrijednost 10 posto.
Ovo je naziv sloja koji će se stvoriti u dijelu Moj sadržaj i dodati karti. Zadani naziv temelji se na nazivu alata i nazivu sloja unosa. Ako sloj već postoji, od vas će se zatražiti da unesete drugi naziv.
Dobiveni rezultati ovisit će o vrsti analize. Ako obučavate za procjenu prikladnosti modela, rezultati će sadržavati sloj podataka o obuci koji odgovaraju modelu i podatke o rezultatu ocjenjivanja prikladnosti modela. Ako obučavate i predviđate, rezultati će sadržavati sloj podataka o obuci koji odgovaraju modelu, sloj predviđenih rezultata i podatke o rezultatu ocjenjivanja prikladnosti modela.
Upotrebom padajućeg izbornika Spremi rezultat u možete odrediti naziv mape u dijelu Moj sadržaj gdje će se spremiti rezultat.