Crea models i genera prediccions mitjançant una adaptació de l'algoritme de bosc aleatori de Leo Breiman, que és un mètode d'aprenentatge automàtic supervisat. Les prediccions es poden fer de variables categòriques (classificació) i de variables contínues (regressió). Les variables explicatives són camps de la taula d'atributs de les entitats de formació. L'eina es pot executar per generar un model destinat a avaluar el rendiment, o bé per generar un model i predir els resultats en altres datasets.
Especifica el mode de funcionament de l'eina. L'eina es pot executar per formar un model destinat només a avaluar el rendiment, o bé per formar un model i predir les entitats. Els tipus de predicció són els següents:
Utilitzeu aquest mode si voleu ajustar un model i investigueu l'ajust.
Amb aquesta opció, el model es formarà mitjançant una capa d'entrada. Utilitzeu aquesta opció per avaluar la precisió del model abans de generar prediccions sobre un nou dataset. Aquesta opció generarà el diagnòstic del model a la finestra de missatges i aplicarà el model a les vostres dades de formació.
Utilitzeu aquest mode si voleu ajustar un model i apliqueu el model al dataset per generar prediccions.
Es generaran prediccions o classificacions d'entitats. La sortida d'aquesta opció serà un servei d'entitats, el diagnòstic del model i una taula opcional de la importància de les variables.
Capa d'entitats que conté la variable que es predirà i els camps que s'utilitzaran per generar la predicció.
A banda de triar una capa del mapa, podeu seleccionar Trieu la capa d'anàlisi al final de la llista desplegable per cercar al vostre contingut una capa d'entitats o un dataset de recursos compartits de fitxers de dades massives.
Capa d'entitats que representa les ubicacions on es faran les prediccions. Aquesta capa d'entitats també ha de contenir totes les variables explicatives proporcionades com a camps que es corresponen amb les utilitzades de les entitats de formació.
A banda de triar una capa del mapa, podeu seleccionar Trieu la capa d'anàlisi al final de la llista desplegable per cercar al vostre contingut una capa d'entitats o un dataset de recursos compartits de fitxers de dades massives.
Camp de les entitats de formació que contenen els valors que s'utilitzaran per formar el model. Aquest camp conté valors coneguts (de formació) de la variable, que s'utilitzaran per a la predicció en ubicacions desconegudes. Si els valors són categòrics (per exemple, Auró, Pi, Roure), seleccioneu la casella Categòric.
Un o diversos camps que representen les variables explicatives (camps) que ajuden a predir el valor o la categoria de la variable que s'ha de predir. Utilitzeu la casella Categòric per a totes les variables que representen classes o categories (com ara coberta del sòl, presència o absència). Especifiqueu el valor cert per a les variables que representen classes o categories, com ara coberta del sòl, presència o absència, i el valor fals si la variable és contínua.
Nombre d'arbres que es crearan al model. En general, es crearan més arbres en una predicció del model més precisa, però el model tardarà més a calcular-se. El nombre d'arbres per defecte és de 100.
Nombre mínim d'observacions necessari per mantenir una fulla (que és el node terminal en un arbre sense més divisions). El valor mínim de regressió per defecte és 5 i el valor de classificació per defecte és 1. Per a grans volums de dades, si s'augmenten aquests nombres es reduirà el temps d'execució de l'eina.
Nombre màxim de divisions que es faran al nivell de l'arbre. Si s'utilitza una profunditat màxima alta, es crearan més divisions, el que podria augmentar les possibilitats d'ajustar el model en excés. El valor per defecte està controlat per dades i depèn del nombre d'arbres creats i del nombre de variables incloses.
Especifica el percentatge d'entitats de la capa de formació utilitzat per a cada arbre de decisió. El valor per defecte és 100 % de les dades. De manera aleatòria, s'obtenen mostres per a cada arbre de dos terços de les dades especificades.
Cada arbre de decisió del bosc es crea mitjançant una mostra o un subconjunt aleatori (dos terços aproximadament) de les dades de formació disponibles. Si s'utilitza un percentatge inferior de les dades d'entrada per a cada arbre de decisió, la velocitat de l'eina augmenta per a datasets molt grans.
Especifica el nombre de variables explicatives utilitzades per crear cada arbre de decisió.
Cadascun dels arbres de decisió del bosc es crea mitjançant un subconjunt aleatori de les variables explicatives especificades. Si s'augmenta el nombre de variables utilitzades en cada arbre de decisió, augmentaran les possibilitats d'ajustar el model en excés, especialment si hi ha una o dues variables dominants. Una pràctica habitual és utilitzar l'arrel quadrada del nombre total de variables explicatives si la variable que heu de predir és numèrica, o bé dividir el nombre total de variables explicatives entre 3 si la variable que s'ha de predir és categòrica.
Manera en què les variables corresponents de la capa de formació coincidiran amb les variables de la capa de predicció. Només les variables utilitzades a la formació s'inclouran a la taula.
Especifica el percentatge (entre un 0 % i un 50 %) d'entitats de la capa de formació que es reservaran com a dataset de proba per a la validació. El model es formarà sense aquest subconjunt de dades aleatori, i els valors observats d'aquestes entitats es compararan amb el valor predit. El valor per defecte és 10 %.
Nom de la capa que es crearà a El meu contingut i s'afegirà al mapa. El nom per defecte es basa en el nom de l'eina i el de la capa d'entrada. Si la capa ja existeix, se us demanarà que escriviu un altre nom.
El resultats retornats dependran del tipus d'anàlisi. Si esteu fent formació per avaluar l'ajust del model, els resultats contindran una capa de dades de formació ajustada al model i informació de resultats que avalua l'ajust del model. Si esteu fent formació i predicció, els resultats contindran una capa de dades de formació ajustada al model, una capa dels resultats predits i informació de resultats que avalua l'ajust del model.
Mitjançant el quadre desplegable Desa el resultat a, podeu especificar el nom d'una carpeta d' El meu contingut on es desarà el resultat.