Generaliseret lineær regression

Workflow-diagram for Generaliseret lineær regression


Udfører Generaliseret lineær regression (GLR) for at generere forudsigelser eller for at modellere en afhængig variabel med hensyn til dens relation til et sæt forklarende variabler. Dette værktøj kan bruges til at tilpasse kontinuerlige (gaussiske), binære (logistiske) og tællemæssige (Poisson) modeller.

Analysetype


Angiver værktøjets funktionsmåde. Værktøjet kan køres for at træne en model til kun at vurdere ydeevne eller for at træne en model og forudsige objekter. Der findes følgende typer forudsigelser:

  • Tilpas en model til vurdering af model-ydeevne – En model bliver tilpasset og anvendt på inputdataene. Brug denne indstilling til at vurdere nøjagtigheden af ​​din model, før du genererer forudsigelser på et nyt datasæt, eller til at forstå relationer og drivere for din forudsagte variabel. Output fra denne indstilling bliver en featuretjeneste af de tilpassede data og modeldiagnostik.
  • Tilpas en model og forudsig værdier – Forudsigelser eller klassifikationer genereres for inputobjekter og forudsigelsesobjekter. Forklarende variabler skal være til rådighed for både forudsigelsesobjekterne og de objekter, der skal forudsiges. Output fra denne indstilling bliver en featuretjeneste af din model, der er tilpasset dine inputdata, en featuretjeneste af forudsagte værdier samt modeldiagnostik.

Tilpas en model for at vurdere modelydelsen


Brug denne tilstand, hvis du vil tilpasse en model og undersøge tilpasningen.

Med denne indstilling bliver modellen trænet ved hjælp af et inputlag. Brug denne indstilling til at vurdere nøjagtigheden af ​​din model, før du genererer forudsigelser på et nyt datasæt. Denne indstilling viser modeldiagnostik og anvender modellen på dine træningsdata.

Tilpas en model, og forudsig værdier


Brug denne tilstand, hvis du vil tilpasse en model og anvende modellen på datasættet for at generere forudsigelser.

Der genereres forudsigelser eller klassifikationer for objekter. Output ved denne indstilling er en featuretjeneste, modeldiagnostik samt en valgfri tabel over variablernes betydning.

Vælg et lag, som en model skal genereres ud fra


Laget indeholder punkt-, linje-, område- eller tabelobjekter, som indeholder de afhængige og forklarende variabler.

Udover at du kan vælge et lag i dit kort, kan du vælge Vælg analyselag nederst på rullelisten for at gå til dit indhold til et big data-fildelingsdatasæt eller -vektorlag.

Vælg det felt, der skal modelleres


Det numeriske felt, der indeholder de observerede værdier, som modelleres, og den type ​​værdi, du modellerer. Der er tre typer værdier, du kan modellere

  • Kontinuerlig - Repræsenterer kontinuerlige værdier. Den anvendte model er gaussisk, og værktøjet udfører regression efter mindste kvadraters princip.
  • Binær - Repræsenterer tilstedeværelses- eller fraværsværdier. Disse skal være 1-taller og 0’er. Den anvendte model er Logistisk Regression.
  • Antal - Repræsenterer diskret og repræsenterer begivenheder, for eksempel antallet af forbrydelser, sygdomsforekomster eller trafikulykker. Den anvendte model er Poisson-regression.

Vælg et lag, der skal forudsiges værdier for


Et lag med objekter, der repræsenterer steder, hvor estimater skal beregnes. Hver funktion i dette datasæt skal indeholde værdier for alle angivne forklarende variabler. Den afhængige variabel for disse objekter bliver estimeret ved hjælp af modellen, der er kalibreret til inputlaget.

Vælg forklarende felter


Et eller flere felter, der repræsenterer de forklarende variabler (felter), som hjælper med at forudsige værdien. Kun numeriske felter er synlige.

Vælg, hvordan forklarende felter skal matches


Hvordan de tilsvarende variabler i inputlaget matcher variablerne i forudsigelseslaget. Kun de variabler, der anvendes ved generering af modellen, medtages i tabellen. Der kan kun bruges numeriske værdier.

Navn på resultatlag


Navnet på det lag, som oprettes. Hvis du skriver til et ArcGIS Data Store, bliver dine resultater gemt i Mit indhold og føjet til kortet. Hvis du skriver til en big data-fildeling, bliver dine resultater gemt i big data-fildelingen og føjet til dens manifest. De bliver ikke føjes til kortet. Standardnavnet er baseret på navnet på værktøjet og navnet på inputlaget. Hvis laget allerede findes, vil værktøjet ikke fungere.

De returnerede resultater afhænger af typen af ​​analyse. Hvis du tilpasser for at vurdere modeltilpasning, vil resultaterne indeholde et lag af inputdata, der passer til modellen og resultatoplysninger, der vurderer modeltilpasningen. Hvis du tilpasser og forudsiger, vil resultaterne indeholde et lag af inputdataene, der passer til modellen, et lag af forudsagte resultater og resultatoplysninger, der vurderer modeltilpasningen.

Når du skriver til ArcGIS Data Store (relationelt eller spatiotemporalt big data-lager) ved hjælp af rullelisten Gem resultat i , kan du angive navnet på en mappe i Mit indhold, hvor resultatet gemmes.