Generalizowana regresja liniowa

Przeprowadza generalizowaną regresję liniową (Generalized Linear Regression, GLR) w celu generowania prognoz lub modelowania zmiennej zależnej w kontekście jej relacji z zestawem zmiennych objaśniających. To narzędzie umożliwia dopasowywanie modeli ciągłych (Gaussa), binarnych (logistycznych) i dyskretnych (Poissona).

Rodzaj analizy

Określa tryb działania narzędzia. Narzędzie można uruchomić wyłącznie w celu wytrenowania modelu służącego do oceny wydajności lub w celu wytrenowania modelu i prognozowania obiektów. Istnieją następujące typy prognozowania:

Dopasowanie modelu w celu oceny wydajności modelu — dopasowanie modelu i jego zastosowanie do danych wejściowych. Ta opcja służy do oceny dokładności modelu przed wygenerowaniem prognoz dotyczących nowego zestawu danych oraz do objaśnienia relacji i czynników wpływających na prognozowaną zmienną. Danymi wynikowymi w przypadku tej opcji są usługa obiektowa z dopasowanymi danymi i diagnostyka modelu.
Dopasowanie modelu i prognozowanie wartości — generowanie prognoz lub klasyfikacji dla obiektów wejściowych i obiektów prognozy. Zmienne objaśniające należy podać zarówno dla obiektów prognozy, jak i obiektów do prognozowania. Danymi wynikowymi w przypadku tej opcji są usługa obiektowa modelu dopasowanego do danych wejściowych, usługa obiektowa wartości prognozowanych i diagnostyka modelu.

Dopasowanie modelu w celu oceny wydajności modelu

Ten tryb służy do dopasowywania modelu i badania jego dopasowania.

W przypadku tej opcji model jest trenowany z użyciem warstwy wejściowej. Ta opcja służy do oceny dokładności modelu przed wygenerowaniem prognoz dotyczących nowego zestawu danych. Opcja powoduje wygenerowanie diagnostyki modelu i zastosowanie modelu do danych treningowych.

Dopasowanie modelu i prognozowanie wartości

Ten tryb umożliwia dopasowanie modelu oraz jego zastosowanie do zestawu danych w celu wygenerowania prognoz.

Prognozy i klasyfikacje generowane są dla obiektów. Danymi wynikowymi w przypadku tej opcji są usługa obiektowa, diagnostyka modelu oraz opcjonalna tabela istotności zmiennych.

Wybierz warstwę, na podstawie której ma zostać wygenerowany model

Warstwa obiektów punktowych, liniowych, powierzchniowych lub tabelarycznych zawierająca zmienne zależne i objaśniające.

Oprócz wybrania warstwy z mapy, można wybrać opcję Wybierz warstwę analizy znajdującą się w dolnej części listy rozwijanej, aby przejść do zasobów zestawu danych udostępnionych plików dużych zbiorów danych lub warstwy obiektowej.

Wybierz pole do modelowania

Pole liczbowe zawierające obserwowane wartości, które mają być modelowane, oraz typ modelowanych wartości. Istnieją trzy typy wartości, które można modelować

Ciągły — reprezentuje wartości ciągłe. Używany jest model gaussowski, a narzędzie wykonuje zwykłą regresję najmniejszych kwadratów.
Binarny — reprezentuje wartości obecności lub nieobecności. Muszą to być jedynki i zera. Używanym modelem jest regresja logistyczna.
Liczba — reprezentuje wartości dyskretne i zdarzenia, na przykład liczbę przestępstw, przypadki chorób lub wypadki drogowe. Używanym modelem jest regresja Poissona.

Wybierz warstwę, dla której mają być generowane prognozy

Warstwa z obiektami reprezentującymi lokalizacje, w których mają być obliczane wartości szacunkowe. Każdy obiekt w tym zestawie danych powinien zawierać wartości dla wszystkich zmiennych objaśniających. Wartości zmiennej zależnej dla tych obiektów będą szacowane z użyciem modelu skalibrowanego dla danej warstwy wejściowej.

Wybierz pola objaśniające

Jedno lub większa liczba pól reprezentujących zmienne objaśniające (pola), które ułatwiają prognozowanie wartości. Tylko pola liczbowe będą widoczne.

Wybierz sposób dopasowywania pól objaśniających

Sposób, w jaki odpowiednie zmienne w warstwie wejściowej są dopasowywane do zmiennych w warstwie prognozowania. W tabeli będą uwzględnione tylko zmienne używane podczas generowania modelu. Można używać tylko wartości liczbowych.

Nazwa warstwy wynikowej

Nazwa warstwy, która zostanie utworzona w oknie Moje zasoby. W przypadku zapisywania w ArcGIS Data Store wyniki będą przechowywane w obszarze Moje zasoby i dodawane do mapy. W przypadku zapisywania w udostępnionym pliku dużych zbiorów danych wyniki będą przechowywane w udostępnionym pliku dużych zbiorów danych i dodawane do jego manifestu. Nie będą dodawane do mapy. Nazwa domyślna jest tworzona w oparciu o nazwę narzędzia i nazwę warstwy wejściowej. Jeśli warstwa już istnieje, działanie narzędzia nie powiedzie się.

Zwracane wyniki zależą od typu analizy. W przypadku oceny dopasowania modelu wyniki będą zawierać warstwę danych treningowych dopasowaną do modelu i informacje o wynikach oceny dopasowania modelu. W przypadku dopasowywania i prognozowania wyniki będą zawierać warstwę danych wejściowych dopasowaną do modelu, warstwę prognozowanych wyników oraz informacje o wynikach oceny dopasowania modelu.

W przypadku zapisywania w ArcGIS Data Store (relacyjny magazyn danych lub magazyn dużych zbiorów danych czasowo-przestrzennych) przy użyciu listy rozwijanej Zapisz wynik w można określić nazwę folderu w obszarze Moje zasoby, gdzie zostanie zapisany wynik.