Обобщенная линейная регрессия

Схема рабочего процесса GeneralizedLinearRegression


Строит Обобщенную линейную регрессию (ОЛР) для вычисления прогнозов или моделирования взаимосвязи между независимыми переменными и зависимой переменной. Инструмент используется для подгонки различных моделей, в частности, непрерывных (Гаусса), бинарных (логистических) и числовых (Пуассона).

Тип анализа


Задает режим выполнения инструмента. Инструмент может быть запущен для обучения модели только для оценки производительности или обучения модели и прогнозирования объектов. Применяются следующие типы прогнозирования:

  • Подгонка модели для оценки производительности модели – Модель будет подогнана и применена к входным данным. Используйте этот параметр, чтобы оценить точность модели перед созданием прогнозов для нового набора данных или понять взаимосвязи и причины изменений прогнозируемой переменной. В результате применения этого параметра будет создан сервис объектов с вашими настроенными данными и диагностикой модели.
  • Подгонка модели и прогноз значений – для входных объектов и объектов прогнозирования будут созданы прогнозирование или классификации. Независимые переменные должны быть представлены и для объектов, используемых для прогнозирования, и для прогнозируемых объектов. В результате применения этого параметра будет создан сервис объектов с моделью, которая настроена для ваших входных данных, с сервисом объектов спрогнозированных значений и диагностикой модели.

Подгонка модели для оценки производительности модели


Используйте этот режим, если хотите выполнить настройку модели и оценить её эффективность.

При выборе этого параметра модель будет обучаться с помощью входного слоя. Используйте этот параметр для оценки точности модели перед созданием прогнозов для нового набора данных. В результате применения этого параметра будет создана диагностика модели, которую можно использовать для ваших обучающих данных.

Подгонка значений и прогнозирование значений


Используйте этот режим, если вы хотите настроить модель и применить её к набору данных для создания прогнозов.

Для объектов будут созданы прогнозы или классификация. В результате применения этого параметра будет создан сервис объектов, диагностика модели и дополнительная таблица значимости переменных.

Выберите слой для создания из него модели


Этот слой точечных, линейных, площадных объектов или объектов данных таблицы содержит зависимые и независимые переменные.

Кроме выбора слоя из вашей карты, можно щелкнуть Выбрать слой анализа в нижней части ниспадающего списка, чтобы найти свои ресурсы для набора данных или векторного слоя файлового хранилища больших данных.

Выберите поле для моделирования


Числовое поле, содержащее наблюдаемые значения для моделирования и тип моделируемого значения. Есть три типа значений, которые вы можете моделировать

  • Непрерывные – представляет непрерывные значения. Модель использует регрессию Гаусса и инструмент вычисляет регрессию по методу наименьших квадратов.
  • Бинарные – представляет наличие или отсутствие значений. Может быть выражено с помощью знаков 1 и 0. Модель использует логистическую регрессию.
  • Дискрентные – представляет события, например, число преступлений, заболеваний или дорожных происшествий. Модель использует регрессию Пуассона.

Выберите слой для прогнозирования значений


Это слой с объектами, которые представляют местоположения, где должны быть вычислены оценки. Каждый объект в этом наборе данных должен содержать значения для всех указанных независимых переменных. Зависимая переменная для этих объектов будет оценена на основании модели, калиброванной для данных во входном слое.

Выберите независимые поля


Одно или несколько полей, представляющих независимые переменные (поля), которые помогают предсказать значение. Будут отображаться только числовые поля.

Выберите, как будут сопоставляться независимые поля


Как переменные входного слоя будут соответствовать переменным слоя прогнозирования. В таблицу будут включены только переменные, используемые при создании модели. Могут использоваться только числовые значения.

Имя слоя результата


Имя создаваемого слоя. Если вы записываете в ArcGIS Data Store, ваши результаты будут сохранены в Моих ресурсах и добавлены на карту. Если вы записываете в файловое хранилище больших данных, ваши результаты будут сохранятся в файловом хранилище больших данных и добавляться в его файл манифеста. Они не будут добавлены на карту. Имя слоя по умолчанию зависит от имени инструмента и имени входного слоя. Если слой уже существует, произойдет сбой.

Возвращаемые результаты будут зависеть от типа анализа. Если выполняется подгонка для оценки эффективности модели, результаты будут содержать слой входных данных, соответствующих модели, и сведения о результатах оценки подгонки модели. Если выполняется подгонка и прогнозирование, результаты будут содержать слой входных данных, соответствующих модели, слой спрогнозированных результатов и сведения о результатах оценки подгонки модели.

При записи в ArcGIS Data Store (реляционное или пространственно-временное хранилище больших данных) с помощью ниспадающего списка поля Сохранить результат в вы можете задать имя папки в разделе Мои ресурсы, в которую будет записан результат.