Инструмент Поиск выбросов определяет наличие статистически значимых выбросов в пространственном распределении данных.
При изучении карты зачастую мы начинаем искать закономерности тогда, когда их нет. Соответственно, довольно сложно определить, являются ли закономерности результатом реальных пространственных процессов или просто случайны. Вот почему исследователи и аналитики используют статистические методы, такие как Поиск выбросов (Anselin Local Moran's I) для количественного представления пространственных закономерностей. Когда вы находите статистически значимые выбросы в данных, вы получаете ценную информацию. Понимание того, где и когда происходят выбросы, является ключом к нахождению закономерностей. Затем вы изучаете, почему данные в выбросах так значительно отличаются. Например, нахождение районов с особенно высоким уровнем квартирных краж по сравнению с соседними благополучными районами, важно для разработки эффективной стратегии борьбе с кражами, грамотного распределения ограниченных ресурсов полиции, ввода программ соседского дозора, начала углубленных расследований и определения потенциальных подозреваемых.
Точечный или площадной слой, для которого будут вычислены выбросы.
Этот анализ отвечает на вопрос: Где в моих данных присутствуют выбросы?
Если вы работаете с точечными данными и выбрали опцию Число точек, инструмент оценивает пространственное распределение точечных объектов, чтобы ответить на вопрос: Где регистрируется аномальная кластеризация или распределение точек?
Если вы выбираете поле, инструмент оценивает пространственное распределение числового атрибута, связанного с каждым объектом, чтобы ответить на вопросы: Где низкие значения окружены высокими значениями? Где высокие значения окружены низкими?
По умолчанию подсчет точек выполняется по ячейкам сетки, которая строится инструментом на основании ваших точечных данных. Дополнительно вы можете выбрать подсчет точек в шестиугольной сетке или указать площадной слой (обычно с административным делением, таким как участки переписи, границы муниципалитетов или округов), чтобы ответить на вопрос: при полученном числе точек, подсчитанном в пределах каждого площадного объекта, есть ли объекты со статистически значимым низким и высоким значением количеством точек в сравнении с соседними объектами?
Нарисуйте или укажите слой, определяющий области для анализа, чтобы ответить на вопрос: Есть ли в границах области(ей) места с неожиданно высокой или низкой концентрацией точек?
Нарисованные площадные объекты или объекты полигонального слоя должны определять области, где могут появляться точки. Чтобы нарисовать эти области, щелкните кнопку Рисовать, затем щелкните местоположение на карте, чтобы создать полигон. Чтобы нарисовать дополнительные области, снова щелкните кнопку рисования, и затем щелкните местоположение на карте и продолжайте рисовать.
Возможно вы захотите проанализировать закономерности с учетом дополнительных факторов, влияющих на распределение. Например, если ваши точки представляют преступления, деление количества точек на численность населения позволит оценить число преступлений на душу населения, вместо подсчета общего числа преступлений. Деление результата на числовое значение выбранного атрибута называется Нормирование.
Выберите Esri Population и вы сможете обогатить значениями каждый площадной объект, добавив атрибут численности населения, который можно использовать, например, для нормирования. Для этой опции необходимы кредиты.
Вы можете оптимизировать скорость и точность.
Этот инструмент использует перестановки, чтобы определить, насколько ваши данные далеки от случайного распределения. Увеличение числа перестановок увеличивает точность, но вместе с тем растёт время обработки.
Инструмент найдёт оптимальные значения по умолчанию для Размера ячейки и Диапазона расстояний на основе характеристик ваших данных. Но если для целей анализа вам требуется определенный Размер ячейки или Диапазон расстояний, чтобы задать значение можно использовать инструмент Опции замещения.
Опции замещения также полезны, при запуске анализа для различных наборов данных, позволяя сохранять согласованность Диапазона расстояний и Размера ячейки при работе с несколькими наборами данных. Тогда вы будете корректно сравнивать результаты (например, показатели ожирения и диабета или уровни преступности за два разных года).
Размер ячейки сетки, используемой подсчета располагающихся в них точек.
При использовании гексагональной сетки для подсчета точек внутри её ячеек, это расстояние используется в качестве высоты шестиугольников.
Каждый объект анализируется в сравнении с соседними объектами, расположенными в пределах указанного вами расстояния. Инструмент вычислит расстояние по умолчанию. Или с помощью этой опции вы можете задать определенное расстояние, приемлемое для вашего анализа.
Например, если вы изучаете закономерности ежедневных поездок в город из пригородов и знаете, что среднее расстояние поездки составляет 15 миль, для анализа вы можете использовать диапазон расстояний в 15 миль.
Укажите имя слоя, который будет создан в разделе Мои ресурсы и добавлен на карту. Этот итоговый слой будет отображать статистически значимые выбросы высоких или низких значений, либо количества точек. Если имя итогового слоя уже используется, появится запрос на его переименование.
С помощью ниспадающего списка поля Сохранить результат в вы можете задать имя папки в разделе Мои ресурсы, в которую будет записан результат.