Encontrar Valores Atípicos

Encontrar Valores Atípicos


A ferramenta Encontrar Valores Atípicos permite determinar se existem valores atípicos com relevância estatística no padrão espacial dos seus dados.

A ferramenta Encontrar Valores Atípicos ajuda-o a responder a essas perguntas de modo fiável.

De cada vez que observamos um mapa, é natural que os nossos olhos e os nossos cérebros comecem a tentar detetar padrões, mesmo que não existam. Consequentemente, pode ser difícil saber se os padrões encontrados nos seus dados são o resultado de processos espaciais verdadeiros ou se resultam apenas de algo aleatório. É por esta razão que os investigadores e analistas utilizam métodos estatísticos como o Encontrar Valores Atípicos (Anselin Local Moran's I) para quantificar padrões espaciais. Quando efetivamente encontra um valores atípicos ou clustering com relevância estatística nos seus dados, obtém informações importantes. Saber onde e quando ocorreram valores atípicos pode fornecer pistas importantes acerca dos processos que estão na base dos padrões que está a visualizar. O próximo passo consistirá em investigar a razão pela qual as coisas são significativamente diferentes nessas áreas de valores atípicos. Saber que os assaltos a residências, por exemplo, são significativamente mais elevados em determinada zona, apesar de a mesma se encontrar entre zonas com taxas reduzidas de assaltos a residências é uma informação essencial caso necessite de conceber estratégias de prevenção eficazes, alocar recursos policiais limitados, iniciar programas de vigilância locais, autorizar investigações criminais aprofundadas ou identificar possíveis suspeitos.

Selecionar a camada para a qual os valores atípicos serão calculados


A camada de ponto ou de área a partir da qual os valores atípicos serão identificados.

Encontrar valores atípicos de


Esta análise responde à pergunta: Onde se encontram os valores atípicos espaciais nos meus dados?

Se os seus dados são pontos e você escolher Contagens de Pontos, esta ferramenta irá avaliar a distribuição espacial dos elementos pontos para responder à questão: Onde estão os pontos agrupados em clusters de forma inesperada ou onde é que estão dispersos?

Se selecionar um campo, esta ferramenta irá avaliar a distribuição espacial dos valores associados a cada elemento para responder às questões: Onde se encontram valores reduzidos rodeados por valores elevados? Onde se encontram valores elevados rodeados por valores reduzidos?

Contagem de pontos dentro


O padrão é contar pontos numa grade de arrastão criado pela ferramenta com base nos seus dados de ponto. Em alternativa, pode optar por contar pontos no interior de uma grelha de hexágonos ou fornecer uma camada de área (normalmente, estas refletem relatórios administrativos, tais como áreas de recenseamento, limites municipais ou condados) de forma a responder à pergunta: Tendo em conta o número de pontos contados dentro de cada elemento de área, existem locais com contagens de pontos elevadas ou reduzidas estatisticamente significativas em comparação com outras zonas?

Definir onde os pontos são possíveis


Desenhe ou forneça uma camada definindo onde os incidentes podem ocorrer de forma a responder à pergunta: No interior das áreas existem locais com concentrações de pontos inesperadamente elevadas ou reduzidas?

Os elementos da área desenhada ou os elementos na área da camada especificada definem onde os pontos devem ocorrer. Para desenhar essas áreas , clique no botão Desenhar e clique numa localização no mapa para criar uma forma de área. Para representar áreas adicionais, clique novamente no botão desenhar e clique numa localização no mapa para continuar.

Dividido por


Por vezes pode querer analisar os padrões que levam em conta as distribuições subjacentes. Por exemplo, se seus pontos representam crimes, dividindo pelo total da população resultaria numa análise de crimes per capita em vez de contagens de crime cruas. Escolher um atributo a dividir por é muitas vezes referida como normalização.

Selecionar População Esri irá enriquecer cada elemento de área com valores populacionais, que depois serão utilizados como o atributo pelo qual efetuar a divisão. Esta opcção irá usar créditos.

Optimizar para


Pode optar por otimizar velocidade ou precisão.

Esta ferramenta utiliza permutações para determinar a diferença entre o padrão espacial dos seus dados e mera aleatoriedade. Aumentar o número de permutações aumenta a precisão, mas também aumenta o tempo de processamento.

Substituir Opções


A ferramenta encontrará definições ideais para predefinições de Tamanho de Célula e Banda de Distância com base nas caraterísticas dos seus dados. No entanto, caso tenha uma Tamanho de Célula ou Banda de Distância específica que faça sentido para a sua análise, as Opções de Substituição podem ser utilizadas para definir esses valores.

As Opções de Substituição também são úteis ao executar análise em diferentes conjuntos de dados, permitindo-lhe manter a consistência de Banda de Distância e Tamanho de Célula transversalmente em vários conjuntos de dados. Depois pode comparar os resultados (por exemplo, taxas de obesidade e diabetes, ou mesmo taxas de criminalidade para dois anos diferentes).

Tamanho de Células


O tamanho das células de grelha dentro das quais contar pontos.

Ao utilizar uma grelha de hexágonos dentro da qual contar pontos, esta distância é utilizada como altura dos hexágonos.

Banda de Distância


Cada elemento é analisado no contexto dos elementos vizinhos que se localizam dentro da distância que especificar. A ferramenta irá calcular uma distância padrão, ou pode utilizar esta opção para definir uma distância específica que faça sentido para a sua análise.

Por exemplo, se estiver a estudar padrões de deslocações diárias e souber que a viagem média para o trabalho tem a distância de 15 milhas, por exemplo, poderá utilizar uma banda de distância de 15 milhas.

Nome da camada resultante


Forneça um nome para a camada que será criada no O Meu Conteúdo e adicionada ao mapa. Esta camada resultante irá mostrar-lhe valores atípicos estatisticamente significativos de valores altos e baixos ou de contagens de pontos. Se o nome da camada de resultados já existir, ser-lhe-á solicitado que altere o nome da mesma.

Ao utilizar a caixa suspensa Guardar resultado em pode definir o nome da pasta em O Meu Conteúdo onde o resultado será guardado.