Trova outlier

Lo strumento Trova outlier consente di determinare la presenza di outlier statisticamente rilevanti nel modello spaziale dei dati.

Sono presenti aree anomale nel pattern dei dati (reati, alberi, incidenti stradali)? Come si può verificarlo?
È stato effettivamente individuato un outlier di rilevanza statistica (ai fini della spesa, della mortalità infantile, di punteggi di test elevati) oppure la mappa raffigurerebbe una situazione diversa se venisse cambiata la simbologia?

Lo strumento Trova outlier consente di rispondere con sicurezza a queste domande.

Ogni volta che si osserva una mappa, è naturale che gli occhi e il cervello umano provino a individuare modelli anche quando non esistono. Di conseguenza può risultare difficile sapere se i modelli presenti nei dati sono il risultato di processi spaziali reali o semplicemente il risultato del caso. È per questo motivo che ricercatori e analisti utilizzano metodi statistici, come Trova outlier (statistica I di Anselin Local Moran) per quantificare modelli spaziali. L'individuazione di cluster o outlier di rilevanza statistica nei dati consente di disporre di informazioni importantissime. Sapere dove e quando si verificano gli outlier può offrire indizi importanti sui processi che portano alla creazione dei modelli visualizzati. Il successivo passo prevede l'analisi del motivo alla base delle differenze significative nelle aree degli outlier. Sapere, ad esempio, che il numero di furti in appartamento è significativamente elevato in un quartiere circondato da altri quartieri caratterizzati da percentuali di furto molto basse è essenziale per definire adeguate strategie di prevenzione, allocare risorse di polizia limitate, predisporre programmi di sorveglianza del quartiere, autorizzare investigazioni approfondite sui reati o identificare potenziali sospetti.

Scegliere il layer per il quale verranno calcolati gli outlier

Il layer di punti o area nel quale verranno trovati gli outlier.

Trova outlier di

Questa analisi consente di rispondere alla domanda seguente: dove si trovano gli outlier spaziali nei dati?

Se i dati sono punti e si sceglie Conteggi punti, questo strumento valuterà la disposizione delle feature puntuali nello spazio e consentirà di rispondere alla seguente domanda: in che area i punti si raggruppano in cluster o si distribuiscono in modo imprevisto?

Se si sceglie un campo, lo strumento valuterà la disposizione nello spazio dei valori associati a ciascuna feature e consentirà di rispondere alle seguenti domande: in che area i valori bassi sono circondati da quelli alti? In che area i valori alti sono circondati da quelli bassi?

Calcolare i punti all'interno

L'impostazione predefinita consiste nel calcolare i punti all'interno di una griglia creata dallo strumento e basata sui dati dei punti. In alternativa, è possibile contare i punti all'interno di una griglia esagonale o specificare un layer di area (che rispecchia in genere distretti amministrativi, ad esempio sezioni di spoglio, confini municipali o regioni/contee) per rispondere alla seguente domanda: dato il numero di punti calcolati in ogni feature area, sono presenti località con punti di rilevanza statistica con valori alti o bassi nelle aree circostanti?

Definisci dove sono possibili i punti

Tracciare o specificare un layer che definisce dove sono possibili incidenti per rispondere alla seguente domanda: nelle aree di confine sono presenti località con concentrazioni di punti straordinariamente alte o basse?

Le feature area tracciate o quelle nel layer di area specificato devono definire la possibile posizione dei punti. Per tracciare queste aree, fare clic sul pulsante Disegna e quindi fare clic su una posizione sulla mappa per creare una forma di tipo area. Per tracciare altre aree, fare clic di nuovo sull'apposito pulsante, quindi fare clic su un'altra posizione sulla mappa per continuare.

Suddividi per

Talvolta potrebbe essere necessario analizzare i modelli che prendono in considerazione distribuzioni sottostanti. Ad esempio, se i punti rappresentano eventi criminosi, dividendo per la popolazione totale si dovrebbe avere come risultato un'analisi dei crimini pro capite, piuttosto che il totale non elaborato dei crimini. La scelta di un attributo in funzione del quale viene effettuata la divisione è definita normalizzazione.

Scegliendo Popolazione Esri ciascuna feature di area verrà arricchita con i valori della popolazione che verranno poi utilizzati come attributo per cui dividere. Questa opzione utilizzerà crediti.

Ottimizza per

È possibile scegliere di ottimizzare la velocità o la precisione.

Questo strumento utilizza le permutazioni per determinare la diversità del pattern spaziale dei dati rispetto ai punti casuali. Se si aumenta il numero di permutazioni, aumentano sia la precisione che i tempi di elaborazione.

Opzioni di sovrapposizione

Lo strumento individuerà le impostazioni ottimali per i valori predefiniti delle opzioni Dimensione cella e Banda di distanza in base alle caratteristiche dei dati disponibili. Tuttavia, in presenza di impostazioni specifiche per Dimensioni cella o Banda di distanza che rendano significativa l'analisi, per impostare tali valori è possibile utilizzare l'opzione Opzioni di sovrapposizione.

Le impostazioni dell'opzione Opzioni di sovrapposizione risultano utili anche quando vengono eseguite analisi su dataset diversi in quanto consentono di garantire la coerenza delle impostazioni delle opzioni Banda di distanza e Dimensione cella tra più dataset. È quindi possibile confrontare i risultati, ad esempio le percentuali di individui obesi o diabetici oppure i tassi di criminalità relativi a due anni diversi.

Dimensione cella

Dimensione delle celle della griglia utilizzata per il calcolo dei punti al suo interno.

In caso di utilizzo di una griglia esagonale per il calcolo dei punti al suo interno, questa distanza viene utilizzata come altezza degli esagoni.

Banda di distanza

Ogni feature viene analizzata all'interno del contesto di queste feature contigue all'interno della distanza specificata. Lo strumento calcolerà automaticamente una distanza predefinita oppure è possibile utilizzare questa opzione per impostare una distanza specifica significativa per l'analisi.

Ad esempio, se si stanno analizzando i pattern relativi al pendolarismo e si conosce la distanza media del viaggio (15 miglia), è possibile utilizzare la banda di distanza di 15 miglia.

Nome layer risultati

Specificare un nome per il layer che verrà creato in I miei contenuti e aggiunto alla mappa. Nel layer risultante saranno visualizzati gli outlier di rilevanza statistica con valori alti e bassi o conteggi di punti. Se il nome del layer dei risultati esiste già, verrà chiesto di rinominarlo.

Utilizzare la casella a discesa Salva risultato in per specificare il nome di una cartella di I miei contenuti in cui salvare il risultato.