Atrast punktu klasterus

Atrast punktu klasterus


Rīks Atrast punktu klasterus uz apkārtējo "trokšņu" fona atrod punktu elementu klasterus, ņemot vērā to telpisko sadalījumu.

Piemēram, nevalstiskā organizācija pēta konkrētu kaitēkļu izraisītu slimību. Tās rīcībā ir punktu datu kopa, kas apzīmē mājsaimniecības pētāmajā teritorijā, un daži no šiem punktiem ir invadēti, bet daži nav. Izmantojot rīku Atrast punktu klasterus, analītiķis var noteikt inficēto mājsaimniecību datu klasterus, lai palīdzētu atrast teritoriju, kur sākt ārstēšanu un kaitēkļu iznīcināšanu.

Izvēlēties slāni, kuram tiks atrasti klasteri


Punktu slānis, kurā tiks atrasti klasteri. Slāņiem ir jābūt ar projicēto telpisko atskaiti, vai arī apstrādes telpiskā atskaite ir jāiestata uz projicēto koordinātu sistēmu, izmantojot Analīzes darba vidi.

Papildus slāņa izvēlei kartē varat izvēlēties Izvēlēties analīzes slāni nolaižamā saraksta apakšā, lai saturā atrastu Big Data koplietojuma datu kopu vai elementu slāni.

Izvēlieties izmantojam klasteru veidošanas metodi


Klasteru veidošanas metode, kas tiks izmantota, lai atšķirtu punkta elementu kopas no apkārtējiem traucējumiem. Varat izvēlēties izmantot noteiktu attālumu vai pašregulējošu klasterēšanas algoritmu.

Definētais attālums (DBSCAN) izmanto norādīto meklēšanas diapazonu, lai atdalītu blīvus klasterus no vāja trokšņa. Definētais attālums (DBSCAN) ir ātrāks, bet ir piemērots tikai tad, ja ir ļoti skaidrs meklēšanas diapazons, kas labi darbojas, definējot visas kopas, kas var būt pieejamas. Definētais attālums (DBSCAN) atrod klasterus ar līdzīgu blīvumu.

Pašregulācijai (HDBSCAN) nav jānorāda meklēšanas diapazons, bet tā ir daudz laikietilpīgāka metode. Pašregulējoši (HDBSCAN) atrod punktu kopas, kas ir līdzīgas noteiktajam attālumam (DBSCAN), bet izmanto dažādus meklēšanas diapazonus, kas ļauj veidot kopas ar dažādu blīvumu.

Minimālais punktu skaits, kas uzskatāms par klasteri


Šis parametrs tiek izmantots atšķirīgi atkarībā no izvēlētās klasterēšanas metodes:

  • Definētais attālums (DBSCAN) — norāda līdzekļu skaitu, kas jāatrod noteiktā attālumā no punkta, lai šis punkts sāktu veidot klasteri. Attālums tiek definēts, izmantojot Ierobežot meklēšanas diapazonu parametru.
  • Pašregulējoša (HDBSCAN) – norāda to iezīmju skaitu, kas atrodas blakus katram punktam (ieskaitot pašu punktu) un ko ņem vērā, novērtējot blīvumu. Šis skaitlis ir arī minimālais klastera lielums, kas pieļaujams, izgūstot klasterus.

Ierobežojiet meklēšanas diapazonu līdz


Izmantojot noteiktu attālumu (DBSCAN), šis parametrs ir attālums, kurā jāatrod minimālais punktu skaits, ko uzskata par kopu. Šis parametrs netiek izmantots, ja kā izmantojamā klasterēšanas metode tiek izvēlēta pašregulācija (HDBSCAN).

Rezultātu slāņa nosaukums


Slāņa nosaukums, kas tiks izveidots. Ja rakstāt uz ArcGIS Data Store, rezultāti tiks saglabāti mapē Mans saturs un pievienoti kartei. Ja rakstā uz lielu datu failu koplietojumu,, rezultāti tiks saglabāti lielajā datu failu koplietojumā un pievienot tā sarakstam. Tas netiks pievienots kartei. Noklusējuma nosaukums ir balstīts uz rīka nosaukumu un ievades slāņa nosaukumu. Ja slānis jau pastāv, rīks nedarbosies.

Rakstot uz ArcGIS Data Store (relāciju vai telpas un laika lielo datu krātuvi), izmantojot nolaižamo lodziņu Saglabāt rezultātu, var norādīt mapes nosaukumu mapē Mans saturs, kurā tiks saglabāts rezultāts.