Pontklaszterek keresése

Pontklaszterek keresése


A Pontklaszterek keresése eszköz pontszerű vektoros elemek klasztereit keresi a környező zajon belül a térbeli eloszlásuk alapján.

Egy nem kormányzati szervezet egy adott, kártevőkön keresztül terjedő betegséget tanulmányoz. Egy pont-típusú adathalmazzal rendelkezik a vizsgált területen belüli háztartásokról, amelyek némelyike fertőzött, némelyike nem. A Pontklaszterek keresése eszköz segítségével egy elemző meghatározhatja a fertőzött háztartások klasztereit, és kijelölheti azt a területet, ahol meg kell kezdeni a gyógykezelést és a kártevőirtást.

Válassza ki a réteget, amelyhez meg szeretné találni a klasztereket


A pontréteg, amelyen belül a klaszterek találhatók. A rétegeknek vetületi térbeli referenciában kell lenniük, vagy az alkalmazott térbeli referenciát vetületi koordináta-rendszerre kell állítani az Elemzési környezetek segítségével.

Ahelyett, hogy egy réteget választ a térképéről, választhatja a legördülő lista alján lévő Eredményréteg kiválasztása lehetőséget is, ha a saját tartalomban szeretne big data-fájlmegosztó adathalmazt vagy vektoros réteget keresni.

Válassza ki a használandó klaszterezési módszert


Az a klaszterezési módszer, amelynek segítségével elkülönítik a pontszerű vektoros elemek klasztereit a környező zajtól. Választhat a meghatározott távolság vagy az önbeállító klaszterezési algoritmus módszere között.

A meghatározott távolság módszere (DBSCAN) esetén a program egy meghatározott keresési tartományt használ a sűrű klaszterek és a szórványos zaj elkülönítésére. A meghatározott távolság módszere (DBSCAN) gyorsabb, de csak akkor megfelelő, ha nagyon egyértelmű, hogy melyik keresési tartomány alkalmazandó az esetlegesen meglévő klaszterek definiálására. A meghatározott távolság módszerével (DBSCAN) a hasonló sűrűségű klaszterek találhatók meg.

Az önbeállítás módszere (HDBSCAN) esetén nincs szükség keresési tartomány meghatározására, ez a módszer azonban időigényesebb. Az önbeállítás módszerével (HDBSCAN) a meghatározott távolság módszeréhez (DBSCAN) hasonlóan pontklaszterek találhatók meg, de az önbeállítás módszere esetén a program különböző keresési tartományokat alkalmaz, így küönböző sűrűségű klasztereket képes megtalálni.

A pontok minimális száma a klaszterként történő értelmezéshez


Ezt a paramétert a program a választott klaszterezési módszertől függően eltérő módokon alkalmazza:

  • Meghatározott távolság módszere (DBSCAN)—egy ponttól adott távolságra található vektoros elemek számát határozza meg, amely szám elérése szükséges ahhoz, hogy a pont klaszterként legyen értelmezve. A távolság meghatározása a Keresési tartomány korlátozása erre: paraméter alkalmazásával történik.
  • Önbeállítás módszere (HDBSCAN)—a sűrűség értékelésekor figyelembe vett pontokkal szomszédos vektoros elemek számát (beleértve önmagát) határozza meg. Ez a szám egyben a klaszterek kinyerésénél megengedett minimális klaszterméret is.

Keresési tartomány korlátozása erre:


A meghatározott távolság módszerének (DBSCAN) alkalmazása esetén ez a paraméter az a távolság, amelyen belül a klaszterként történő értelmezéshez szükséges minimális számú pontnak lennie kell. Ha alkalmazandó klaszterezési módszerként az önbeállítás módszere (HDBSCAN) van kiválasztva, akkor a program ezt a paramétert nem alkalmazza.

Eredményréteg neve


A létrehozandó réteg neve. Ha egy ArcGIS Data Store helyre ír, akkor eredményei a Saját tartalom alatt lesznek elmentve, és hozzá lesznek adva a térképhez. Ha egy big data fájlmegosztóba ír, akkor eredményei a big data fájlmegosztóba lesznek elmentve, és hozzá lesznek adva annak jegyzékfájljához. Nem lesznek hozzáadva a térképhez. Az alapértelmezett név az eszköz nevétől és a bemenő réteg nevétől függ. Ha a réteg már létezik, akkor a művelet sikertelen lesz.

Ha ArcGIS Data Store (relációs vagy térbeli-időbeli big data adattárba) ír az Eredmény mentési helye legördülő mező használatával, akkor megadhatja a Saját tartalom mappájának nevét, ahová az eszköz menti az eredményt.