Décrire le jeu de données

Diagramme de processus Décrire le jeu de données


L’outil Décrire le jeu de données permet un examen plus détaillé de votre jeu de données. Avant de lancer l’analyse sur de volumes de données importants, utilisez cet outil pour déterminer la nature et l’emplacement de vos données en entrée. Par défaut, les résultats constituent une chaîne JSON mettant en évidences les descripteurs clés de votre couche en entrée et une table détaillant les statistiques de synthèse de chaque champ.

Vous pouvez aussi créer des couches d’entités en sortie supplémentaires pour décrire davantage vos données. Les options sont un exemple de couche ou une couche de l’étendue. Vous pouvez choisir de produire l’une ou l’autre ou encore les deux.

Considérons, par exemple, que vous détenez un partage de fichiers Big Data comportant 15 jeux de données. Chaque jeu de données comporte 10 millions d’entités de zone représentant les immeubles et les maisons des différentes régions de votre pays. Vous avez pour mission d’analyser la région C, mais vous ignorez quel jeu de données contient ces entités. Pour identifier le jeu de données à utiliser, exécutez l’outil Décrire le jeu de données et choisissez de créer une couche de l’étendue afin de rechercher les jeux de données figurant dans la région d’étude.

Autre exemple, imaginons que vous deviez effectuer un processus d’analyse sur un gros volume de données. Vous voulez essayer le processus, mais le traitement de la totalité du jeu de données peut exiger plusieurs heures voire plusieurs jours. Au lieu de consacrer du temps et des ressources à l’analyse complète, créez un exemple de couche pour tester efficacement le processus complet.

Choisir le jeu de données à décrire


Couche contenant les entités tabulaires, surfaciques, linéaires ou ponctuelle à décrire, synthétiser ou utiliser à titre d’exemple.

Outre le fait de choisir une couche de votre carte, vous pouvez sélectionner Choose Analysis Layer (Choisir une couche d’analyse) au bas de la liste déroulante pour parcourir votre contenu et rechercher une couche d’entités ou un jeu de données de partage de fichiers Big Data.

Comprendre votre jeu de données en créant un (facultatif)


Couches descriptives supplémentaires en sortie visant à améliorer la compréhension de vos données Big Data. Vous pouvez choisir de produire en sortie aucune, une ou deux des couches suivantes :

  • Extent layer (Couche de l’étendue) : crée une entité de zone représentant l’étendue de vos entités en entrée ou la zone d’intérêt.
  • Sample layer (Exemple de couche) : crée une couche d’un sous-ensemble contenant la quantité spécifiée d’entités en entrée de votre jeu de données ou de votre zone d’intérêt.

Exemple de couche


Couche en sortie contenant un sous-ensemble des entités issues de votre couche en entrée. Si Sample layer (Exemple de couche) est sélectionné, vous êtes en mesure de spécifier le nombre d’entités à renvoyer dans l’exemple de couche. Par défaut, 100 entités sont renvoyées à titre d’exemples dans la couche en sortie.

La valeur doit être supérieure à zéro. Si vous indiquez un nombre supérieur que le nombre total des entités, toutes les entités sont renvoyées.

Si Use current map extent (Utiliser l’étendue courante de la carte) est sélectionné, l’exemple de couche comportera des entités provenant de l’étendue de la carte.

Couche de l’étendue


Générez une couche d’entités contenant une seule étendue qui représente l’étendue des entités en entrée en sélectionnant le bouton Extent layer (Couche de l’étendue). Cette propriété est sélectionnée par défaut.

Si Use current map extent (Utiliser l’étendue courante de la carte) est sélectionné, la couche de l’étendue représentera l’étendue visible de la carte.

Nom de la couche de résultat


Nom de la couche à créer. Si vous écrivez sur une instance ArcGIS Data Store, les résultats seront enregistrés dans My Content (Mon contenu) et ajoutés à la carte. Si vous écrivez sur un partage de fichiers Big Data, les résultats seront enregistrés dans le partage de fichiers Big Data et ajoutés à son manifeste. Il ne sera pas ajouté à la carte. Le nom par défaut repose sur le nom de l'outil et sur le nom de la couche en entrée. Si la couche existe déjà, l'outil échoue.