描述数据集

描述数据集工作流示意图


使用“描述数据集”工具可以更详细地查看数据集。在对大量数据运行分析之前,使用此工具可以确定输入数据的内容和位置。默认情况下,结果包含一个概述输入图层关键描述符的 JSON 字符串,以及一个详细列出每个字段的汇总统计数据的表格。

您可以选择创建其他输出要素图层以进一步描述数据。可以选择样本图层或范围图层。您可以选择输出其中一种图层或输出两者。

例如,假设您拥有一个包含 15 个数据集的大数据文件共享。每个数据集都有 1000 万个区域要素,代表您所在国家不同区域的建筑物和房屋。您的任务是分析区域 C,但是您不知道哪个数据集包含这些要素。要查找应使用的数据集,请运行“描述数据集”并选择创建范围图层以调查哪个数据集位于研究区域。

再举一例,假设您的任务是完成大量数据的分析工作流。您想尝试该工作流,但是操作完整数据集可能会花费数小时或数天。您可以创建样本图层来有效测试完整工作流,而无需耗费大量时间和资源运行完整分析。

选择要描述的数据集


图层中包含将要描述、汇总和采样的点、线、面或表格要素。

除了从地图中选择图层外,还可以在下拉列表的底部选择 选择分析图层,以浏览至大数据文件共享数据集或要素图层中的内容。

了解您的数据集,方法为创建(可选)


输出其他描述性图层,以提高您对大数据的理解。您可以选择不输出图层,也可以选择输出以下图层中的一个或两个:

  • 范围图层 - 创建一个区域要素,表示输入要素范围和感兴趣区域。
  • 样本图层 - 创建一个子集图层,其中包含在数据集或感兴趣区域中的指定数量的输入要素。

样本图层


从输入图层输出包含要素子集的图层。如果选择 样本图层,您可以指定要在样本图层中返回的要素数。默认情况下,将会在输出图层中返回 100 个样本要素。

值必须大于零。如果指定的数字大于要素总数,则将返回所有要素。

如果选择 使用当前地图范围,则样本图层将包含地图范围内的要素。

范围图层


通过选择 范围图层按钮,可以输出要素图层,其中包含表示输入要素范围的单个要素。此选项默认为选中。

如果选择 使用当前地图范围,则范围图层将表示地图的可见范围。

结果图层名称


要创建的图层的名称。如果您要写入 ArcGIS Data Store,则您的结果将保存在我的内容并添加到地图中。如果您要写入大数据文件共享,则您的结果将存储于大数据文件共享中,并添加到其清单。结果将不会添加到地图中。默认名称基于工具名称以及输入图层名称。如果该图层已存在,将无法使用该工具。