写出DSF目录

使用说明

写出DSF目录工具可以将DSF要素数据集(DSFFeatureRDD,也称为地理分区要素数据集)写入DSF数据源,作为其中的一个矢量数据集。

DSFFeatureRDD(DSF要素数据集)是在FeatureRDD(要素数据集)基础上产生的一种数据模型,DSF要素数据集是按照地理范围,将要素数据集按照相同的规则进行地理范围分区,具体实现是通过建立格网索引或四叉树索引,将落在相同索引内的对象进行重新划分分区,分区中的要素是重复存储的,如果一个要素跨越多个分区,则每个分区中都有一个要素对象的副本,这样,空间上在同一范围内的对象都会在同一个结点上。这种 方式的优点是适用于对海量空间数据进行分布式计算,具有较高的分析性能;但在使用时数据的重分区往往会较为耗时,而且对网络带宽和磁盘读写要求比较高。

关于DSF要素数据集有两种索引:格网索引和四叉树索引,不同索引适用于不同的数据特点,若数据分布比较均匀,推荐使用格网索引,这样构建索引的时间耗费会很少。

注:DSF保存路径不能为已存在的路径。

参数说明

参数名 默认值 参数释义 参数类型
待写出的要素数据集 待写出的DSF要素数据集(DSFFeatureRDD)。DSF要素数据集可以通过对要素数据集(FeatureRDD)构建格网索引或者四叉树索引的方式获得。 DSFFeatureRDD
路径 写出的DSF目录,支持本地目录和HDFS目录:
本地目录示例:hdfs+file:///D:/catalog
HDFS目录示例:hdfs://192.168.8.8:9000/catalog。
String

输出结果

写出DSF目录工具的输出结果为写出的矢量数据集的数据连接信息。