使用说明
写出DSF目录工具可以将DSF要素数据集(DSFFeatureRDD,也称为地理分区要素数据集)写入DSF数据源,作为其中的一个矢量数据集。
DSFFeatureRDD(DSF要素数据集)是在FeatureRDD(要素数据集)基础上产生的一种数据模型,DSF要素数据集是按照地理范围,将要素数据集按照相同的规则进行地理范围分区,具体实现是通过建立格网索引或四叉树索引,将落在相同索引内的对象进行重新划分分区,分区中的要素是重复存储的,如果一个要素跨越多个分区,则每个分区中都有一个要素对象的副本,这样,空间上在同一范围内的对象都会在同一个结点上。这种 方式的优点是适用于对海量空间数据进行分布式计算,具有较高的分析性能;但在使用时数据的重分区往往会较为耗时,而且对网络带宽和磁盘读写要求比较高。
关于DSF要素数据集有两种索引:格网索引和四叉树索引,不同索引适用于不同的数据特点,若数据分布比较均匀,推荐使用格网索引,这样构建索引的时间耗费会很少。
注:DSF保存路径不能为已存在的路径。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
待写出的要素数据集 | 待写出的DSF要素数据集(DSFFeatureRDD)。DSF要素数据集可以通过对要素数据集(FeatureRDD)构建格网索引或者四叉树索引的方式获得。 | DSFFeatureRDD | |
路径 | 写出的DSF目录,支持本地目录和HDFS目录: 本地目录示例:hdfs+file:///D:/catalog HDFS目录示例:hdfs://192.168.8.8:9000/catalog。 |
String |
输出结果
写出DSF目录工具的输出结果为写出的矢量数据集的数据连接信息。