读取索引

使用说明

读取索引工具用于读取DSF数据的地理分区索引。DSF有两种地理分区索引:格网索引和四叉树索引。

地理分区索引是按照地理范围,将要素按照相同的规则进行地理范围分区,具体实现是通过建立格网索引或四叉树索引,将落在相同索引内的对象进行重新划分分区,分区中的要素是重复存储的,如果一个要素跨越多个分区,则每个分区中都有一个要素对象的副本,这样,空间上在同一范围内的对象都会在同一个结点上。这种方式的优点是适用于对海量空间数据进行分布式计算,具有较高的分析性能;但在使用时数据的重分区往往会较为耗时,而且对网络带宽和磁盘读写要求比较高。

关于DSF要素数据集有两种索引:格网索引和四叉树索引,不同索引适用于不同的数据特点,若数据分布比较均匀,推荐使用格网索引,这样构建索引的时间耗费会很少。

参数说明

参数名 默认值 参数释义 参数类型
路径 待读取空间分区索引的DSF数据目录,支持本地目录和HDFS目录,例如:本地目录:file:///E:\data\DSF\RailwayAln;HDFS目录:hdfs://172.16.16.8:9000/DSFVector/Guangxi600w/DLTB。 String

输出结果

读取索引工具的执行结果为指定DSF数据的空间分区索引对象 (PartitionIndexer)。