使用说明
读取索引工具用于读取DSF数据的地理分区索引。DSF有两种地理分区索引:格网索引和四叉树索引。
地理分区索引是按照地理范围,将要素按照相同的规则进行地理范围分区,具体实现是通过建立格网索引或四叉树索引,将落在相同索引内的对象进行重新划分分区,分区中的要素是重复存储的,如果一个要素跨越多个分区,则每个分区中都有一个要素对象的副本,这样,空间上在同一范围内的对象都会在同一个结点上。这种方式的优点是适用于对海量空间数据进行分布式计算,具有较高的分析性能;但在使用时数据的重分区往往会较为耗时,而且对网络带宽和磁盘读写要求比较高。
关于DSF要素数据集有两种索引:格网索引和四叉树索引,不同索引适用于不同的数据特点,若数据分布比较均匀,推荐使用格网索引,这样构建索引的时间耗费会很少。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
路径 | 待读取空间分区索引的DSF数据目录,支持本地目录和HDFS目录,例如:本地目录:file:///E:\data\DSF\RailwayAln;HDFS目录:hdfs://172.16.16.8:9000/DSFVector/Guangxi600w/DLTB。 | String |
输出结果
读取索引工具的执行结果为指定DSF数据的空间分区索引对象 (PartitionIndexer)。