使用说明
写出DSF目录工具可以将栅格数据集(RasterRDD)写入指定的DSF数据源中,作为数据源中的一个栅格数据集。
写出DSF目录工具在将栅格数据写入HDFS/DSF中时,还支持Avro和COG两种云存储格式,它们是 SuperMap 针对栅格空间数据的分布式存储提供的支持。其中,Avro二进制存储格式读写较快,可以存储在HDFS/DSF中,但仅支持SuperMap读写;结构化COG格式保留了TIFF格式,支持第三方软件(如ENVI、edars)的读取,但是仅支持存储在HDFS数据库中。
- Avro
Apache Avro是一个数据序列化系统。Avro依赖于模式(Schema),Schema是数据的元数据。Avro数据的读写操作频繁,使用模式减少写入数据,缩小了存储容量,使得序列化快速而又轻巧。这种数据及其模式的自我描述方便于动态脚本语言的使用。当Avro数据存储到文件中时,模式也随之存储,任何程序都可以对文件进行处理。当在RPC中使用Avro时,服务器和客户端可以在连接时交换模式。
另外,Avro模式是用JSON(一种轻量级的数据交换模式)定义的,对已有JSON库的语言容易实现。
- Cloud Optimized GeoTIFF(COG)
COG 是 Cloud Optimized GeoTIFF的简称,指的是云端优化的GeoTIFF。即将数据以GeoTIFF的格式存储在云端,如 S3、Google Cloud Storage、Azure 等。在处理GeoTIFF文件时,按需读取数据,并且尽量实现数据的云端处理,而不用将整个文件下载下来。从而减少了下载和上传的时间,节约了处理费用。其中,COG既可以应用在分布式计算中,也可以利用传统的软件(桌面软件)打开浏览,而Apache Avro格式不支持可视化浏览。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
待写入RDD | 待写出的栅格数据集(RasterRDD)。 | RasterRDD | |
目标DSF目录URI | 目标DSF目录的URI。支持本地目录和HDFS目录: 本地目录示例:hdfs+file:///D:/catalog HDFS目录示例:hdfs://192.168.8.8:9000/catalog。 |
String | |
数据集名 | 结果栅格数据集的名称。 | String | |
结果数据EPSG编码 (可选) |
3857 | 结果栅格数据集的坐标系,该参数的值为坐标系对应的EPSG编码,例如:坐标系WGS1984的EPSG编码为4326。目前,该参数仅支持EPSG 4326、EPSG 3857、EPSG 4490这三种坐标系。 | Integer |
是否写出为COG格式 (可选) |
false | 该参数的值有两种情况:false,默认值,表示写出为Avro格式;true,表示写出为COG格式。 另外,若该参数值为true,写出的结果栅格数据集只支持EPSG 3857的坐标系。 |
Boolean |
输出结果
写出DSF目录工具的输出结果为栅格数据写入DSF数据源的连接信息。