使用说明
对栅格数据集进行缓存操作。在进行分布式处理时,如果该数据集将会被多个工具使用,建议对该数据集进行缓存,避免后续多个处理自动化工具对该数据集进行调用时,读取相同栅格数据集的前置流程被反复调用导致运行多次的现象。返回的结果为缓存后的结果栅格数据集(RasterRDD)。
使用此工具可在多个处理自动化工具对同一数据集进行调用的情况下减少数据库被打开进行数据读取的次数,减少处理自动化流程耗时。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
源栅格RDD | 源栅格RDD | RasterRDD | |
缓存等级 | 缓存等级。MEMORYONLY性能最高,内存消耗也最高,针对于内存足够或者数据集内容较小的情况;MEMORYONLYSER性能比较高,对象会序列化节省空间,内存消耗也较高;MEMORYANDDISKSER会将内存放不下部分写入到磁盘,对象会序列化节省空间,性能较低;MEMORYANDDISK会将内存放不下部分写入到磁盘,性能最低,适合数据量较大且对性能指标不太敏感的场景。 | JavaRDDCacheLevel |