获取指定数目的要素集合

使用说明

获取指定数目的要素集合,可以将RDD类型的数据转化为对象数组,同时会获取指定数目的数据到driver端内存中,因此对于数据量较大的数据集执行该工具时,需注意控制获取的数量,防止内存溢出。

由于Spark在进行内存计算时,算子分为action(执行)和transformation(转换)两种。transformations不会马上计算出结果,而action则会触发计算。【获取指定数目的要素集合】算子充当action执行算子,使得前面的功能算子进行执行,可以达到测试前置算子功能的目的。

参数说明

参数名 默认值 参数释义 参数类型
输入的要素数据集 输入的要素数据集 FeatureRDD
要获取的要素对象的数目 0 要获取的要素对象的数目 Integer

输出结果

要素对象集合 (SimpleFeatureCollection)