使用说明
获取指定数目的要素集合,可以将RDD类型的数据转化为对象数组,同时会获取指定数目的数据到driver端内存中,因此对于数据量较大的数据集执行该工具时,需注意控制获取的数量,防止内存溢出。
由于Spark在进行内存计算时,算子分为action(执行)和transformation(转换)两种。transformations不会马上计算出结果,而action则会触发计算。【获取指定数目的要素集合】算子充当action执行算子,使得前面的功能算子进行执行,可以达到测试前置算子功能的目的。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
输入的要素数据集 | 输入的要素数据集 | FeatureRDD | |
要获取的要素对象的数目 | 0 | 要获取的要素对象的数目 | Integer |
输出结果
要素对象集合 (SimpleFeatureCollection)