统计记录数

使用说明

统计数据集中要素对象的数目,常用于测试算子功能。

由于Spark进行内存计算时,算子分为action(执行)和transformation(转换)两种。transformations不会马上计算出结果,action则会触发计算。统计记录数算子充当action执行算子,使得前面的功能算子进行执行,可以达到测试算子功能的目的。

参数说明

参数名 默认值 参数释义 参数类型
输入的要素数据集 输入的要素数据集 FeatureRDD