追加列

使用说明

追加列是通过两组要素连接字段,将一个数据集的属性追加到源数据集中,并根据源数据集生成一个新的结果数据集(FeatureRDD)。

注意:

  1. 如果指定的源数据集中被追加到目标数据集的字段名集合的某字段在源数据集中不存在,则忽略此字段,只追加源数据集中存在的字段;
  2. 如果指定了追加字段在目标数据集中相对应的字段名集合,则按所指定的字段名在目标数据集中创建所追加的字段;
  3. 当指定的字段名在目标数据集中已存在时,则自动加_x(1、2、3…)进行字段的创建;
  4. 如果在目标数据集中创建字段失败,则忽略此字段,继续追加其它字段;
  5. 必须指定源字段名集合,否则追加不成功;
  6. 一旦指定目标字段名集合,则此集合中字段名必须与源字段名集合中的字段名一一对应。

AttributeJoin

参数说明

参数名 默认值 参数释义 参数类型
源要素数据集 源要素数据集 FeatureRDD
提供属性的要素数据集 提供属性的要素数据集 FeatureRDD
追加的列名称
(可选)
提供属性的要素数据集中需要追加的列名称 String
追加后的属性字段名称
(可选)
追加后的属性字段名称,与 “追加的列名称” 一一对应 String
源数据集的连接字段
(可选)
源数据集的连接字段。如果该参数不存在或者为空,则使用要素的 ID 值进行连接,支持多个 String
连接数据集的连接字段
(可选)
连接数据集的连接字段。如果该参数不存在或者为空,则使用要素的 ID 值进行连接,支持多个,与“源数据集的连接字段” 参数数目一一对应 String