构建模型

可以在构建器中从零开始创建模型,也可以在顶部导航栏中点击“导入”,将可视化建模的 XML 模板导入画布中进行建模。

添加工具

用户可以添加左侧边栏中工具列表、模型列表、共享列表中的工具。

  • 工具列表:来源于托管 iServer 服务器中的内置工具
  • 模型列表:来源于托管 iServer 服务器中的内置模型、用户个人发布的模型、共享给我的(部门或组织)模型
  • 共享列表:用户个人发布的模型、来源于托管 iServer 服务器中已发布模型(管理员可见,并且可决定将这些模型共享给哪些用户、部门或组织)

可以通过以下方式添加处理自动化工具:

  • 在左侧边栏中的工具、模型列表中,选择工具并将其拖拽至画布中,工具及其各节点将会显示在画布中
  • 使用工具、模型列表上方的搜索框快速查询工具,然后将其拖拽至画布中进行建模
  • 支持框选画布中的多个工具,在当前画布和跨画布进行复制(Ctrl+C)和粘贴(Ctrl+V)

移动工具

在画布中用鼠标左键选中工具的功能节点,拖拽工具进行整体移动。

连接工具

一个模型通常需要由多个处理自动化工具构成,而工具之间需要建立连接,连接的操作方式为:

  • 绘制连接线:将鼠标移动至前置工具输出节点的连接点上,连接点高亮。按住鼠标左键不放,鼠标移动至待连接工具输入节点的连接点上,该连接点高亮后松开鼠标即可。为保证模型的正常运行,需要保证前置节点的输出参数与后续节点的输入参数相同
  • 删除连接线:单击选中工具或连接线后,在右键菜单中选择删除,或通过 Delete 键删除。如果误删了工具无需重新拖拽,建模画布的所有操作均支持快捷键撤销(Ctrl+Z)和恢复(Ctrl+Y)

重命名工具

当模型包含多个同名工具或者工具名称不符合使用场景时,您可以单击鼠标左键选中工具节点,在右键菜单中选择“重命名”对工具进行重新命名。

简化显示工具

工具参数过多或者工具过多时,画布内容会显得杂乱,您可以通过以下操作优化可视化建模的显示。

  • 右键画布空白区域,选择“全部折叠”按钮,即可收起工具参数。折叠后的工具同样支持移动
  • 在画布右侧菜单中选择“水平自动布局”或“垂直自动布局”,一键整理画布排版

添加标注

当模型较为复杂、业务流程不易理解时,您可以对模型元素添加标注以提升模型的易读性。

  • 为模型添加标注:右键画布空白区域,选择“创建标注”
  • 为单个工具添加标注:单击鼠标左键选中工具节点,在右键菜单中选择“创建标注”。在移动工具节点时,标注可随工具一同移动

 

设置参数

设置模型参数

要为模型中的工具指定参数设置,需要通过鼠标左键点击输入节点,此时在页面右侧的参数栏会出现参数填写注释,根据注释要求输入符合格式的参数值即可。当前工具所有必填参数填写完毕后,工具的功能节点框线会由灰色变为蓝色,由此,您可根据节点的外框颜色情况快速检查模型参数填写情况。

  • 文件路径:需要导入的数据路径信息,来源包含本地上传、从资源中心添加、我的文件夹。 我的文件夹数据来源于GPA共享存储指定存储路径下 “personalDir/{userid}” 的文件夹,您可以将所需数据拷贝至我的文件夹,无需上传便可直接使用。

如果您不想使用工具参数的默认配置,那么可以根据需求自定义工具参数。具体请参见: 自定义工具参数

设置集群环境

使用 Apache Spark 进行空间大数据分布式分析,在运行模型前可以通过以下两种方式配置集群环境参数:

方式一:配置单模型集群环境参数

处理自动化服务建模页面中使用大数据工具时,点击工具节点可以在参数面板切换“spark 环境设置”选项,设置下列集群环境参数,在运行模型时将连接集群并提交处理自动化任务。

  • 部署模式:包括 local(单进程),local(多进程),client,cluster
  • 集群 master 地址:必填参数,如 spark://172.16.16.8:7077
  • 自定义应用程序的名称:必填参数,如 geoprocessing
  • Spark 属性参数设置:集群配置的参数设置,选填参数。如 spark.cores.max=4,spark.executor.memory=16g,spark.driver.host=192.168.17.43

方式二:配置全局集群环境参数

为了方便复用集群环境参数, 提供了全局 Spark 环境参数的配置。具体步骤如下:

1. 点击处理自动化建模界面右上角的“设置,进行 Spark 全局环境参数的设置;

2. 在 Spark 环境设置面板,点击“添加模式”按钮,以配置环境参数。支持将添加的一组环境参数设置为默认模式,勾选“Spark 集群默认部署模式”后,当新增带有大数据工具的模型时,将自动填充该环境参数; 

3. 在模型的右侧参数面板 > “Spark 环境设置” 标签页下,新增“环境参数类型”参数,通过下拉菜单可以配置自定义环境参数或切换全局环境参数,也可以按需修改默认填充的全局环境参数。

 

运行模型

在建模器中可以运行部分模型或者整个模型。

  • 运行部分模型:鼠标右键单击一个工具,点击“执行到此节点”按钮,即可运行处理自动化流程至所选工具。该操作可以用于验证工具参数是否正确
  • 运行整个模型:点击页面左上角的“执行”按钮,即可按顺序运行模型至完成整个处理自动化流程

运行成功的工具将会在工具节点右上角出现绿色的成功提示,反之出现红色的失败提示。在模型执行过程中,可以通过页面下方的执行日志窗口,实时查看模型的执行日志信息。另外,还可以通过执行日志窗口来过滤不同级别的信息,以便快速诊断模型错误。

任务中心

点击右上角的“任务中心”按钮,可以查询到当前用户数据分析任务列表,实时追踪模型执行情况,查看历史任务的执行进度、耗时、详情和日志信息

 

模型元数据

模型元数据是对模型进行描述的重要信息,详细的模型元数据可帮助他人充分了解模型的使用方法与应用范围,以减少知识共享和应用共享的障碍。模型元数据的查看方式如下:

  • 在画布空白区域单击鼠标右键,选择“查看元数据”,即可弹出查看元数据的窗口
  • 将模型发布至模型列表后,点击该工具的菜单中的“查看元数据”,即可弹出查看元数据的窗口

模型元数据包括:

  • 名称:对模型进行概括性的标题;
  • 者:可填写建模人员姓名;
  • 创建及更新时间:系统自动生成创建和修改模型元数据的时间;
  • 摘要:用于概述模型应用的项目背景;
  • 描述:用于介绍模型的使用方法,和适用范围;
  • 标签:用于添加关键字;
  • 缩略图:可自动生成模型缩略图;

如果您需要编辑元数据信息,在查看元数据窗口点击“编辑元数据”按钮,即可编辑模型的标题、作者、摘要、描述和标签,还可以一键生成模型缩略图,编辑完成后点击“确定”,模型元数据将会保存至模型文件中。