构建模型
可以在构建器中从零开始创建模型,也可以在顶部导航栏中点击“导入”,将可视化建模的 XML 模板导入画布中进行建模。
添加工具
用户可以添加左侧边栏中工具列表、模型列表、共享列表中的工具。
- 工具列表:来源于托管 iServer 服务器中的内置工具
- 模型列表:来源于托管 iServer 服务器中的内置模型、用户个人发布的模型、共享给我的(部门或组织)模型
- 共享列表:用户个人发布的模型、来源于托管 iServer 服务器中已发布模型(管理员可见,并且可决定将这些模型共享给哪些用户、部门或组织)
可以通过以下方式添加处理自动化工具:
- 在左侧边栏中的工具、模型列表中,选择工具并将其拖拽至画布中,工具及其各节点将会显示在画布中
- 使用工具、模型列表上方的搜索框快速查询工具,然后将其拖拽至画布中进行建模
- 支持框选画布中的多个工具,在当前画布和跨画布进行复制(Ctrl+C)和粘贴(Ctrl+V)
移动工具
在画布中用鼠标左键选中工具的功能节点,拖拽工具进行整体移动。
连接工具
一个模型通常需要由多个处理自动化工具构成,而工具之间需要建立连接,连接的操作方式为:
- 绘制连接线:将鼠标移动至前置工具输出节点的连接点上,连接点高亮。按住鼠标左键不放,鼠标移动至待连接工具输入节点的连接点上,该连接点高亮后松开鼠标即可。为保证模型的正常运行,需要保证前置节点的输出参数与后续节点的输入参数相同
- 删除连接线:单击选中工具或连接线后,在右键菜单中选择删除,或通过 Delete 键删除。如果误删了工具无需重新拖拽,建模画布的所有操作均支持快捷键撤销(Ctrl+Z)和恢复(Ctrl+Y)
重命名工具
当模型包含多个同名工具或者工具名称不符合使用场景时,您可以单击鼠标左键选中工具节点,在右键菜单中选择“重命名”对工具进行重新命名。
简化显示工具
工具参数过多或者工具过多时,画布内容会显得杂乱,您可以通过以下操作优化可视化建模的显示。
- 右键画布空白区域,选择“全部折叠”按钮,即可收起工具参数。折叠后的工具同样支持移动
- 在画布右侧菜单中选择“水平自动布局”或“垂直自动布局”,一键整理画布排版
添加标注
当模型较为复杂、业务流程不易理解时,您可以对模型元素添加标注以提升模型的易读性。
- 为模型添加标注:右键画布空白区域,选择“创建标注”
- 为单个工具添加标注:单击鼠标左键选中工具节点,在右键菜单中选择“创建标注”。在移动工具节点时,标注可随工具一同移动
设置参数
设置模型参数
要为模型中的工具指定参数设置,需要通过鼠标左键点击输入节点,此时在页面右侧的参数栏会出现参数填写注释,根据注释要求输入符合格式的参数值即可。当前工具所有必填参数填写完毕后,工具的功能节点框线会由灰色变为蓝色,由此,您可根据节点的外框颜色情况快速检查模型参数填写情况。
- 文件路径:需要导入的数据路径信息,来源包含本地上传、从资源中心添加、我的文件夹。 我的文件夹数据来源于GPA共享存储指定存储路径下 “personalDir/{userid}” 的文件夹,您可以将所需数据拷贝至我的文件夹,无需上传便可直接使用。
如果您不想使用工具参数的默认配置,那么可以根据需求自定义工具参数。具体请参见: 自定义工具参数。
设置集群环境
使用 Apache Spark 进行空间大数据分布式分析,在运行模型前可以通过以下两种方式配置集群环境参数:
方式一:配置单模型集群环境参数
处理自动化服务建模页面中使用大数据工具时,点击工具节点可以在参数面板切换“spark 环境设置”选项,设置下列集群环境参数,在运行模型时将连接集群并提交处理自动化任务。
- 部署模式:包括 local(单进程),local(多进程),client,cluster
- 集群 master 地址:必填参数,如 spark://172.16.16.8:7077
- 自定义应用程序的名称:必填参数,如 geoprocessing
- Spark 属性参数设置:集群配置的参数设置,选填参数。如 spark.cores.max=4,spark.executor.memory=16g,spark.driver.host=192.168.17.43
方式二:配置全局集群环境参数
为了方便复用集群环境参数, 提供了全局 Spark 环境参数的配置。具体步骤如下:
1. 点击处理自动化建模界面右上角的“设置”,进行 Spark 全局环境参数的设置;
2. 在 Spark 环境设置面板,点击“添加模式”按钮,以配置环境参数。支持将添加的一组环境参数设置为默认模式,勾选“Spark 集群默认部署模式”后,当新增带有大数据工具的模型时,将自动填充该环境参数;
3. 在模型的右侧参数面板 > “Spark 环境设置” 标签页下,新增“环境参数类型”参数,通过下拉菜单可以配置自定义环境参数或切换全局环境参数,也可以按需修改默认填充的全局环境参数。
运行模型
在建模器中可以运行部分模型或者整个模型。
- 运行部分模型:鼠标右键单击一个工具,点击“执行到此节点”按钮,即可运行处理自动化流程至所选工具。该操作可以用于验证工具参数是否正确
- 运行整个模型:点击页面左上角的“执行”按钮,即可按顺序运行模型至完成整个处理自动化流程
运行成功的工具将会在工具节点右上角出现绿色的成功提示,反之出现红色的失败提示。在模型执行过程中,可以通过页面下方的执行日志窗口,实时查看模型的执行日志信息。另外,还可以通过执行日志窗口来过滤不同级别的信息,以便快速诊断模型错误。
任务中心
点击右上角的“任务中心”按钮,可以查询到当前用户数据分析任务列表,实时追踪模型执行情况,查看历史任务的执行进度、耗时、详情和日志信息。
模型元数据
模型元数据是对模型进行描述的重要信息,详细的模型元数据可帮助他人充分了解模型的使用方法与应用范围,以减少知识共享和应用共享的障碍。模型元数据的查看方式如下:
- 在画布空白区域单击鼠标右键,选择“查看元数据”,即可弹出查看元数据的窗口
- 将模型发布至模型列表后,点击该工具的菜单中的“查看元数据”,即可弹出查看元数据的窗口
模型元数据包括:
- 名称:对模型进行概括性的标题;
- 作者:可填写建模人员姓名;
- 创建及更新时间:系统自动生成创建和修改模型元数据的时间;
- 摘要:用于概述模型应用的项目背景;
- 描述:用于介绍模型的使用方法,和适用范围;
- 标签:用于添加关键字;
- 缩略图:可自动生成模型缩略图;
如果您需要编辑元数据信息,在查看元数据窗口点击“编辑元数据”按钮,即可编辑模型的标题、作者、摘要、描述和标签,还可以一键生成模型缩略图,编辑完成后点击“确定”,模型元数据将会保存至模型文件中。