创建模型

构建模型

可以在构建器中从零开始创建模型，也可以在顶部导航栏中点击“导入”，将可视化建模的 XML 模板导入画布中进行建模。

用户可以添加左侧边栏中工具列表、模型列表、共享列表中的工具。

可以通过以下方式添加处理自动化工具：

在画布中用鼠标左键选中工具的功能节点，拖拽工具进行整体移动。

一个模型通常需要由多个处理自动化工具构成，而工具之间需要建立连接，连接的操作方式为：

绘制连接线：将鼠标移动至前置工具输出节点的连接点上，连接点高亮。按住鼠标左键不放，鼠标移动至待连接工具输入节点的连接点上，该连接点高亮后松开鼠标即可。为保证模型的正常运行，需要保证前置节点的输出参数与后续节点的输入参数相同
删除连接线：单击选中工具或连接线后，在右键菜单中选择删除，或通过 Delete 键删除。如果误删了工具无需重新拖拽，建模画布的所有操作均支持快捷键撤销（Ctrl+Z）和恢复（Ctrl+Y）

当模型包含多个同名工具或者工具名称不符合使用场景时，您可以单击鼠标左键选中工具节点，在右键菜单中选择“重命名”对工具进行重新命名。

工具参数过多或者工具过多时，画布内容会显得杂乱，您可以通过以下操作优化可视化建模的显示。

当模型较为复杂、业务流程不易理解时，您可以对模型元素添加标注以提升模型的易读性。

要为模型中的工具指定参数设置，需要通过鼠标左键点击输入节点，此时在页面右侧的参数栏会出现参数填写注释，根据注释要求输入符合格式的参数值即可。当前工具所有必填参数填写完毕后，工具的功能节点框线会由灰色变为蓝色，由此，您可根据节点的外框颜色情况快速检查模型参数填写情况。

文件路径：需要导入的数据路径信息，来源包含本地上传、从资源中心添加、我的文件夹。我的文件夹数据来源于GPA共享存储指定存储路径下 “personalDir/{userid}” 的文件夹，您可以将所需数据拷贝至我的文件夹，无需上传便可直接使用。

如果您不想使用工具参数的默认配置，那么可以根据需求自定义工具参数。具体请参见：自定义工具参数。

使用 Apache Spark 进行空间大数据分布式分析，在运行模型前可以通过以下两种方式配置集群环境参数：

方式一：配置单模型集群环境参数

处理自动化服务建模页面中使用大数据工具时，点击工具节点可以在参数面板切换“spark 环境设置”选项，设置下列集群环境参数，在运行模型时将连接集群并提交处理自动化任务。

部署模式：包括 local(单进程)，local(多进程)，client，cluster
集群 master 地址：必填参数，如 spark://172.16.16.8:7077
自定义应用程序的名称：必填参数，如 geoprocessing
Spark 属性参数设置：集群配置的参数设置，选填参数。如 spark.cores.max=4,spark.executor.memory=16g,spark.driver.host=192.168.17.43

方式二：配置全局集群环境参数

为了方便复用集群环境参数，提供了全局 Spark 环境参数的配置。具体步骤如下：

1. 点击处理自动化建模界面右上角的“设置”，进行 Spark 全局环境参数的设置；

2. 在 Spark 环境设置面板，点击“添加模式”按钮，以配置环境参数。支持将添加的一组环境参数设置为默认模式，勾选“Spark 集群默认部署模式”后，当新增带有大数据工具的模型时，将自动填充该环境参数；

3. 在模型的右侧参数面板 > “Spark 环境设置” 标签页下，新增“环境参数类型”参数，通过下拉菜单可以配置自定义环境参数或切换全局环境参数，也可以按需修改默认填充的全局环境参数。

在建模器中可以运行部分模型或者整个模型。

运行成功的工具将会在工具节点右上角出现绿色的成功提示，反之出现红色的失败提示。在模型执行过程中，可以通过页面下方的执行日志窗口，实时查看模型的执行日志信息。另外，还可以通过执行日志窗口来过滤不同级别的信息，以便快速诊断模型错误。

点击右上角的“任务中心”按钮，可以查询到当前用户数据分析任务列表，实时追踪模型执行情况，查看历史任务的执行进度、耗时、详情和日志信息。

模型元数据是对模型进行描述的重要信息，详细的模型元数据可帮助他人充分了解模型的使用方法与应用范围，以减少知识共享和应用共享的障碍。模型元数据的查看方式如下：

模型元数据包括：

如果您需要编辑元数据信息，在查看元数据窗口点击“编辑元数据”按钮，即可编辑模型的标题、作者、摘要、描述和标签，还可以一键生成模型缩略图，编辑完成后点击“确定”，模型元数据将会保存至模型文件中。