生成地址索引是指在进行地址匹配之前,程序将基于词典库文件,对参与分析的数据集中指定的参与匹配的字段中的内容建立索引,同时对其进行分词,即将这些字段中存储的内容切分成有意义的词。生成地址索引目的是为地址匹配提供索引文件,从而实现高效搜索、快速获得匹配结果。
参与地址匹配的数据集可以有多个,待匹配的中文地址将在这些数据集中搜索与其匹配的内容;还可以设置参与匹配的数据集中的字段,每个数据集中只能有一个字段参与地址匹配,待匹配的中文地址将与相应数据集的字段中的内容进行匹配分析,获得匹配结果。
功能入口
- 交通分析 选项卡-> 地理编码 -> 创建地址索引 ;
- 工具箱 -> 地理编码 -> 创建地址索引 ;
参数描述
- 源数据 :添加用于地址模糊匹配,构建索引的数据集;即待匹配的中文地址将在这些数据集中搜索与其匹配的内容。
- 词典库文件 :设置参与当前分词的词典库文件。
- 地址匹配字段 :添加用来做地址匹配的字段集合,即待匹配的中文地址将在参与匹配的数据集中的这些指定的字段中搜索与其匹配的项。该字段集合应该在每一个数据集中都存在。
- 设置一、二、三级分组字段 :设置用来对中文地址匹配的字段进行三级分组的字段名称。目的是提高匹配效率,用户使用地址匹配功能时,将依照设置的一、二、三级字段依次过滤查询范围,非必填信息参数。
- 描述字段 :设置查询出地址结果后,显示的当前结果的相关描述信息,非必填信息参数。
- 逆向地址匹配 :支持通过X、Y坐标进行地址匹配查询,后续可在 地址匹配 功能中使用“点坐标”进行可用性验证。
- 结果数据 :设置生成索引文件存储的路径。
- 运行 :单击对话框中的运行按钮,即可执行生成地址索引操作,结果文件夹下包含如下图所示的6个文件文件,其中address.dct为指定的词典库文件。