导入CSV数据
功能说明
CSV(即 Comma Separate Values)是以文本形式记录数据的文件(通常以逗号为分隔符),这种格式经常用来作为不同程序之间的数据交互的格式。
用户可以通过 Excel 工具将*.xlsx,*.xls,*.xml等格式的属性数据转化成 *.csv 格式数据,进而实现将纯属性数据及属性表形式的其他数据导入 。
同时支持导入满足 csv 格式规范的 txt(*.txt)格式的属性数据,用户无需再进行数据转换即可直接导入。
具体文件格式需要注意以下几点问题:
- 开头不能留空,且以行为单位,每条记录是一行。
- 文本中只能包含分隔符及字段值等信息。
- 默认以英文逗号作为分隔符, 也支持自定义文本分隔符。
- 第一条记录可以是字段名。
如下图所示,要导入的 *.csv 文件内容如下图,CSV 数据以英文逗号(“,”)作为分隔符,首行为数据的字段信息。共包含了四列属性数据,每一列的含义分别是:X 坐标值,Y 坐标值,类型编码和颜色。
功能入口
- 开始选项卡->数据处理->数据导入。
- 工作空间管理器中->数据源右键菜单->导入数据集...。
- 工具箱->数据导入->电子表格->导入.CSV。
操作说明
- 在数据导入对话框中,添加要导入的 *.csv 格式文件,添加方式请参见导入数据介绍。
- 结果数据与源文件信息,请参见公共参数介绍。
- 转换参数
- 分隔符:用来设置 CSV 文件中的分隔符,默认使用英文逗号(,)。另外可选的分隔符还有点(.)、制表符(Tab)、空格。系统也支持用户自定义一个文本可识别的字符(包括汉字)。
- 首行为字段信息:设置需要导入的原 CSV 文件首行是否为字段名称。勾选该参数,则导入后的字段名称为首行的字段值,否则为属性信息。如果 CSV 文件首行指定了字段信息,则应用程序会自动读取。
- 自动计算字段长度:设置导入时是否自动计算字段长度。勾选该参数,导入时会读取每列最长字段,并在此基础上加10作为该列的字段长度。导入大量数据时勾选此项可能会影响导入速度。
- 数据预览:可预览CSV文件导入为属性表数据的效果。
- 导入为空间数据:勾选该复选框,则导入后的数据为点数据集;若未勾选,则为属性表数据集。
- WKT串字段:通过指定WKT串字段方式获取数据的空间信息。有关WKT串数据格式的详细信息,请参考WKT 文本标记语言。
- 坐标字段:通过设置经度、纬度、高程字段来指定CSV数据对应的空间信息。
- 设置完成后,单击导入按钮,执行导入 CSV 文件的操作。导入后的点数据集或属性表数据如下:
注意事项:
- 在用记事本等文本编辑工具编辑 CSV 文件时,若列内容中存在半角特殊字符(逗号、换行符或双引号),需使用半角双引号对字段值进行转义。若列内容中存在半角引号(即"),则应替换为半角双引号("")转义,并用半角引号将字符串包含起来。如导入后字段值需为:Venture"Extended Edition",则 CSV 文件中应写成:"Venture""Extended Edition""";导入后字段值为:"Supermap",则 CSV 文件中可写成:""Supermap""或者"""Supermap"""。
- 在用 Microsoft Excel 工具编辑 CSV 文件时,字段内容存在特殊字符时,不需要添加转义符进行转码,Excel 在保存 CSV 文件时,会自动对单元格中的特殊字符进行转义处理。
相关主题