读入CSV

使用说明

CSV(Comma-Separated Values,即逗号分隔值,有时也称为字符分隔值)是一种纯文本格式,用于存储表格数据。

它通常以英文逗号(,)作为列分隔符,每行代表一条独立记录。该格式因其简单和通用性,广泛应用于不同系统间的数据交换。

使用CSV格式时,要注意以下规范:

  • 文件开头不能留空,数据按行存储,一行即一条记录。

  • 内容仅包含字段值、分隔符及必要的文本(如引号包裹的字符串)。若字段值包含逗号或换行符,需用双引号(")包裹,如 "Beijing, China"。

  • 默认使用英文逗号(,)作为列分隔符,同时支持自定义分隔符,如制表符(\t)或分号(;)。列为空也要表达其存在。

  • 首行可选作字段名(列标题),后续行存储具体数据。

  • 不同软件(如 Excel、Python)对 CSV 的解析可能存在差异,建议使用标准格式以确保兼容性。

下图展示了CSV文件内容,以英文逗号作为分隔符,首行为数据的字段信息,共包含四列数据:

  • 第一列:字段名为X,表示X坐标值。
  • 第二列:字段名为Y,表示Y坐标值。
  • 第三列:字段名为Code,表示类型编码。
  • 第四列:字段名为Color,表示颜色信息。

输入数据

参数名 参数释义 参数类型
输入 输入关联数据,可以由其他转换器的输出来指定。 DatasetFeatureCollection

参数说明

参数名 参数释义 参数类型
数据来源

指定待读入CSV文件的路径,支持以下方式:

  • 本地文件选择:通过右侧的文件选择按钮直接指定存放在本地的文件。
  • 表达式:使用SQL表达式动态指定文件路径。
  • 选择参数:使用已有的参数或创建参数来指定数据的路径。
String
字符集类型 指定CSV文件的字符编码,以确保非英文字符(如中文)正确解析。默认为UTF-8。Charset
分隔符

指定 CSV 的列分隔符,默认使用英文逗号(,)。同时支持自定义符号,如制表符 (\t)、分号(;)或空格。


String
首行为字段信息

指定是否将CSV数据中的首行信息作为字段名称。

  • 选中,将首行作为字段名称。
  • 未选中,表示自动生成字段名 col0、col1、col2……colN-1。

Boolean
自动计算字段长度

指定是否自动计算字段的长度。

  • 选中,根据每列数据的最大长度自动设置字段宽度(额外增加 10 字符缓冲),大数据量时可能降低读入速度。
  • 未选中,采用默认或预设的字段长度。

Boolean
导入空间数据

指定是否将CSV数据转换为空间数据集。

  • 选中,转换为空间数据集,同时需要指定获取空信息的方式。
  • 未选中,以纯属性表方式打开。

Boolean
WKT 串字段

导入空间数据中选中WKT串字段后可用。

可直接选择输入数据的某个字段,或通过输入表达式/选择参数来指定WKT串所在的字段。

String
X/经度

导入空间数据中选中坐标字段后可用。

可直接选择输入数据的某个字段,或通过输入表达式/选择参数来指定X/经度所在的字段。


String
Y/纬度

导入空间数据中选中坐标字段后可用。

可直接选择输入数据的某个字段,或通过输入表达式/选择参数来指定Y/纬度所在的字段。


String
X/高程

导入空间数据中选中坐标字段后可用。

可直接选择输入数据的某个字段,或通过输入表达式/选择参数来指定Z/高程所在的字段。


String

输出结果

参数名 参数释义 参数类型
无效数据当前转换器无法处理的记录。 IFeatureCollection
输出 成功读入后的结果数据,需要与其他工具联用。 DatasetFeatureCollection