分隔符

风行水上 @ 2013-12-27 00:26:02
标签:

    提起分隔符,你会想到什么?空格,Tab,逗号,竖线,还是其他什么。

    csv(comma separated value)文件算是一种常见的文件格式。没行一条记录,字段之间用逗号分隔。

    Linux上的文件有很多是以空白字符作为字段分隔符。awk程序的默认设置就是如此。

    分隔符既然是个字符,那就不可避免地会碰到的问题是:如果分隔符字符是内容的一部分的时候怎么办?即所谓的Delimiter Collision问题。

    选择分隔符有时更像是一种个人口味问题。

    ASCII码中的分隔符

    • 0x1C = 28d : FS = File Separator, 文件分隔符
    • 0x1D = 29d : GS = Group Separator, 分组分隔符
    • 0x1E = 30d : RS = Record Separator, 记录分隔符
    • 0x1F = 31d : US = Unit Separator, 字段分隔符
    • 0x20 = 32d : SP = Space, 空白字符
    • 0x00 :

    参考资源

    标签:

      分享到:
      comments powered by Disqus

      22/26ms