问题
当我们使用 Windows 桌面下的编辑器编写一个 Shell 文件时,很容易将文件使用的换行符保存为 dos 格式。如果将文件上传到 Linux 服务器执行时,可能会遇到下面的错误。这是因为
# 显示一个简单的shell文件
$ cat dosnewline.sh
#!/bin/sh
echo "This is a file with dos newline"
# 该文件使用了 dos 格式的换行符
$ od -bc dosnewline.sh
0000000 043 041 057 142 151 156 057 163 150 015 012 015 012 145 143 150
# ! / b i n / s h \r \n \r \n e c h
0000020 157 040 042 124 150 151 163 040 151 163 040 141 040 146 151 154
o " T h i s i s a f i l
0000040 145 040 167 151 164 150 040 144 157 163 040 156 145 167 154 151
e w i t h d o s n e w l i
0000060 156 145 042 015 012 015 012 015 012
n e " \r \n \r \n \r \n
0000071
# 使用 sh 执行的时候就会有一个报错
$ h dosnewline.sh
: command not found 2:
This is a file with dos newline
: command not found 4:
: command not found 5:
# 获取脚本的返回码也不是0,在一些自动化调用的场景中就会认为脚本执行失败,从而引发后续的问题
$ echo $?
127
# 退出码 127 的意思是 command not foud,对应具体的 dos 换行符所在的行
换行符
我们通常所说的换行符在 ASCII 码表中对应下面两个字符。
十进制 | 十六进制 | 字符 | 编程时 |
---|---|---|---|
10 | A | LF(Line feed,New Line) | \n |
13 | D | CR(Carriage return) | \r |
这两个字符被用作换行的标志,但是在不同操作系统中使用的不一样,具体如下:
操作系统 | 换行符 |
---|---|
Unix(包括 Linux) | \n |
Windows | \r\n |
MacOS X 之前的版本 | \r |
MacOS X 及之后的版本 | \n |
为什么 Windows 中会用两个字符而其他系统使用一个字符呢?
据说很久以前,人们在使用老式电传打字机作为输入设备的年代,这种设备内部使用两个字符来另起新行。一个字符把滑动架移回首位 (称为回车),另一个字符把纸上移一行 (称为换行)。
当电子计算机问世后,由于存储器曾经非常昂贵。有些人认定没必要用两个字符来表示行尾。于是 UNIX 开发者决定他们可以用一个字符(LF)来表示行尾,Apple 开发者规定了用 (CR)来表示行尾,而 MS-DOS(以及后来的 Windows)开发人员则沿用了老式的两个字符 。
正是因为不同操作系统默认的换行符不同,导致在 Windows 下编写的文件采用了 Windows 下的换行符。而不幸的是 sh 做为 Linux 下的应用,只认识 Unix(包括 Linux)下的换行符,引发的文章开头的问题。
解决方法
解决的方法有很多,从脚本来源上说,好我们在编辑过程中就指定使用的换行符,大多数编码常用编辑器例如 Notepadd++ 等都支持这个选项,如下图在 Notepadd++ 的右下角会显示换行符的类型。千万不要使用 Windows 自带的记事本来编写 shell 脚本,记事本是不支持调整换行符的。
除了在编写阶段注意,脚本编写完成后,还可以通过 $ sh -x hello.sh
的方式来检查脚本是否有语法错误,对于本文提供的示例来说输出结果如下,可以看到输出结果给出提示多了 \r
的字符。
$ sh -x dosnewline.sh
+ $'\r'
: command not found 2:
' echo 'This is a file with dos newline
This is a file with dos newline
+ $'\r'
: command not found 4:
+ $'\r'
: command not found 5:
后如果不小心,这样的脚本已经进入了生产环境,也还有很多的方法来进行修改。很多文章推荐使用 dos2unix
这个命令来快速修改,这个命令使用起来比较方便,但是对于一些生产环境管理严格的单位来说,这个命令未必允许在生产环境安装。
那就还可以用一般都有的 tr
、awk
、sed
命令来实现,下面给出具体示例。
$ tr -d '\r' < dosnewline.sh > dosnewline.sh-tr
# 使用 od 比较两个文件,后续的脚本可类似方式比较
$ od -bc dosnewline.sh-tr
0000000 043 041 057 142 151 156 057 163 150 012 012 145 143 150 157 040
# ! / b i n / s h \n \n e c h o
0000020 042 124 150 151 163 040 151 163 040 141 040 146 151 154 145 040
" T h i s i s a f i l e
0000040 167 151 164 150 040 144 157 163 040 156 145 167 154 151 156 145
w i t h d o s n e w l i n e
0000060 042 012 012 012
" \n \n \n
0000064
$ od -bc dosnewline.sh
0000000 043 041 057 142 151 156 057 163 150 015 012 015 012 145 143 150
# ! / b i n / s h \r \n \r \n e c h
0000020 157 040 042 124 150 151 163 040 151 163 040 141 040 146 151 154
o " T h i s i s a f i l
0000040 145 040 167 151 164 150 040 144 157 163 040 156 145 167 154 151
e w i t h d o s n e w l i
0000060 156 145 042 015 012 015 012 015 012
n e " \r \n \r \n \r \n
0000071
$ awk '{ sub("\r$", ""); print }' dosnewline.sh > dosnewline.sh-awk
$ sed 's/\r//' dosnewline.sh > dosnewline.sh-sed