AWK - 内置变量

AWK 提供了几个内置变量。它们在编写 AWK 脚本时发挥着重要作用。本章演示了内置变量的用法。

标准 AWK 变量

标准 AWK 变量将在下面讨论。

ARGC

它意味着命令行中提供的参数数量。

例子

[jerry]$ awk 'BEGIN {print "Arguments =", ARGC}' One Two Three Four

执行此代码时，您将得到以下结果 -

输出

Arguments = 5

但是为什么当你只传递 4 个参数时 AWK 显示 5 呢？只需查看以下示例即可消除您的疑虑。

ARGV

它是一个存储命令行参数的数组。该数组的有效索引范围为 0 到 ARGC-1。

例子

[jerry]$ awk 'BEGIN { 
   for (i = 0; i < ARGC - 1; ++i) { 
      printf "ARGV[%d] = %s\n", i, ARGV[i] 
   } 
}' one two three four

执行此代码时，您将得到以下结果 -

输出

ARGV[0] = awk
ARGV[1] = one
ARGV[2] = two
ARGV[3] = three

卷积FMT

它代表数字的转换格式。它的默认值为%.6g。

例子

[jerry]$ awk 'BEGIN { print "Conversion Format =", CONVFMT }'

执行此代码时，您将得到以下结果 -

输出

Conversion Format = %.6g

环境

它是环境变量的关联数组。

例子

[jerry]$ awk 'BEGIN { print ENVIRON["USER"] }'

执行此代码时，您将得到以下结果 -

输出

jerry

要查找其他环境变量的名称，请使用env命令。

文件名

它代表当前文件名。

例子

[jerry]$ awk 'END {print FILENAME}' marks.txt

执行此代码时，您将得到以下结果 -

输出

marks.txt

请注意，BEGIN 块中未定义 FILENAME。

FS

它表示（输入）字段分隔符，其默认值为空格。您还可以使用-F命令行选项来更改此设置。

例子

[jerry]$ awk 'BEGIN {print "FS = " FS}' | cat -vte

执行此代码时，您将得到以下结果 -

输出

FS =  $

核因子

它表示当前记录中的字段数。例如，以下示例仅打印包含两个以上字段的行。

例子

[jerry]$ echo -e "One Two\nOne Two Three\nOne Two Three Four" | awk 'NF > 2'

执行此代码时，您将得到以下结果 -

输出

One Two Three
One Two Three Four

NR

它代表当前记录的数量。例如，如果当前记录数小于 3，以下示例将打印该记录。

例子

[jerry]$ echo -e "One Two\nOne Two Three\nOne Two Three Four" | awk 'NR < 3'

执行此代码时，您将得到以下结果 -

输出

One Two
One Two Three

FNR

它与NR类似，但相对于当前文件。当 AWK 操作多个文件时它很有用。FNR 的值随新文件重置。

正交频域调制

它表示输出格式编号，默认值为%.6g。

例子

[jerry]$ awk 'BEGIN {print "OFMT = " OFMT}'

执行此代码时，您将得到以下结果 -

输出

OFMT = %.6g

欧福斯

它表示输出字段分隔符，默认值为空格。

例子

[jerry]$ awk 'BEGIN {print "OFS = " OFS}' | cat -vte

执行此代码时，您将得到以下结果 -

输出

OFS =  $

口服补液盐

表示输出记录分隔符，默认值为换行符。

例子

[jerry]$ awk 'BEGIN {print "ORS = " ORS}' | cat -vte

执行上面的代码，你会得到以下结果 -

输出

ORS = $
$

长度

表示match函数匹配到的字符串的长度。AWK 的匹配函数在输入字符串中搜索给定的字符串。

例子

[jerry]$ awk 'BEGIN { if (match("One Two Three", "re")) { print RLENGTH } }'

执行此代码时，您将得到以下结果 -

输出

RS

它代表（输入）记录分隔符，默认值为换行符。

例子

[jerry]$ awk 'BEGIN {print "RS = " RS}' | cat -vte

执行此代码时，您将得到以下结果 -

输出

RS = $
$

启动程序

它表示由match函数匹配的字符串中的第一个位置。

例子

[jerry]$ awk 'BEGIN { if (match("One Two Three", "Thre")) { print RSTART } }'

执行此代码时，您将得到以下结果 -

输出

子集

它表示数组下标的分隔符，默认值为\034。

例子

[jerry]$ awk 'BEGIN { print "SUBSEP = " SUBSEP }' | cat -vte

执行此代码时，您将得到以下结果 -

输出

SUBSEP = ^\$

$0

它代表整个输入记录。

例子

[jerry]$ awk '{print $0}' marks.txt

执行此代码时，您将得到以下结果 -

输出

1) Amit     Physics   80
2) Rahul    Maths     90
3) Shyam    Biology   87
4) Kedar    English   85
5) Hari     History   89

$n

它表示当前记录中的第 n^个字段，字段之间用 FS 分隔。

例子

[jerry]$ awk '{print $3 "\t" $4}' marks.txt

执行此代码时，您将得到以下结果 -

输出

Physics   80
Maths     90
Biology   87
English   85
History   89

GNU AWK 特定变量

GNU AWK 特定变量如下 -

阿尔金德

它表示当前正在处理的文件在 ARGV 中的索引。

例子

[jerry]$ awk '{ 
   print "ARGIND   = ", ARGIND; print "Filename = ", ARGV[ARGIND] 
}' junk1 junk2 junk3

执行此代码时，您将得到以下结果 -

输出

ARGIND   =  1
Filename =  junk1
ARGIND   =  2
Filename =  junk2
ARGIND   =  3
Filename =  junk3

宾模式

它用于指定非 POSIX 系统上所有文件 I/O 的二进制模式。数值 1、2 或 3 分别指定输入文件、输出文件或所有文件应使用二进制 I/O。r或w的字符串值分别指定输入文件或输出文件应使用二进制 I/O。rw或wr的字符串值指定所有文件都应使用二进制 I/O。

错误号

当getline重定向失败或关闭调用失败时，字符串指示错误。

例子

[jerry]$ awk 'BEGIN { ret = getline < "junk.txt"; if (ret == -1) print "Error:", ERRNO }'

执行此代码时，您将得到以下结果 -

输出

Error: No such file or directory

场宽

设置空格分隔的字段宽度变量列表，GAWK 将输入解析为固定宽度的字段，而不是使用 FS 变量的值作为字段分隔符。

忽略大小写

设置此变量后，GAWK 将不区分大小写。以下示例演示了这一点 -

例子

[jerry]$ awk 'BEGIN{IGNORECASE = 1} /amit/' marks.txt

执行此代码时，您将得到以下结果 -

输出

1) Amit  Physics   80

皮棉

它提供了GAWK 程序中--lint选项的动态控制。设置此变量后，GAWK 会打印 lint 警告。当分配字符串值 fatal 时，lint 警告将变为致命错误，与--lint=fatal完全相同。

例子

[jerry]$ awk 'BEGIN {LINT = 1; a}'

执行此代码时，您将得到以下结果 -

输出

awk: cmd. line:1: warning: reference to uninitialized variable `a'
awk: cmd. line:1: warning: statement has no effect

信息处理系统

这是一个关联数组，包含有关进程的信息，例如真实有效的 UID 号、进程 ID 号等。

例子

[jerry]$ awk 'BEGIN { print PROCINFO["pid"] }'

执行此代码时，您将得到以下结果 -

输出

文本域

它代表 AWK 程序的文本域。它用于查找程序字符串的本地化翻译。

例子

[jerry]$ awk 'BEGIN { print TEXTDOMAIN }'

执行此代码时，您将得到以下结果 -

输出

messages

由于en_IN区域设置，上面的输出显示英文文本