语句Linux常用命令之awk

awk命令  时间:2021-02-12  阅读:()

L i n ux常用命令之awklinux教程http://ww w.linuxprob e.c o m/

标题 awk命令的使用

作用 awk是非常好用的数据处理工具主要处理每一行的字段内的数据默认的字段的分割符为空格键或[tab]键

一、 awk脚本的基本结构awk 'BEGIN{print "start"} pattern {commands} END{print "ends"} 'file //一个awk脚本通常由 BEGIN语句块、能够使用模式匹配的通用语句块、 END语句块3部分组成这三部分是可选的任意一部分都可以不出现在脚本中

//通常是被单引号或双引号括住的

例如 awk 'BEGIN{i=0} {i++}END{print i} ' filenameawk "BEGIN{i=0} {i++}END{print i} " filename

二、 awk的执行过程awk 'BEGIN {commands} pattern{commands}END{commands} ' f ilename

[1]第一步执行BEGIN{commands}语句块中的语句

[2]第二步从文件或标准输入stdin读取一行然后执行pattern{commands}语句块它逐行扫描文件第一行到最后一行重复这个过程直到文件全部被读取完毕

[3]第三步 当读至输入流末尾时候执行END{commands}语句块

BEGIN语句块在awk开始从输入流中读取行之前被执行这是一个可选的语句块。 比如变量的初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中。

END语句块在awk从输入流读取完所有的行之后执行 比如打印所有行的分析结果这类信息汇总都是在END语句块中完成。

三、 awk内置变量

[1] $n是当前行的按照指定域分隔符默认是空格或[T AB] ]键分割后的第n个字段 比如n为1表示第1个字段 n为2表示第2个字段

[2] $0则是记录了执行过程中当前行的文本内容

[3]NF每一行($0)拥有的字段总数

[4]NR 目前awk所处理的"第几行"数据

[5]FNR表示当前所处理的文本内的"第几行"数据

[6]FS 目前的域分割符号可以通过FS字段指定文本的域分割符

[7]OFS输出字段的分割符默认是一个空格

[8]ORS输出的记录分割符默认是一个换行

[9]ARG IN D命令行中处理的当前文件的位置从1开始

[10]AR G C命令行参数的数目

[11]AR GV命令行参数的数组

四、 awk实例

例1 pay.txt文件内容格式:姓名、第一个月工资、第二个月工资、第三个月工资将每一个人的三月工资总和计算出来

Name 1st 2nd 3th

VBird 2300 3400 2500

Bmtsai 2000 2000 2300

Bird2 4300 4200 4100

命令 awk 'NR==1{printf ("%10s%10s%10s%10s%10s\n", $1, $2, $3,$4, "Total") } NR>=2{total=$2+$3+$4; printf ("%10s%10s%10s%10s%10s\n",$1, $2, $3, $4,total) } ' pay.txt

输出

解释 NR表示当前处理的行数行号 如果满足NR==1即处理的是第一行的内容Name 1st 2nd 3th就执行后面的括弧中的打印printf命令如果满足NR>=2那么就会执行第一个括弧中的命令{total=$2+$3+$4; printf

("%10s%10s%10s%10s%10s\n", $1, $2, $3, $4,total) } 。所以 awk命令格式中的pattern决定了是否对当前输入的行执行其后面的commands。

例2将a.dat的第一列内容和第二列内容相加a. dat内容 b.dat内容

命令 awk

'BEGIN{i=0; j=0}FNR==NR{array[i++]=$1;next} {total=array[j ]+$1;printarray[j ] ,$1,total; j++} ' a.dat b.dat

或awk

'BEGIN{i=0; j=0}ARGIND==1{array[i++]=$1}ARGIND==2{total=array[j ]+$1;print array[j ] ,$1,total; j++} ' a.dat b.dat

输出结果

解释 NR和FNR是awk内置变量表示行号 NR表示处理的记录的行数 FNR表示当前处理的文件的行数 因为awk的参数可以同时跟多个文件名并且按照其出现的顺序逐个输入并处理而NR 表示截止当前处理的总的行数而FNR表示当前所处理的文

件的行数。能能够导致读入下一个输入行并返回到脚本的顶部这可以避免对当前输入行执行其他的操作过程。

例3去除重复记录--假设某文件test.da记录如下

命令 awk ' !a[$0]++{print $0} ' test.da

输出

解释 awk默认数组的初始值是0 当记录已经出现在的数组a中的时候那么!a[$0]为假所以就不会执行后面的print $0

linux教程http://www. linuxprobe. com/

一键去除宝塔面板各种计算题与延时等待

现在宝塔面板真的是越来越过分了,删除文件、删除数据库、删除站点等操作都需要做计算题!我今天升级到7.7版本,发现删除数据库竟然还加了几秒的延时等待,也无法跳过!宝塔的老板该不会是小学数学老师吧,那么喜欢让我们做计算题!因此我写了个js用于去除各种计算题以及延时等待,同时还去除了软件列表页面的bt企业版广告。只需要执行以下命令即可一键完成!复制以下命令在SSH界面执行:Layout_file="/w...

快快云:香港沙田CN2/美国Cera大宽带/日本CN2,三网直连CN2 GIA云服务器和独立服务器

快快云怎么样?快快云是一家成立于2021年的主机服务商,致力于为用户提供高性价比稳定快速的主机托管服务,快快云目前提供有香港云服务器、美国云服务器、日本云服务器、香港独立服务器、美国独立服务器,日本独立服务器。快快云专注为个人开发者用户,中小型,大型企业用户提供一站式核心网络云端服务部署,促使用户云端部署化简为零,轻松快捷运用云计算!多年云计算领域服务经验,遍布亚太地区的海量节点为业务推进提供强大...

宝塔面板企业版和专业版618年中活动 永久授权仅1888元+

我们一般的站长或者企业服务器配置WEB环境会用到免费版本的宝塔面板。但是如果我们需要较多的付费插件扩展,或者是有需要企业功能应用的,短期来说我们可能选择按件按月付费的比较好,但是如果我们长期使用的话,有些网友认为选择宝塔面板企业版或者专业版是比较划算的。这样在年中大促618的时候,我们也可以看到宝塔面板也有发布促销活动。企业版年付899元,专业版永久授权1888元起步。对于有需要的网友来说,还是值...

awk命令为你推荐
ptrc语言for语句中(*ptr)和*ptr有什么区别,为什么要加括号,不加括号会天天酷跑刷积分教程最近一直有人说天天酷跑刷积分,怎么刷的。怎么在qq空间里添加背景音乐怎么在QQ空间里插入背景音乐??微信如何建群微信可以建立两个人的群吗?有一个是自己手机区号有的手机号中间的号码是地区区号,那是什么卡网易公开课怎么下载哪位高手指导一下,如何下载网易公开课啊?腾讯文章怎样才能在手机腾讯网上发表文章?机械键盘轴机械键盘什么轴好,机械键盘轴有几种网络广告投放怎样在网络上进行广告的投放?声母是什么哪些是声母,哪些是韵母,
短域名 windows虚机 域名停靠一青草视频 国外idc wdcp java虚拟主机 php空间申请 vip购优汇 佛山高防服务器 cn3 能外链的相册 智能dns解析 江苏徐州移动 服务器防御 magento主机 WHMCS 服务器是什么 大容量存储模式 web服务器配置 双宿主机防火墙 更多