Hive:简单查询不启用Mapreduce
5sing打不开 时间:2021-01-26 阅读:(
)
job而启用Fetchtask写在前面的话,学Hive这么久了,发现目前国内还没有一本完整的介绍Hive的书籍,而且互联网上面的资料很乱,于是我决定写一些关于《Hive的那些事》序列文章,分享给大家.
我会在接下来的时间整理有关Hive的资料,如果对Hive的东西感兴趣,请关注本博客.
https://www.
iteblog.
com/archives/tag/hive-technology/如果你想查询某个表的某一列,Hive默认是会启用MapReduceJob来完成这个任务,如下:hive>SELECTid,moneyFROMmlimit10;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksissetto0sincethere'snoreduceoperatorCannotrunjoblocally:InputSize(=235105473)islargerthanhive.
exec.
mode.
local.
auto.
inputbytes.
max(=134217728)StartingJob=job_1384246387966_0229,TrackingURL=http://l-datalogm1.
data.
cn1:9981/proxy/application_1384246387966_0229/KillCommand=/home/q/hadoop-2.
2.
0/bin/hadoopjob-killjob_1384246387966_0229hadoopjobinformationforStage-1:numberofmappers:1;numberofreducers:02013-11-1311:35:16,167Stage-1map=0%,reduce=0%2013-11-1311:35:21,327Stage-1map=100%,reduce=0%,CumulativeCPU1.
26sec2013-11-1311:35:22,377Stage-1map=100%,reduce=0%,CumulativeCPU1.
26secMapReduceTotalcumulativeCPUtime:1seconds260msecEndedJob=job_1384246387966_0229MapReduceJobsLaunched:Job0:Map:1CumulativeCPU:1.
26secHDFSRead:8388865HDFSWrite:60SUCCESSTotalMapReduceCPUTimeSpent:1seconds260msecOK1122118512311292131613291355135613621/31364Timetaken:16.
802seconds,Fetched:10row(s)我们都知道,启用MapReduceJob是会消耗系统开销的.
对于这个问题,从Hive0.
10.
0版本开始,对于简单的不需要聚合的类似SELECTfromLIMITn语句,不需要起MapReducejob,直接通过Fetchtask获取数据,可以通过下面几种方法实现:方法一:hive>sethive.
fetch.
task.
conversion=more;hive>SELECTid,moneyFROMmlimit10;OK1122118512311292131613291355135613621364Timetaken:0.
138seconds,Fetched:10row(s)上面sethive.
fetch.
task.
conversion=more;开启了Fetch任务,所以对于上述简单的列查询不在启用MapReducejob!
方法二:bin/hive--hiveconfhive.
fetch.
task.
conversion=more方法三:上面的两种方法都可以开启了Fetch任务,但是都是临时起作用的;如果你想一直启用这个功能,可以在${HIVE_HOME}/conf/hive-site.
xml里面加入以下配置:hive.
fetch.
task.
conversionmore2/3SomeselectqueriescanbeconvertedtosingleFETCHtaskminimizinglatency.
Currentlythequeryshouldbesinglesourcednothavinganysubqueryandshouldnothaveanyaggregationsordistincts(whichincurrsRS),lateralviewsandjoins.
1.
minimal:SELECTSTAR,FILTERonpartitioncolumns,LIMITonly2.
more:SELECT,FILTER,LIMITonly(+TABLESAMPLE,virtualcolumns)这样就可以长期启用Fetch任务了,很不错吧,也赶紧去试试吧!
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/
justhost.ru官方来消息说已经对网络进行了比较全面的优化,针对中国电信、联通、移动来说,4个机房总有一个适合中国用户,让站长进行一下测试,这不就有了这篇有关justhost的VPS的第四次测评。本帖主要关注的是网络,对于其他的参数一概不管! 官方网站:https://justhost.ru 最低配VPS:8.3元/月,KVM,512M内存,5G硬盘,200M带宽,不限流量 购买链接:...
数脉科技(shuhost)8月促销:香港独立服务器,自营BGP、CN2+BGP、阿里云线路,新客立减400港币/月,老用户按照优惠码减免!香港服务器带宽可选10Mbps、30Mbps、50Mbps、100Mbps带宽,支持中文本Windows、Linux等系统。数脉香港特价阿里云10MbpsCN2,e3-1230v2,16G内存,1T HDD 或 240G SSD,10Mbps带宽,IPv41个,...
3C云国内IDC/ISP资质齐全商家,与香港公司联合运营, 已超6年运营 。本次为大家带来的是双12特惠活动,香港美国日本韩国|高速精品|高防|站群|大带宽等产品齐全,欢迎咨询问价。3C云科技有限公司官方网站:http://www.3cccy.com/客服QQ:937695003网页客服:点击咨询客户QQ交流群:1042709810价目表总览升级内存 60元 8G内存升级硬盘 1T机械 90元 2...
5sing打不开为你推荐
免费卡巴斯基杀毒软件十大终身免费杀毒软件?视频剪辑软件哪个好后期视频剪辑什么软件最专业?法兰绒和珊瑚绒哪个好珊瑚绒和法兰绒哪个暖和ps软件哪个好哪个PS软件最好用(适合初学者用)?杰士邦和杜蕾斯哪个好杜蕾斯好用还是杰士邦好要?视频软件哪个好什么看视频的软件好扣扣空间登录如何设置QQ空间快速登陆qq空间登录器怎样直接登录QQ空间q空间登录腾讯qq空间登陆qq空间登录不了为什么我的QQ登陆不了QQ空间
域名注册信息查询 windows虚机 山东vps 个人域名备案 香港ufo 163网 美国php空间 免费静态空间 linux空间 架设服务器 国外代理服务器软件 免费活动 美国在线代理服务器 中国电信宽带测速网 购买国外空间 双12 独享主机 论坛主机 阿里云邮箱登陆 开心online 更多