Hive:简单查询不启用Mapreduce
5sing打不开 时间:2021-01-26 阅读:(
)
job而启用Fetchtask写在前面的话,学Hive这么久了,发现目前国内还没有一本完整的介绍Hive的书籍,而且互联网上面的资料很乱,于是我决定写一些关于《Hive的那些事》序列文章,分享给大家.
我会在接下来的时间整理有关Hive的资料,如果对Hive的东西感兴趣,请关注本博客.
https://www.
iteblog.
com/archives/tag/hive-technology/如果你想查询某个表的某一列,Hive默认是会启用MapReduceJob来完成这个任务,如下:hive>SELECTid,moneyFROMmlimit10;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksissetto0sincethere'snoreduceoperatorCannotrunjoblocally:InputSize(=235105473)islargerthanhive.
exec.
mode.
local.
auto.
inputbytes.
max(=134217728)StartingJob=job_1384246387966_0229,TrackingURL=http://l-datalogm1.
data.
cn1:9981/proxy/application_1384246387966_0229/KillCommand=/home/q/hadoop-2.
2.
0/bin/hadoopjob-killjob_1384246387966_0229hadoopjobinformationforStage-1:numberofmappers:1;numberofreducers:02013-11-1311:35:16,167Stage-1map=0%,reduce=0%2013-11-1311:35:21,327Stage-1map=100%,reduce=0%,CumulativeCPU1.
26sec2013-11-1311:35:22,377Stage-1map=100%,reduce=0%,CumulativeCPU1.
26secMapReduceTotalcumulativeCPUtime:1seconds260msecEndedJob=job_1384246387966_0229MapReduceJobsLaunched:Job0:Map:1CumulativeCPU:1.
26secHDFSRead:8388865HDFSWrite:60SUCCESSTotalMapReduceCPUTimeSpent:1seconds260msecOK1122118512311292131613291355135613621/31364Timetaken:16.
802seconds,Fetched:10row(s)我们都知道,启用MapReduceJob是会消耗系统开销的.
对于这个问题,从Hive0.
10.
0版本开始,对于简单的不需要聚合的类似SELECTfromLIMITn语句,不需要起MapReducejob,直接通过Fetchtask获取数据,可以通过下面几种方法实现:方法一:hive>sethive.
fetch.
task.
conversion=more;hive>SELECTid,moneyFROMmlimit10;OK1122118512311292131613291355135613621364Timetaken:0.
138seconds,Fetched:10row(s)上面sethive.
fetch.
task.
conversion=more;开启了Fetch任务,所以对于上述简单的列查询不在启用MapReducejob!
方法二:bin/hive--hiveconfhive.
fetch.
task.
conversion=more方法三:上面的两种方法都可以开启了Fetch任务,但是都是临时起作用的;如果你想一直启用这个功能,可以在${HIVE_HOME}/conf/hive-site.
xml里面加入以下配置:hive.
fetch.
task.
conversionmore2/3SomeselectqueriescanbeconvertedtosingleFETCHtaskminimizinglatency.
Currentlythequeryshouldbesinglesourcednothavinganysubqueryandshouldnothaveanyaggregationsordistincts(whichincurrsRS),lateralviewsandjoins.
1.
minimal:SELECTSTAR,FILTERonpartitioncolumns,LIMITonly2.
more:SELECT,FILTER,LIMITonly(+TABLESAMPLE,virtualcolumns)这样就可以长期启用Fetch任务了,很不错吧,也赶紧去试试吧!
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/
优惠码年付一次性5折优惠码:TYO-Lite-Open-Beta-1y-50OFF永久8折优惠码:TYO-Lite-Open-Beta-Recur-20OFF日本vpsCPU内存SSD流量带宽价格购买1核1.5G20 GB4 TB1Gbps$10.9/月购买2核2 G40 GB6 TB1Gbps$16.9/月购买2核4 G60 GB8 TB1Gbps$21.9/月购买4核4 G80 GB12 TB...
ProfitServer怎么样?ProfitServer好不好。ProfitServer是一家成立于2003的主机商家,是ITC控股的一个部门,主要经营的产品域名、SSL证书、虚拟主机、VPS和独立服务器,机房有俄罗斯、新加坡、荷兰、美国、保加利亚,VPS采用的是KVM虚拟架构,硬盘采用纯SSD,而且最大的优势是不限制流量,大公司运营,机器比较稳定,数据中心众多。此次ProfitServer正在对...
全新PHP短网址系统URL缩短器平台,它使您可以轻松地缩短链接,根据受众群体的位置或平台来定位受众,并为缩短的链接提供分析见解。系统使用了Laravel框架编写,前后台双语言使用,可以设置多域名,还可以开设套餐等诸多功能,值得使用。链接: https://pan.baidu.com/s/1ti6XqJ22tp1ULTJw7kYHog?pwd=sarg 提取码: sarg文件解压密码 www.wn7...
5sing打不开为你推荐
涡轮增压和自然吸气哪个好本田车自然吸气和涡轮增压哪个好手机杀毒软件哪个好手机安全杀毒软件哪个比较好些?空间登录页面怎样用网页登录到自己的QQ空间?飞信空间登录请问如何登陆我的飞信空间?如何增加百度收录如何提高百度的收录数量东莞电信宽带东莞电信宽带资费问题。急!网通dns服务器地址联通DNS地址怎样设置上海dns服务器地址上海浦东新区dns是多少360云盘共享群360云盘怎么找共享群360云安全中心可以连接到360云安全中心,但是无法上网
免费域名跳转 idc评测 bbr ix主机 paypal认证 typecho 地址大全 建站代码 双线主机 赞助 免费防火墙 重庆双线服务器托管 台湾谷歌 华为云服务登录 中国电信网络测速 lamp什么意思 金主 成都主机托管 阵亡将士纪念日 云服务是什么意思 更多