《虚拟化与云计算》模拟试卷
姓名 学号 院系
第一部分选择题共40分每题4分 1) Reducer的三个阶段是 A.Shuffle――Sort――Reduce B. Shuffle――Reduce――Sort C.
Reduce――Shuffle――Sort D. Sort――Shuffle――Reduce
2)下列关于mapreduce的key/value对的说法正确的是 A.输入键值对不需要和输出键值对类型一致B.输入的key类型必须和输出的key类型一致C.输入的value类型必须和输出的value类型一致D.输入键值对只能映射成一个输出键值对
3)下面哪一个选项是mapreduce真正的引擎 A. Namenode B. Datanode
C. Job Tracker and Task Tracker D. HDFS
4)下列选项中哪个不是GFS中“Masters”的主要功能 A.维护所有文件系统的元数据
B. 周期性地与chunks ervers联系来发送指令和检查状态
C.对于读与写客户端通过与Mast er联系来获得chunk的位置然后直接与chunkservers连接
D.返回最终的答案给客户端
5)下列哪个选项不是我们需要Hive的主要原因 A.我们需要一个容量为PB级别的数据仓库。 B.文件是不充分的数据抽象。
C. Hadoop在处理作业方面是不够的。 D.我们需要一个开发的数据格式。
6)下面那个不是云计算的特征 A.虚拟化B.动态可扩展C. 管理多设备D.个体自治
7) Hadoop用来确保数据准确性的方法不包括下面的哪一个 A.使用校验和来验证数据
1
B.客户端每512字节计算一次校验和数据节点存储这些校验和C.客户端从数据节点中检索数据如果验证失败客户尝试别的副本D.数据节点中的数据被加密以防止可能的攻击
8)关于分布式文件系统的说法不正确的是 A .分布式文件系统整个集群中有多个namespace B .文件被分为大的块通常为128M C.可以通过Java、 C或者命令行访问D.非常适合对大文件的流式读取
9) 以下错误不是Hadoop能很好解决的 A.任务失败B.任务追踪失败C.连接失败D.作业追踪失败
10)下列哪个选项能正确地在Hive中返回 “查询年龄在18到25岁之间的用户返回的前5页”的结果 A.
SELECT p.url, COUNT(1) as clicks
FROM users u JOIN page_views p ON (u.name = p.user) WHERE u.age >= 18 ANDu.age <= 25 GROUP BY p.url ORDER BY clicks LIMIT 5; B.
SELECT p.url, COUNT(1) as clicks FROM users u JOIN page_views p WHEREu.age >= 18 AND u.age <= 25 GROUP BY p.url ORDER BY clicks LIMIT 5; C.
SELECT p.url, COUNT(1) as clicks
FROM page_views p ON (u.name = p.user) ORDER BY clicks LIMIT 5; D.
SELECT p.url, COUNT(1) as clicks
FROM users u JOIN page_views p ON (u.name = p.user) WHERE u.age >= 18 ANDu.age <= 25 GROUP BY p.url ORDER BY clicks;
2
第二部分简答题共60分第一大题10分第二大题20分第三大题30分
一、简述MapReduce的主要思想和工作原理可借助下面的例子 并根据例子画出数据流图
例子使用M apR edu c e解决求商品价格最小问题输入为商品名称、商品价格、商品网站输出为商品名称、最小价格、商品网站。 输入样例
Cloud computing 38.4 dangdang. com Cloud computing 40. 5 china-pub. com
Virtualization and cloud computing 35.7 amazon. com.cn Virtualization andcloud computing 30.8 bookschina.com Virtualization and cloud computing 36.6360buy. com Cloud computing 35. 1 amazon.com. cn
输出样例:
Cloud computing 35. 1 amazon.com.cn
Virtualization and cloud computing 30.8 bookschina.com
二、当数据量非常大超过单个机器的存储能力时需要将数据存储在不同的机器上这时就需要分布式文件系统来管理这些数据请回答关于分布式文件系统的下列问题 (1) .在设计分布式文件系统时需要注意哪些方面
(2) .原先存储超大文件的分布式文件系统现用来存储大规模小文件如何对文件系统进行调整使其针对现在文件的特点发挥更好的性能
(3) .分布式文件系统保证数据不被丢失通常存在多个副本并存储在不同的机器上当用户对数据进行修改时系统存在两种方案完成一个副本的修改并给用户响应之后待系统空闲时完成其它副本的修改完成所有副本的修改之后给用户响应。请说明两种方案的优劣并做出你的选择并说明选择原因或者你有更好的方案 。
三、在社会计算和移动计算迅猛发展的潮流下涌现了许多著名的互联网公司假设你和你的朋友也准备加入创业大潮中建立自己的企业。现假设你们公司的主要业务是移动设备的互联网信息搜索和挖掘如使用手机拍下某图书封面就可以得到各个图书网站关于该书的价格及其对图书的评价拍下某个人的头像可以得到这个人在社交网站的主页以及微博等相关信息 当然你们已经设计了比较好的图形匹配算法及搜索算法并计划使用云计算来进行处理根据以上背景回答下面问题
(1) .你们公司需要构建数据中心现在由你来负责根据新一代数据中心的需求请说说你在构建数据中心的时候需要注意哪些
3
(2) .在数据中心中使用虚拟化技术是必须的请说说如何部署、管理虚拟化解决方案你又如何使用商业公司的现有虚拟化产品
(3) .受经济危机的影响以及公司盈利能力的不确定性风险投资公司决定减少对你们公司的投资。现在构建数据中心已经不可能了你需要将业务创建在云计算平台上 a) .与建立自己的数据中心相比使用商业公司的云计算平台有什么优点和缺点b) . 云构架的基本层次有哪些并给出给出各个层次的实例。谈谈你如何在云计算平台上部署公司业务c) .谈谈你对云计算发展的看法。
注题中商业公司包括课堂上介绍的IBM、 Amazon、 Google、 Salesforce. com、Microsoft以及其它现实存在的涉及虚拟化、云计算业务的公司
4
感谢您的阅读祝您生活愉快。
SugarHosts 糖果主机商我们算是比较熟悉的,早年学会建站的时候开始就用的糖果虚拟主机,目前他们家还算是为数不多提供虚拟主机的商家,有提供香港、美国、德国等虚拟主机机房。香港机房CN2速度比较快,美国机房有提供优化线路和普通线路适合外贸业务。德国欧洲机房适合欧洲业务的虚拟主机。糖果主机商一般是不会发布黑五活动的,他们在圣圣诞节促销活动是有的,我们看到糖果主机商发布的圣诞节促销虚拟主机低至6折...
DMIT.io是成立于2018年的一家国外主机商,提供VPS主机和独立服务器租用,数据中心包括中国香港、美国洛杉矶和日本等,其中日本VPS是新上的节点,基于KVM架构,国际线路,1Gbps带宽,同时提供月付循环8折优惠码,或者年付一次性5折优惠码,优惠后最低每月8.72美元或者首年65.4美元起,支持使用PayPal或者支付宝等付款方式。下面列出部分日本VPS主机配置信息,价格以月付为例。CPU:...
hypervmart怎么样?hypervmart是一家成立了很多年的英国主机商家,上一次分享他家还是在2年前,商家销售虚拟主机、独立服务器和VPS,VPS采用Hyper-V虚拟架构,这一点从他家的域名上也可以看出来。目前商家针对VPS有一个75折的优惠,而且VPS显示的地区为加拿大,但是商家提供的测速地址为荷兰和英国,他家的优势就是给到G口不限流量,硬盘为NVMe固态硬盘,这个配置用来跑跑数据非常...