深圳职业技术学院交通专业2017级
交通大数据分析与处理试卷【闭卷】
总得分______ 统分人签名________ 核分人签名__________
分 【得分 】
1. MapReduc e任务过程分为两个处理阶段阶段和阶段。
2. 云计算使得使用信息的存储是一个、的方式它会大大地节约网络的成本使得网络将班级 来越来越泛在、越来越普及成本越来越低。
3. 大数据系统体系建设规划包括采数据、 、 、建模型。
并行计算架构通过网络将数台、数十台甚至上百○ 台普通服务器连接到一起组成。
8. 数据库使用来完成数据的存储和管理。 SCSDB对象主要有、数据表、索引及等。
9. SCSDB提供了查看当前会话连接状态的命令使用该命令可查看当前的状态信息。
二、判断题20分每题2分 【得分 】
1.对于大数据而言最基本、最重要的要求就是减少错误、保证质量。因此大数据收集
的信息量要尽量精确。
2.一般而言分布式数据库是指物理上分散在不同地点但在逻辑上是统一的数据库。因
此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
3.谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。
4.当表存在大量的UPDATE/DELETE操作时会导致表的数据文件、索引文件产生空洞、碎片这种情况下会逐渐降低该表的查询性能。
5.数据库对象名只能由字母、数字、下划线组成且只能以字母开头。
6.完整的建表语句中包含表名、列名、列定义、主键信息、索引信息、表分区信息、表注释信息等。
7.SCSDB的数据节点分为主节点和从节点一个主节点对应一个或多个从节点。
8.当数据量小时应用开发人员只需要关心查询语句的功能实现不需要关心性能问题。
9.当SCSDB收到用户查询SCSQL后交给优化器进行分析 由执行器生成执行计划
10.大数据的安全存储采用虚拟化海量存储技术来存储数据资源。
三、不定项选择题20分每题2分多选、少选不得分 【得分 】
1.国务院在哪一年印发了《促进大数据发展行动纲要》
A.2015年 B.2016年 C.2017年 D.2018年
2.梅特卡尔夫定律主要是描述信息网络指出网络的价值在于网络的互联联网的接点数与其价值呈现 的方式联网越多系统的价值越大。
A.对数 B.指数 C.正比 D.反比
3.SCSDB安全管理主要分为 三个部分。
A账户管理 B.权限管理 C.数据库审计 D.角色扮演
4.大数据的主要特征表现为 。
A.数据类型多 B.处理速度快 C.数据容量大 D.商业价值高
5.数据库使用数据库对象来完成数据的存储和管理。SCSDB对象主要有 、索引及视图等。
A.菜单 B.数据库 C.数据表 D.按钮
6.大数据的核心是洞察洞察有以下哪些特色 。
A.洞察工作重点
B.洞察调度奥妙
C.洞察管理规律
D.洞察未来趋势
7.大数据的来源包括 。
A.互联网数据 B.实时数据 C.探测数据 D.传感器数据
8.大数据的利用过程是
A.采集——挖掘——清洗——统计
B.采集——统计——清洗——挖掘
C.采集——清洗——挖掘——统计
D.采集——清洗——统计——挖掘
9.大数据的本质是 。
A.洞察 B.搜集 C.联系 D.挖掘
10.SCSDB是一个 、并行计算的结构化数据库。
A.开放式 B.分布式存储 C.同步式存储 D.附着式存储
四、简答题25分每题5分 【得分 】
1.什么是分布式计算
2.在Hadoop HDFS中集群中的DataNode节点需要周期性地向NameNode发送什么信息
3.简要描述交通管理大数据的感知层
4.简述SCSDB数据库的存储逻辑结构管理。
5.简述基于SCSDB创建数据库的方法。
五、应用题15分 【得分】
在基于SCSDB进行大数据管理中数据表管理是其中较重要的环节请结合所学知识完成以下两项任务
1.给出创建数据表的句法并进行必要的解释。
2.给出查看数据表的句法并进行必要的解释。
交通大数据分析与处理试卷参考答案
一、 1. Map reduce
2. 分布式、共享式
3. 搭平台、编代码
4. 数据类型多、处理速度快
5. 信息化
6. 感知层、 网络层应用层
7. 分布式存储计算集群
8. 数据库对象数据库、视图
9. 会话连接
10.水平存储
二 1. × 2.√ 3. × 4.√ 5.√ 6.√ 7.√ 8.√ 9. × 10.√
三 1.A 2.B 3.ABC 4.ABCD 5.BC
6.ABCD 7.ABCD 8.D 9.A 10.B
四 1.答分布式计算是一门计算机科学主要研究分布式系统。一个分布式系统包括若干通过网络互联的计算机。这些计算机互相配合以完成一个共同的目标我们将这个共同的目标称为“项目”。具体的过程是将需要进行大量计算的项目数据分割成小块 由多台计算机分别计算再上传运算结果后统一合并得出数据结论。在分布式系统上运行的计算机程序称为分布式计算程序分布式编程就是编写上述程序的过程。
2.答在Hadoop HDFS中 DataNode需要周期性地向集群中的DataNode Master节点发送心跳信息和块报告。接收到心跳信息说明该DataNode节点工作正常块报告包含了DataNode节点上所有块的列表以及块id与磁盘文件存储的映射关系。
3.答交通管理大数据感知层是交通大数据总体架构的最底层主要实现交通信息的采集与前端处理功能是整个交通管理大数据架构中起决定性的部分。交通管理大数据感知层不仅包括各类交通传感器技术还包括前端的各类信息处理、通信、 网络、安全、标识、定位、同步等技术 以及相关的协同处理等新技术覆盖的范围非常宽泛。
4.答在SCSDB数据库中 Database相当于容器里面存放了各种数据表、视图。其中包括
1一个库下可以有多张数据表、视图。
2某个数据表或视图只能隶属于一个库。
3数据节点的分配是以数据库为单位的同一个库下的所有表分布在相同的数据节点上且同一个库下的所有表的HAS H映射关系是相同的。
5答可使用CREATE DATABASE语句创建数据库其语法如下所示
CREATE{DATABASE|SCHEMA}[IF NOTEXISTS]db_name[node_number]
说明 (1)[no de_numb er ]为空时默认使用集群的所有数据节点。 no de_numb er最少为1 最大为当前集群节点总数。 (2)新创建数据库在为其分配数据节点时会选择当前负载较小的数据节点使每个数据节点上的数据库数量尽可能均衡。 3 SCHEMA是DATABAS E的同义词。创建数据库database_test不指定节点数(使用全部节点数进行数据存储)示例如下scsdb>create database database_test.
五
1.答数据表用来存储数据记录 由行和列组成列代表属性每一个行是一条记录。使用CREATE TABLE语句建表时最基础的部分是定义表名以及表包含的数据列名和列定义其语法如下
CREATE TABLE table_name(column_namecolumn_definition,
[column_namecolumn_definition,]. . .
)
句法说明如下
1 c olumn_name列名也叫字段名在创建数据表时必须指定列名且表至少包含一个列。
2 column_definition列定义也称字段属性。首先是数据类型后面可以追加NOT NULL或NULL、 DEFAULT default_value、 AUTO_INCREMENT、 UNIQUE [KEY]或PRIMARYKEY等修饰词以及备注CO MM ENT 。
3列定义与下一个列名之间用“,”隔开最后一个列定义后不可加“,”。
创建一个driver s表并设置id自增长且为主键。
2答查看当前数据库中数据表的语句如下所示
SHO W[FULL|HASH]TABLES[LIKE p' attern' |WHERE expr]
说明如下
1 FULL显示Tab le_type列信息用于表明每个行引用的是表(BAS E_TABLE)还是视图(VIEW)。
2HAS HHAS H选项为自定义的S HOW HAS H TABLES查询当前库的HASH分布表
并返回HAS H字段若HAS H字段为组合字段那么多个字段之间以逗号分隔。3 LIKE子句用给定模式p attern匹配表名。
4WHERE子句只输出满足表达式的数据行。
查看表名里面包含以’dri’开头的数据表的句法如下database_test>showfull tables like 'dri%'.
乐凝网络怎么样?乐凝网络是一家新兴的云服务器商家,目前主要提供香港CN2 GIA、美国CUVIP、美国CERA、日本东京CN2等云服务器及云挂机宝等服务。乐凝网络提供比同行更多的售后服务,让您在使用过程中更加省心,使用零云服务器,可免费享受超过50项运维服务,1分钟内极速响应,平均20分钟内解决运维问题,助您无忧上云。目前,香港HKBN/美国cera云服务器,低至9.88元/月起,支持24小时无理...
快快云怎么样?快快云是一家成立于2021年的主机服务商,致力于为用户提供高性价比稳定快速的主机托管服务,快快云目前提供有香港云服务器、美国云服务器、日本云服务器、香港独立服务器、美国独立服务器,日本独立服务器。快快云专注为个人开发者用户,中小型,大型企业用户提供一站式核心网络云端服务部署,促使用户云端部署化简为零,轻松快捷运用云计算!多年云计算领域服务经验,遍布亚太地区的海量节点为业务推进提供强大...
CloudCone商家在前面的文章中也有多次介绍,他们家的VPS主机还是蛮有特点的,和我们熟悉的DO、Linode、VuLTR商家很相似可以采用小时时间计费,如果我们不满意且不需要可以删除机器,这样就不扣费,如果希望用的时候再开通。唯独比较吐槽的就是他们家的产品太过于单一,一来是只有云服务器,而且是机房就唯一的MC机房。CloudCone 这次四周年促销活动期间,商家有新增独立服务器业务。同样的C...