第1题
A.实时分析一般应用于电子商务和金融。需要在数据不断变化的情况下,进行快速的数据分析,并以非常短的延迟返回,才能达到不影响用户体验的目的
B.实时分析采用的架构包括,使用传统关系数据库的并行处理集群,或者采用实时计算架构,例如开源数据分析平台Storm
C.离线分析通常指分析时不需要联网的应用,例如机器学习,统计分析和推荐算法
D.离线分析的技术框架相对成熟,常用的分析框架是:HDFS做存储,MapReduce做计算框架,Hive作为数据仓库
第2题
A.【出库调整单】→【计算全月平均单价】→【依赖检查】→【生成实时凭证】→【生成凭证】
B.【依赖检查】→【出库调整单】→【计算全月平均单价】→【生成实时凭证】→【生成凭证】
C.【出库调整单】→【依赖检查】→【计算全月平均单价】→【生成实时凭证】→【生成凭证】
D.【依赖检查】→【计算全月平均单价】→【出库调整单】→【生成实时凭证】→【生成凭证】
第3题
此题为判断题(对,错)。
第6题
A.前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好
B.前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好
C.前者相比后者学习起来更难
D.前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型
第7题
A.流计算全链路整体上更加强调数据的实时性
B.链路包括数据实时采集、数据实时计算、数据实时集成
C.一个流计算作业必须至少使用一个流数据作为源
D.流计算将计算的结果数据支持写入目的数据
第9题
A.复杂的批量数据处理:MapReduce
B.基于历史数据的交互式查询:Impala
C.基于实时数据流的数据处理:Storm
D.图结构数据的计算:Hive
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!