A.交互式查询:基于海量数据的透视分析,用户可以通过上卷、下钻、切片等交互操作,了解数据集细节
B.机器学习:监督学习、无监督学习、分类算法如决策树、SVM等
C.文本统计分析:比如词频TFIDF分析;学术论文、专利文献的引用分析和统计;维基百科数据分析等
D.Web访问日志分析;分析和挖掘用户在web上的访问、购物行为特征,分析用户访问行为
第1题
A.并行数据处理MapReduce
B.分布式锁Chubby
C.结构化数据表BigTable
D.弹性云计算EC2
第3题
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce
第4题
A.MapReduce程序只能用Java写
B.MapReduce是一种计算框架
C.MapReduce来源于google的学术论文
D.MapReduce隐藏了并行计算的细节,方便使用
第7题
A、MapReduce的核心思想就是“分面治之”
B、HDFS是对GFS的开源实现
C、MapReduce是一种分布式计算模型
D、HDFS采用HBase作为其底层数据存储
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!