大数据算法(哈尔滨工业大学)2023章节测试答案超星尔雅
我的答案:√
7.4单词共现矩阵的计算
1、【多选题】关于单词共现矩阵的计算,说法正确的是()。
A、计算文本集合中词的共现矩阵
B、词的个数如果为N,输出为M*N的矩阵
C、是一种测量语义距离的方法
D、语义距离可用于许多语言处理任务
我的答案:ACD
2、【多选题】用单词共现矩阵解决大规模计数问题的基本方法是()。
A、Mapper生成部分计数
B、Reducer生成部分计数
C、Reducer聚合部分计数
D、Mapper聚合部分计数
我的答案:AC
3、【多选题】“条纹法”的优点有()。
A、易于实现
B、对key-value对的排序和洗牌少得多
C、潜在对象更大
D、能更好地利用combiner
我的答案:BD
4、【判断题】在“词对法”中,每个mapper处理一个句子。()
我的答案:√
5、【判断题】“词对法”的缺点是不易实现,排序和洗牌代价高。()
我的答案:X
6、【判断题】f(B|A)词对法必须确定所有a被传递到同一个combiner。()
我的答案:X
8.1连接(join)算法
1、【单选题】在repartition join的改进中,说法错误的是()。
A、Map函数的输出键作为连接键
B、Map函数的输出键变化为连接键和表名的组合。
C、Partition函数中Hashcode仅从组合键的连接键计算
D、Grouping函数仅根据连接键分组纪录
我的答案:A
2、【多选题】用MR进行多重集相似连接算法的常见计算包括()。
A、三角函数
B、单元函数
C、合取函数
D、析取函数
我的答案:BCD
3、【判断题】自然连接是从两个关系的笛卡尔积中选取给定属性间满足一定条件的元组。()
我的答案:X
4、【判断题】等值连接不必在结果中去掉重复的属性。()
我的答案:√
8.2图算法
1、【判断题】在迭代MapReduce中,reduce的输出必须和map的输入兼容。()
我的答案:√
2、【判断题】“推荐好友”是图算法在社交网络中的一种实际用例。()
我的答案:√
8.3基于路径的算法
1、【单选题】找到一个稠密图的最小生成树的算法易于并行化的原因是每个子图的()可以被并行计算。
A、边
B、顶点
C、结点
D、最小生成树
我的答案:D
2、【单选题】基于路径的算法的例子不包括()。
A、单源最短路径
B、最小生成树
C、分布式不动点运算
D、拓扑排序
我的答案:C
3、【多选题】在基于路径的算法中,边的标记包括()。
A、代价
B、距离
C、相似性
D、属性
我的答案:ABC
4、【判断题】Dijkstra算法需要并行化。()
我的答案:X
9.1基于迭代处理平台的并行算法
1、【多选题】缓存迭代的方法是()。
A、在Mapper前加入输入缓存
B、在Mapper后加入输出缓存
C、在Reducer前加入输入缓存
D、在Reducer后加入输出缓存
我的答案:ACD
2、【判断题】MapReduce是一种非递归描述性语言的通用运行平台。()
★《布宫号》提醒您:民俗信仰仅供参考,请勿过度迷信!