人工智能与信息社会2023章节测试答案

15、【判断题】梯度下降算法是最常用也是最有效的神经网络的优化办法,完全可以满足不同类型的需求。()

我的答案:错误

6.8本章测验

1、【单选题】典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于()。

A、监督学习

B、非监督学习

C、强化学习

D、线性回归

我的答案:B

2、【单选题】()有跟环境进行交互,从反馈当中进行不断的学习的过程。

A、监督学习

B、非监督学习

C、强化学习

D、线性回归

我的答案:C

3、【单选题】在Q-Learning中,所谓的Q函数是指()。

A、状态动作函数

B、状态值函数

C、动作值函数

D、策略函数

我的答案:A

4、【单选题】Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。

A、期望值

B、最大值

C、最小值

D、总和

我的答案:A

5、【单选题】在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()。

A、大;小

B、大;大

C、小;小

D、小;大

我的答案:A

6、【单选题】在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。

A、大;小

B、大;大

C、小;小

D、小;大

我的答案:A

7、【单选题】在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。

A、探索;开发

B、开发;探索

C、探索;输出

D、开发;输出

我的答案:A

8、【单选题】强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。

A、探索

B、开发

C、输入

D、输出

我的答案:A

9、【单选题】马尔可夫性质强调在每一个动作状态序列中,下一个状态与()有关。

A、外部影响

B、主体内因

C、历史状态

D、当前状态

我的答案:D

10、【单选题】强化学习的回报值一个重要特点是具有()。

A、客观性

B、主体性

C、超前性

D、滞后性

我的答案:D

11、【多选题】用于监督分类的算法有()。

A、支持向量机

B、决策树

C、神经网络

D、线性回归

我的答案:ABC

12、【多选题】在强化学习中,主体和环境之间交互的要素有()。

A、状态

B、动作

C、回报

D、强化

我的答案:ABC

13、【判断题】对人脸好看程度评分,主要用的是监督学习的分类功能。()

我的答案:错误

14、【判断题】人工智能学习玩Flappy Bird过程中,只需要人类告诉AI不能碰到水管即可,不需要提供其他信息。()

我的答案:错误

15、【判断题】状态动作函数直接决定主体该采取什么决策。()

我的答案:错误

7.6本章测验

1、【单选题】以下四个人工智能的应用领域中,与其他三个不同的是()。

★《布宫号》提醒您:民俗信仰仅供参考,请勿过度迷信!

本文经用户投稿或网站收集转载,如有侵权请联系本站。

发表评论

0条回复