第一章课后习题 #610
Unanswered
JavaBigData-cjc
asked this question in
💬 Exercises & Q&A
第一章课后习题
#610
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
请分析以下四个 case 中的主体是否属于智能体,如果是,那么属于哪种类型的智能体(可以从多个分类维度进行分析),并说明理由:
case A:一台符合冯·诺依曼结构的超级计算机,拥有高达每秒 2EFlop 的峰值算力
反应式,对外部的输入反应
case B:特斯拉自动驾驶系统在高速公路上行驶时,突然检测到前方有障碍物,需要在毫秒级做出刹车或变道决策
反应式,反应时间极短
case C:AlphaGo在与人类棋手对弈时,需要评估当前局面并规划未来数十步的最优策略
学习型智能体,通过学习元件观察智能体元件运行结果并纠正
case D:ChatGPT 扮演的智能客服在处理用户投诉时,需要查询订单信息、分析问题原因、提供解决方案并安抚用户情绪
混合式/规划式,需要规划解决问题的步骤
假设你需要为一个"智能健身教练"设计任务环境。这个智能体能够:
通过可穿戴设备监测用户的心率、运动强度等生理数据
根据用户的健身目标(减脂/增肌/提升耐力)动态调整训练计划
在用户运动过程中提供实时语音指导和动作纠正
评估训练效果并给出饮食建议
请使用 PEAS 模型完整描述这个智能体的任务环境,并分析该环境具有哪些特性(如部分可观察、随机性、动态性等)。
描述任务环境的 PEAS 模型分别是performance,environment,actuators,sensors,在该任务下:
性能度量(performance):最大化用户健身的收益
环境:心率检测设备
执行器:获取用户运动数据的函数
传感器:解析生理数据的格式,
某电商公司正在考虑两种方案来处理售后退款申请:
方案 A(Workflow):设计一套固定流程,例如:
A.1 对于一般商品且在 7 天之内,金额 < 100RMB 自动通过;100-500RMB 由客服审核;>500RMB 需主管审批;而特殊商品(如定制品)一律拒绝退款
A.2 对于超过 7 天的商品,无论金额,只能由客服审核或主管审批;
方案 B(Agent):搭建一个智能体系统,让它理解退款政策、分析用户历史行为、评估商品状况,并自主决策是否批准退款
请分析:
这两种方案各自的优缺点是什么?
workflow:流程明确,清晰,但是死板;
agent:像人一样去完成退款工作,但是容易出现幻觉
在什么情况下 Workflow 更合适?什么情况下 Agent 更有优势?如果你是该电商公司的负责人,你更倾向于采用哪种方案?
在流程更规范,结构化的情况,workflow更合适,在可调整空间大,弹性高的情况下,agent更有优势;如果我是电商负责人,我可能更倾向于设计一个agent,因为总有突发情况发生,workflow可能考虑不到很多情况。
是否存在一个方案 C,能够结合两种方案,达到扬长避短的效果?
在 1.3 节的智能旅行助手基础上,请思考如何添加以下功能(可以只描述设计思路,也可以进一步尝试代码实现):
提示:思考如何修改 Thought-Action-Observation 循环来实现这些功能。
添加一个"记忆"功能,让智能体记住用户的偏好(如喜欢历史文化景点、预算范围等)
可能需要一个专门的文件记住用户的偏好,然后将其加入到observation中。
当推荐的景点门票已售罄时,智能体能够自动推荐备选方案
这里应该要专门写一个判断,需要在action的位置修改专门的逻辑
如果用户连续拒绝了 3 个推荐,智能体能够反思并调整推荐策略
这说明可能需要一个记忆来处理,在observation中加入用户可能讨厌什么类型的景点,然后再推荐
卡尼曼的"系统 1"(快速直觉)和"系统 2"(慢速推理)理论[2]为神经符号主义 AI 提供了很好的类比。请首先构思一个具体的智能体的落地应用场景,然后说明场景中的:
提示:医疗诊断助手、法律咨询机器人、金融风控系统等都是常见的应用场景
哪些任务应该由"系统 1"处理?
那些要求反应时间短,实时要求高的任务就需要系统1来处理
哪些任务应该由"系统 2"处理?
而那些需要仔细规划的任务就由系统2处理
这两个系统如何协同工作以达成最终目标?
各司其职,分工合作,扬长避短。
尽管大语言模型驱动的智能体系统展现出了强大的能力,但它们仍然存在诸多局限。请分析以下问题:
为什么智能体或智能体系统有时会产生"幻觉"(生成看似合理但实际错误的信息)?
因为在thought阶段,智能体本质上式预测下一个词语,那么这里就可能出现幻觉了,如果observation不合理或者有误的话,传给大模型之后,大模型可能就会出现一些幻觉
在 1.3 节的案例中,我们设置了最大循环次数为 5 次。如果没有这个限制,智能体可能会陷入什么问题?
如何评估一个智能体的"智能"程度?仅使用准确率指标是否足够?
不够,评估智能程度主要是看是否达到用户的期望,满足用户的需求。
Beta Was this translation helpful? Give feedback.
All reactions