人工智能 - 代理和环境


人工智能系统由代理及其环境组成。代理在他们的环境中行动。环境可能含有其他物质。

什么是代理和环境?

代理是任何可以通过传感器感知其环境并通过效应器对该环境采取行动的东西

  • 人类代理具有与传感器平行的感觉器官,例如眼睛、耳朵、鼻子、舌头和皮肤,以及其他器官,例如手、腿、嘴,作为效应器。

  • 机器人代理取代了传感器的摄像头和红外测距仪,以及效应器的各种电机和执行器。

  • 软件代理将位串编码为其程序和操作。

代理和环境

代理术语

  • 代理的绩效衡量标准- 它是决定代理成功程度的标准。

  • 代理的Behave- 这是代理在任何给定的感知序列之后执行的操作。

  • 感知- 它是代理在给定实例下的感知输入。

  • 感知序列- 这是迄今为止代理所感知的所有历史。

  • 代理功能- 它是从戒律序列到行动的映射。

理性

理性不过是理性、理智、有良好判断力的状态。

理性涉及预期的行动和结果,具体取决于主体的感知。以获取有用信息为目的而采取行动是理性的重要组成部分。

什么是理想理性代理?

理想的理性代理人是能够采取预期行动以最大化其绩效衡量标准的代理人,其基础是 -

  • 其感知序列
  • 其内置知识库

代理人的理性取决于以下因素 -

  • 绩效衡量标准决定了成功的程度。

  • 到目前为止,特工的感知序列。

  • 智能体对环境的先验知识

  • 代理可以执行的操作

理性主体总是执行正确的行动,其中正确的行动意味着使主体在给定的感知序列中最成功的行动。代理解决的问题由性能测量、环境、执行器和传感器 (PEAS) 来表征。

智能体的结构

代理的结构可以视为 -

  • Agent = 架构 + Agent 程序
  • 架构 = 代理执行的机器。
  • 代理程序 = 代理功能的实现。

简单的反射代理

  • 他们仅根据当前的看法来选择行动。
  • 只有根据当前的戒律做出正确的决定,他们才是理性的。
  • 他们的环境是完全可观察的。

条件动作规则- 这是将状态(条件)映射到动作的规则。

简单反射代理

基于模型的反射代理

他们使用世界模型来选择他们的行动。他们维持一种内部状态。

模型- 关于“世界上事物如何发生”的知识。

内部状态- 它是当前状态的未观察到的方面的表示,具体取决于感知历史。

更新状态需要以下信息 -

  • 世界如何演变。
  • 特工的Behave如何影响世界。
基于模型的反射代理

基于目标的代理

他们选择自己的行动以实现目标。基于目标的方法比反射代理更灵活,因为支持决策的知识是明确建模的,从而允许修改。

目标- 这是对理想情况的描述。

基于目标的反射代理

基于实用程序的代理

他们根据每个状态的偏好(效用)选择操作。

当以下情况时,目标是不充分的:

  • 存在着相互冲突的目标,其中只有很少的目标能够实现。

  • 目标的实现存在一定的不确定性,您需要权衡成功的可能性与目标的重要性。

基于实用程序的代理

环境的本质

有些程序在完全人工的环境中运行,仅限于键盘输入、数据库、计算机文件系统和屏幕上的字符输出。

相比之下,一些软件代理(软件机器人或软机器人)存在于丰富的、无限的软机器人领域中。模拟器有一个非常详细、复杂的环境。软件代理需要从大量的实时操作中进行选择。旨在扫描客户的在线偏好并向客户展示有趣的商品的软机器人可以在真实人工环境中工作。

最著名的人工环境图灵测试环境,其中一个真实的代理和其他人工代理在平等的基础上进行测试。这是一个非常具有挑战性的环境,因为软件代理很难像人类一样执行。

图灵测试

系统智能Behave的成功可以通过图灵测试来衡量。

两个人和一台待评估机器参加测试。两人中,一人扮演测试员的角色。他们每个人都坐在不同的房间里。测试人员不知道谁是机器,谁是人。他通过打字并将问题发送给两个智能体来询问问题,然后他收到打字的答复。

该测试的目的是欺骗测试人员。如果测试人员无法根据人类的响应确定机器的响应,则该机器被认为是智能的。

环境特性

环境具有多重属性 -

  • 离散/连续- 如果环境的不同、明确定义的状态数量有限,则环境是离散的(例如,国际象棋);否则它是连续的(例如,驾驶)。

  • 可观察/部分可观察- 如果可以从可观察的感知中确定每个时间点环境的完整状态;否则只能部分观察到。

  • 静态/动态- 如果代理运行时环境没有变化,则它是静态的;否则它是动态的。

  • 单代理/多代理- 环境可能包含其他代理,这些代理可能与代理的类型相同或不同。

  • 可访问/不可访问- 如果代理的感觉装置可以访问环境的完整状态,则该代理可以访问该环境。

  • 确定性/非确定性- 如果环境的下一个状态完全由当前状态和代理的动作决定,则环境是确定性的;否则它是不确定的。

  • 情景/非情景- 在情景环境中,每个情景都由代理感知然后采取行动组成。其动作的质量仅取决于剧集本身。后续剧集不依赖于前一剧集中的动作。情景环境要简单得多,因为代理不需要提前思考。