AI程序被称为智能代理,即:Intelligent Agent。
以下过程是只能代理典型的的工作过程:
工作过程如下:
智能代理会不断重复这一过程直到目标达成,这一过程被称之为“感知执行循环”。
交易智能代理根据获取的新闻资讯和其它环境数据做出交易决策,并执行交易过程。这一细分领域就是量化交易研究的内容。
实体机器人的智能代理与环境的交互过程与也相似。
不同的是,它获知环境是通过摄像头、麦克风、触觉传感器等物理外设实现,执行决策也是轮子、机器臂、扬声器、腿等物理外设完成,因为实体使用物理外设与周围环境交互,所以与其它单纯的人工智能应用场景稍有区别。
游戏代理有两种:
一种用于与人类玩家实现对战,比如你玩棋牌游戏,那么对于智能代理而言,你就是环境,智能代理将以你的操作作为输入,以战胜你为目标来做出决策并执行决策。
另一种则充当了游戏中的其它角色,智能代理的目的是让游戏更加真实,更富可玩性。
医疗诊断的智能代理以病人的检查结果——血压、心率、体温等等作为输入推测病情
但推测的诊断结果将告知医生,并由医生来根据诊断结果给予病人恰当的治疗
这一场景中、病人和医生同时作为外部环境,只能代理的输入和输出不同
搜索引擎只能代理的输入包括网页和搜索用户
搜索引擎只能代理一方面以网络爬虫抓取的网页作为输入存入数据库,在用户搜索时从数据库中检索匹配最合适的网页返回给用户。
综上所述,人工智能可以简单理解成——通过外部环境输入做决策并影响外部环境的过程,如果你写一个程序帮助计算机聪明的解决问题,它就是智能代理。
如果智能代理任何时间点能够获取的环境信息足以让它做出最优决策,那么它就是【完全可观测的】。举例来说,扑克游戏,如果所有人把牌面都亮出,那么对于智能代理来说,环境就是【完全可观测的】。
而多数情况下,智能代理智能获知部分环境因素,决策需要依赖于自己之前积累的环境数据来做出决策,这种情况被称为【部分可观测的】。举例来说,打牌时,往往无法看到其他玩家的牌面,出牌需要根据记住大家已经出了哪些拍,各自手里坑能还有哪些牌来做出决策,那么这种环境就是【部分可观测的】
部分可观测环境的智能代理通常需要内部的记忆机制,记忆历史环境数据来帮助决策。
【确定性】是指下一步变化在可预测范围内。举例来说,多数棋类游戏下子方在某一时刻虽然有多重选择,但按照规则只在有限的选择内下子,其产生的效果是可预测的。这种选择范围有限的特性被称之为【确定性】。
【随机性】是指智能代理和外部环境下一步可能决定和状态改变完全无法预测。举例来说,扑克牌游戏是不确定的,你即无法知道每个对手手中有什么牌,也无法知道他可能出什么牌,所以扑克牌游戏是【随机性】的。
【离散性】是指外部环境的变化实在有限个可预期的结果和情况中做出选择,而非完全随机。举例来说,象棋或围棋落子因为只能再棋盘上画出的固定位置,所以是【离散的】。
【连续性】则指环境变化状态不存在确定的点。举例来说,投掷飞镖的落点就是【连续性】的。
【温和性】环境虽然变化莫测,但其目标并不是阻止你完成某项任务,这种环境是【温和性】的。举例来说,天气情况虽然变化莫测,但是其变化的目的并非是针对你的,那么天气就是【温和性】环境。
【对抗性】环境的会始终阻碍你完成任务,这种环境称之为【对抗性】环境。举例来说,智能代理与人类进行棋牌对弈时,外部环境(人类对手)的目标是战胜智能代理,那么人类对智能代理来说就是【对抗性】外部环境
可以通过以下三种只能代理面临的环境因素做个对比
机器翻译最重要的过程是学习人类怎样翻译语言,程序通过阅读大量翻译内容来实现对语言的理解。
通过汉语VS日语来举例,机器学习的远离很简单,当一个相同的词语在几个句子中出现时,只要通过对比日语版本翻译中同样在每个句子中都出现的短语便可知道它的日语翻译是什么,按照这种方式不难推测:
机器学习在识别词汇时可以不追求完全匹配,只要匹配达到一定比例便可认为这是一种可能的翻译方式。
本文由 @我是开水
既然来了,说些什么?