当前位置: 华东财经网 - 股票

了解人工智能如何学习玩游戏,人们对AI就不恐惧了

时间:2018-10-29   来源:华东财经网    作者:潇潇    

  一年前的AlphaGo围棋大战,证明了拥有深度学习能力的人工智能(以后简称为AI)所具有的令人恐怖的学习能力,而且这种学习能力可以用在现代生活的几乎任何领域,人类因此开始对AI产生恐惧。

了解人工智能如何学习玩游戏,人们对AI就不恐惧了

  很多人受到了科幻电影的影响,认为深度学习会导致AI的自我意识觉醒,那个时候人类会陷入万劫不复之地。

  恐惧源于未知。我们真的了解AI吗?了解深度学习吗?对于自我意识觉醒的说法,只能说真是电影看多了。

  深度学习AI是什么?

  抛开那些专业性太强的词汇定义方式,通过了解AI的深度学习过程,就能了解什么是AI深度学习了。

  AI要进行深度学习,首先需要为它设定一个目标,比如画画或是控制核武器发射。其次让AI学习达成这个目标的基本方式,比如落笔、画线条、画方画圆等等这些都是实现画画的基本方式。之后要为AI进行人为的干预判断,比如禁止某些笔法线条或是只临摹单一风格的画作。最后是人为干预结束后,继续让AI进行自我学习,随着时间的积累,经过不断调教的AI就能变成人类所期望的效果了。

了解人工智能如何学习玩游戏,人们对AI就不恐惧了

  目标设定—自主学习—选择判断—再次学习,AI就是在这个多次循环的过程中一直进行着自我学习,才会越来越变得具有所谓的人性。而之所以说在这个过程中深度学习AI无法产生自我意识,是源于人类拥有的两项基本权力。

  1、AI程序无法为自己设定目标,只有人类能为AI设定目标。深度学习的AI程序是针对单一目的而存在,深蓝是国际象棋的高手,阿尔法狗是围棋的NO.1,可是换作别的领域,它们也是一无是处,目的性是AI存在的先决条件。

  2、在AI的深度学习过程中,如果出现并行规则的逻辑BUG,或者是导致目标不可完成的情况时,这种选择判断的权力也是由人类掌控, 人们根据自己意愿为AI做出选择判断,哪些选项更优先?哪些选项全面禁止?这些由必须人类说了算。

  AI会变成什么,完全取决于人类让它学习什么。

  如果说通过上述说明,仍然无法直观理解AI的深度学习过程,接下来将用游戏来说明,AI深度学习是如何掌握游戏操控的,这样会更方便世人理解。

  至于选择用游戏作为AI学习环境的原因,在于AI与游戏所具有完全相同的“血统”。游戏环境是完全由计算机编码构成的虚拟环境,其中的天气、地形、人物、场景都与AI完全一致,从而让AI可以从最底层的方式去认知游戏,将AI用于深度学习所需的数据采集难度降至最低。

  以游戏之名,AI如何深度学习

  假设在知名的沙盒游戏《侠盗猎车手》(GTA)中放入一个AI脚本程序,这个AI脚本的作用是控制NPC移动,为此将做出以下设定。

  目标设定:控制NPC从目前所在地点A前往地点B。

  场景说明:地点A到地点B之间存在荒原、城市街道、水路、飞机场等多种地形和标志性建筑。

  NPC移动规则:步行、跑步、骑自行车、摩托车、驾驶汽车、乘坐直升机、摩托艇、客机、战斗机。

  NPC其它规则:查看地图、抢劫车辆、向警察开枪射击。

了解人工智能如何学习玩游戏,人们对AI就不恐惧了

  自主学习阶段:AI将根据地图分别尝试步行、跑步、驾驶地面、水面和空中交通工具前往B点,中途也许还会在街道上抢劫车辆,引发警报后可警察开枪互射。

  选择判断阶段:由于GTA中的警察会不断增援,在NPC不会逃离的情况下最终难逃一死,因此A点移动到B点的过程中断,这时需要让NPC学习警察开枪后逃跑远离警察的规则,以便让NPC在于警察交火后尽快离开,同时AI还学会了搜索如何避开警察的巡逻路线。

  再次学习阶段:AI在自己没有车的情况下,选择在荒原上一条没有警察巡逻的高速公路上抢劫车辆,迅速前往B点。

  尽管现实中AI脚本并不会按上述效果那样,但可以通过这样的例子说明,再次学习时的AI已经比最初的自主学习有了更多人性化的举动。

  如果说自主学习时只是实现了“从A点到B点”,那么再次学习时就能够实现“在不引发任何警报的情况下到达B点”,通过不断的学习优化,AI所掌握的行为方式越来越多,以后就可以实现诸如“开着直升飞机在不引发警报的情况下到达B点”或者“需要开一辆兰博基尼车先到C点后再到B点”这样更为复杂的需求。

  如何正确使用AI?

  不断学习优化的AI能实现越来越复杂的人类需求,当人们提出相应需求时,AI会搜索所有已经学会的方法,根据搜索算法组合出最符合人们需求的解决方案,这就是深度学习AI的终极作用,这并不关乎到什么伦理道德,毕竟AI并非人类。

  AI所考虑的只有两点,它所需要完成什么目标以及在它的已知经验中用什么方式完成目标。对于AI来说,从A点移动到B点的行为与发射搭载分导式核弹头的洲际弹道导弹到地球上的任何地方并没有任何分别,它只需要按照人类的需要完成目标。

了解人工智能如何学习玩游戏,人们对AI就不恐惧了

  要阻止AI毁灭人类,需要做的是通过立法手段对AI研究活动加以限制,比如可能产生大规模杀伤性行为的AI以及犯罪行为的AI,就像GTA那样的AI作为游戏时是合法的,但是作为AI使用时,使用者就需要蹲监狱了。

  正确使用AI的方式是,将AI永久定位于人类辅助者的角色,让其帮助人类完成那些重复性的反复劳作,让人类有更多精力放在更具创造性和更具人文自然精神的工作上,为人类自身和自然环境找到更和谐更美好的生存之道。

  如果连目标都要交给AI设定,那人类和行尸走肉有什么分别?如果人连理想都没有,那和咸鱼又有什么分别呢?

相关内容