如何设计可自学习的五子棋AI?

小史是一个应届生,虽然学的是电子专业,但是自己业余时间看了很多互联网与编程方面的书,一心想进BAT互联网公司。

今天他去了一家国内人工智能巨头公司面试了。

简单的自我介绍后,面试官开始发问了。

【面试现场】




题目:如何设计可自学习的五子棋AI?












【请教大神】

小史回到学校,把面试的情况和计算机学院的吕老师说了一下。





【AlphaGO】









吕老师:一开始的AlphaGO是什么都不知道的,它是随机落子。但是它并不是random一个点,而是根据现场的情况和自身的算法,来落子,只是算法中的参数是随机的,所以落下的子也是随机的。







吕老师:这就要靠人去设计了,当然我们现在有一些比较成熟的神经网络模型,选好之后,所谓的训练啊,学习啊,其实都是在调节里面的参数。

【五子棋AI设计】

吕老师:首先我们来看你的算法,你会发现它的规则都是定死的,如果出现一种没有考虑到的情况,那么算法就不能进行堵截。



吕老师:哈哈,如果这样做的话,这种情况是无穷无尽的。而且五子棋的玩法比较简单,你还能设计出这样的规则,像围棋这种复杂的棋类,你可能没办法去设计这些规则了。




















小编注:关于这种算法的具体实现,由于篇幅较大就不在文章中具体展开了。想了解具体实现的朋友可以观看我在慕课网录制的免费视频教程:JS实现人机大战之五子棋(AI篇),地址:https://www.imooc.com/learn/644

【AI】






吕老师:小史,你看4个子的权重,你给10000,或者给50000,甚至给1个亿,对于其他值来说都是绝对高的值,所以最后效果应该是一样的。






吕老师:我们刚刚设计的这个五子棋算法,其实还是很简单,所以搜索空间并不大,如果是围棋这种复杂棋类,搜索空间将巨大无比,那就要采用非常先进的AI算法了,里面可能有成千上万个参数,训练起来计算量也是非常大,会有很多降维算法在里面,这些等你真正遇到,我再给你讲吧。


发表评论

后才能评论