用 Python 跟自己下棋(续)

上周跟着 AlphaGo vs. 李世乭人机大战的风,写了一个命令行下的 TicTacToe 井字棋。不过,电脑是随机选位置,胡乱走子,所以下赢电脑易如反掌,下输给它反倒要点运气。那么本篇的任务就是,给电脑走子加上一点点简单的策略,让它不那么“傻”。

棋类游戏最基本的 AI 方法就是给棋盘上每个位置的优劣程度打分,然后选择的最高分的位置来走。打分算法的好坏,就决定了这个 AI 的“智能”程度。

要给我们的井字棋 AI 制定打分方法,首先就得分析一下井字棋本身的对局策略。好在这个游戏的规则很简单,总结下来基本就是:

  • 尽可能让自己走成 3 个

  • 在自己走成 3 个之前,不要让对方走成 3 个

  • 最好能在 2 条路线上同时走到 2 个,且第 3 个位置可走

  • 选择还有可能走出 3 个的路线上

  • 尽量选择路线的交叉点

在继续往下阅读之前,你可以设想一下,自己要如何来完成这段打分的代码,并把它加入现有的代码中。建议亲手试试看。


基于上面几点分析,对于棋盘上每一个还未落子的点,我制定了如下的打分方法:

  1. 每个位置默认 0 分

  2. 对横、竖、斜三条线分别进行判断,分值累加

  3. 如果线上有 2 个己方棋子,+1000

  4. 如果线上有 2 个对方棋子,+900

  5. 如果线上有 1 个己方棋子,0 个对方棋子,+100

  6. 如果线上有 1 个对方棋子,0 个己方棋子,+90

  7. 如果线上没有任何棋子,+10

  8. 如果此位置是线上的中间位置,+1

再补充解释一下:

  • 这里没有去判断位置是不是交叉点,因为每条线是分开计算的,交叉点本身就会因此多计算多得分,所以不用再额外处理。

  • 这个分数是拍脑袋想出来的,不是绝对有意义,但能保证不同条件在数量级上的差别。

  • 除了最后一条判断中间位置,其他几个规则都是与当前具体位置无关,只和其所在线上的状况相关。所以可以用同一个方法来处理。

  • 只有部分情况需要判断斜线。

  • 没有判断既有己方又有敌方的情况,因为这种情况的位置是没有落子的价值的,不用计算它,就是 0 分。

于是,基本的程序逻辑就是:

遍历棋盘上每个点:

如果不能走:

判断下一个点

加上横向得分

加上纵向得分

如果在对角线上:

加上斜向得分

如果是中间点:

加分

如果总分超过最高分:

记录下当前位置

更新最高分

返回最高分所在位置

为了节省再次遍历的开销,在计算得分的同时,就可以把最高分和位置记录下来。

代码如下:

def moveAI():

print 'AI\'s turn...'

point = [

[0, 0, 0],

[0, 0, 0],

[0, 0, 0],

]

max_point = -1

position = (0, 0)

for i in range(3):

for j in range(3):

if board[i][j] != 0:

point[i][j] = -1

continue

# row

point[i][j] += calcPoint(board[i])

# col

line = [board[k][j] for k in range(3)]

point[i][j] += calcPoint(line)

# left-top to right-bottom

if i == j:

line = [board[k][k] for k in range(3)]

point[i][j] += calcPoint(line)

# right-top to left-bottom

if i + j == 2:

line = [board[k][2 - k] for k in range(3)]

point[i][j] += calcPoint(line)

# center

if i == 1:

point[i][j] += 1

if j == 1:

point[i][j] += 1

if point[i][j] > max_point:

max_point = point[i][j]

position = (i, j)

print point

board[position[0]][position[1]] = 2

在判断每条线得分时,我们把一个含有 3 个位置的数组传给 calcPoint,经它计算得到分值。下面再来看这个核心的算分函数:

def calcPoint(line):

point = 0

if line.count(2) == 2:

point += 1000

if line.count(1) == 2:

point += 900

if line.count(2) == 1 and line.count(1) == 0:

point += 100

if line.count(2) == 0 and line.count(1) == 1:

point += 90

if line.count(0) == 3:

point += 10

return point

用到了 list 的 count 方法,判断列表中某个元素出现的次数。就这么多代码,完成了电脑的 AI。

这里顺便说一句,我在最开始写这段代码时,并没有考虑到把几种情况整合到一个函数中处理,而且先写了横向的判断。之后再写纵向时,发现可以复用,于是再重构了代码。在实际写代码的时候,经常也有类似的情况。你不用一开始就想一个完美的解决方案,可以先用想到的方法把功能实现,再逐步优化。

把代码添加到已有的游戏代码中,再跟电脑大战三百回合试试看。

由于井字棋棋盘太小,先走的一方具有巨大的优势。理论上来说,只要先手方不犯错,后手方是不可能赢的。现在的电脑作为后手方,已经可以保证不输。而当它先手时,你得保证不犯错才能打成平手。

(完整代码和程序运行效果已上传论坛。)

最后,一个小问题:

如何改动最小的代码,让这个程序变成随机先后手,而不是现在固定玩家先走。

一个大问题:

你能不能用 Pygame 把它改写成一个鼠标操作的游戏,甚至可以保存对战结果和对局过程。


(0)

相关推荐

  • xamarin.android 文本文件读写

    //写文件 public async Task SaveCountAsync(int count) { var backingFile = Path.Combine(System.Environmen ...

  • 用 Python 跟自己下棋

    今天,李世乭终于在与 AlphaGo 的人机大战中扳回一局.但计算机 AI 可以在围棋上战胜人类顶尖棋手的时代已经到来.可以预见,人工智能和机器人将会在更多领域做到比人力更高效.准确.安全.所以未来, ...

  • Python 爬虫,推荐一款简单的抓包工具(续)

    Python 爬虫,推荐一款简单的抓包工具(续)

  • 诸气辨证短气气短不能续,少气气少不足言,...

    诸气辨证 短气气短不能续,少气气少不足言,气痛走注内外痛,气郁失志怫情间,上气气逆苏子降,下气气陷补中宣,臭甚伤食肠胃郁,减食消导自然安. [注]短气者,气短而不能续息也:少气者,气少而不能称形也,皆 ...

  • Python|二叉树叶子结点问题解决方法

    问题描述键盘输入一颗二叉树,求解其叶子结点个数.示例: 输入:4,2,6,1,3,5输出:3解决方案一棵树当中没有子结点(即度为0)的结点称为叶子结点,简称"叶子".当二叉树为空时 ...

  • 名老中医用药心得【桂枝】续

                    桂枝 张云鹏经验 1,主治病证 胸痹(冠心病),心悸(心律失常.不整脉),膨胀(各种原因引起腹水),脉痹(血栓闭寒性脉管炎),痹证(风湿性关节炎,风湿相搏):旭痹(类风 ...

  • Python数据分析库有哪些?常见分类!

    众所周知,Python前景好.需求量大.薪资高.就业岗位多,除了基本的开发工作之外,还可以从事人工智能.数据分析.网络爬虫等岗位.那么说起数据分析,你知道Python常用数据分析库有哪些吗?我们一起来 ...

  • PyPy为什么能让Python比C还快?一文了解内在机制

    来自|机器之心 「如果想让代码运行得更快,您应该使用 PyPy.」 - Python 之父 Guido van Rossum 对于研究人员来说,迅速把想法代码化并查看其是否行得通至关重要.Python ...

  • 【Python爬虫】:使用高性能异步多进程爬虫获取豆瓣电影Top250

    在本篇博文当中,将会教会大家如何使用高性能爬虫,快速爬取并解析页面当中的信息.一般情况下,如果我们请求网页的次数太多,每次都要发出一次请求,进行串行执行的话,那么请求将会占用我们大量的时间,这样得不偿 ...

  • 【Python爬虫】:破解网站字体加密和反反爬虫

    前言:字体反爬,也是一种常见的反爬技术,例如58同城,猫眼电影票房,汽车之家,天眼查,实习僧等网站.这些网站采用了自定义的字体文件,在浏览器上正常显示,但是爬虫抓取下来的数据要么就是乱码,要么就是变成 ...