围棋,一种1v1的博弈

围棋是一种流行很广的游戏,特别在东亚。

学棋一般要从很小年龄学起。一开始是学规则,落子在交叉线上,什么是气,什么是提子。提子是一种典型的正激励,刚刚学棋的孩子会沉迷这种感觉,初学者常见错误,为了享受提子的快乐走一步废棋。

下一个学习阶段,死活题,通过局部5到20步交互,解决一个预设好的棋型(问题)。从学棋的角度来说,这是非常有效率的一步,死活题节拍快,几分钟就可以做一个。难度区分度大,可易可难。特别适合作为筛选,判断学员是否有学棋的天赋。

第三步,定式,死活棋是最小局部,有唯一解的一种情况。作为一种博弈游戏,还存在不唯一的解,称之为定式。这是学习中遇到的第一个抽象挑战。对于相当多的人来说,可能一辈子都无法迈过这一步。开始要判断局势,在某种局势下,这是定式一,最优解,如果你棋风稳健,可以选择定式二。最重要的差异,死活棋是可以看到结果的,而定式在终局复盘之前都是作为不定结果存在的。还有一个和定式类似的定义,叫手筋。

学棋学到这一步,还有兴趣且还能跟上进度,应该已经过去几个月了,这时候学员还无法完整的完成一个对局,这时候的对局往往是大输大赢,中盘获胜。但是在对局中,good player会逐渐领会一些技巧,并开始练习。

  • 先手与后手,哪些招数对手必须接招,哪些只是补充自己的漏洞,而对手可以不理会。甚至对于“必须”接招的棋,什么时候可以冒风险不接招(脱先)。
  • 收官,在局势胶着的局面下,如何在最后的几步棋中将利益最大化获得微小的优势,并获得最后的胜利。
  • 以及最终的技巧,对局势的判断。
    • 实地与势,互相的转化
    • 优势情况下如何逼迫对手犯错
    • 劣势情况下如何打乱局面

当学棋学到这个水平,大概就是一个“高手”了,完整的训练建立了完整的体系,没有经过训练的人几乎不可能打败这样一个高手。后面的世界就是天赋与努力的磨合了。

从围棋开始的思考 ——写作提纲

围棋,一种1v1的博弈

人类学棋路径

  • 基本规则
  • 死活题
  • 定式(手筋)
  • 先手后手,与脱先
  • 收官
  • 实地与势

人类大脑发育过程,先实际,再抽象

  • 前额页——风险评估?
  • 数学学习过程,算筹,多和少的概念
  • 代数,高等数学的理解程度

进一步思考 – 规则与竞争

基于一定规则

  • 座子
  • 贴目(经典梗——白2败招),贴目的数值化
  • 通过胜率调整规则
  • 打劫,劫材

盘外招

  • 长考
  • 封盘
  • 限时

特点与乐趣

  • 竞争,一定程度上代表智力
  • 相对公平,盘外招很少
  • 规则相对简单,精通很难,学习曲线陡且长,各种水平差距巨大
  • 可以复盘炫耀

计算机解决分析

数学基础

  • 微分,求导数在几何上的映射关系
  • 最大值,最小值——极值=最优解
  • 局部最优和全局最优
  • 多参数下的极值与最优解——偏微分

动态规划算法

  • 最优子结构
  • 子问题重叠
  • 无后效性(关键)
  • 边界条件

贪心算法

  • 总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,得到的是在某种意义上的局部最优解
  • 贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择

AlphaGo

AlphaGo的做法是使用了蒙特卡洛树搜索與兩個深度神經網路相結合的方法

  • 基于随机抽样的蒙特卡洛方法
  • Selection
  • Expansion
  • Simulation
  • Backpropagation
  • 神经网络, deep mind
    • 卷积神经网络Convolutional Neural Network

方法论

  • 通常的成年人技能获得,培训过程类似儿童
  • 半途而废的原因——枯燥的练习,时间分配,错配的目标与路径
  • 根据目标,设定时间的分配,练习的重点(成年人学围棋的可能性?游泳的例子?网球的例子?)
  • 高手的定义——普通人按照一般路径,投入正常资源无法达到的水平(更好的路径,更多的练习)