围棋,一种1v1的博弈
人类学棋路径
- 基本规则
- 死活题
- 定式(手筋)
- 先手后手,与脱先
- 收官
- 实地与势
人类大脑发育过程,先实际,再抽象
- 前额页——风险评估?
- 数学学习过程,算筹,多和少的概念
- 代数,高等数学的理解程度
进一步思考 – 规则与竞争
基于一定规则
- 座子
- 贴目(经典梗——白2败招),贴目的数值化
- 通过胜率调整规则
- 打劫,劫材
盘外招
- 长考
- 封盘
- 限时
特点与乐趣
- 竞争,一定程度上代表智力
- 相对公平,盘外招很少
- 规则相对简单,精通很难,学习曲线陡且长,各种水平差距巨大
- 可以复盘炫耀
计算机解决分析
数学基础
- 微分,求导数在几何上的映射关系
- 最大值,最小值——极值=最优解
- 局部最优和全局最优
- 多参数下的极值与最优解——偏微分
动态规划算法
- 最优子结构
- 子问题重叠
- 无后效性(关键)
- 边界条件
贪心算法
- 总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,得到的是在某种意义上的局部最优解
- 贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择
AlphaGo
AlphaGo的做法是使用了蒙特卡洛树搜索與兩個深度神經網路相結合的方法
- 基于随机抽样的蒙特卡洛方法
- Selection
- Expansion
- Simulation
- Backpropagation
- 神经网络, deep mind
- 卷积神经网络Convolutional Neural Network
方法论
- 通常的成年人技能获得,培训过程类似儿童
- 半途而废的原因——枯燥的练习,时间分配,错配的目标与路径
- 根据目标,设定时间的分配,练习的重点(成年人学围棋的可能性?游泳的例子?网球的例子?)
- 高手的定义——普通人按照一般路径,投入正常资源无法达到的水平(更好的路径,更多的练习)