从围棋开始的思考 ——写作提纲

围棋,一种1v1的博弈

人类学棋路径

  • 基本规则
  • 死活题
  • 定式(手筋)
  • 先手后手,与脱先
  • 收官
  • 实地与势

人类大脑发育过程,先实际,再抽象

  • 前额页——风险评估?
  • 数学学习过程,算筹,多和少的概念
  • 代数,高等数学的理解程度

进一步思考 – 规则与竞争

基于一定规则

  • 座子
  • 贴目(经典梗——白2败招),贴目的数值化
  • 通过胜率调整规则
  • 打劫,劫材

盘外招

  • 长考
  • 封盘
  • 限时

特点与乐趣

  • 竞争,一定程度上代表智力
  • 相对公平,盘外招很少
  • 规则相对简单,精通很难,学习曲线陡且长,各种水平差距巨大
  • 可以复盘炫耀

计算机解决分析

数学基础

  • 微分,求导数在几何上的映射关系
  • 最大值,最小值——极值=最优解
  • 局部最优和全局最优
  • 多参数下的极值与最优解——偏微分

动态规划算法

  • 最优子结构
  • 子问题重叠
  • 无后效性(关键)
  • 边界条件

贪心算法

  • 总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,得到的是在某种意义上的局部最优解
  • 贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择

AlphaGo

AlphaGo的做法是使用了蒙特卡洛树搜索與兩個深度神經網路相結合的方法

  • 基于随机抽样的蒙特卡洛方法
  • Selection
  • Expansion
  • Simulation
  • Backpropagation
  • 神经网络, deep mind
    • 卷积神经网络Convolutional Neural Network

方法论

  • 通常的成年人技能获得,培训过程类似儿童
  • 半途而废的原因——枯燥的练习,时间分配,错配的目标与路径
  • 根据目标,设定时间的分配,练习的重点(成年人学围棋的可能性?游泳的例子?网球的例子?)
  • 高手的定义——普通人按照一般路径,投入正常资源无法达到的水平(更好的路径,更多的练习)

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注