《数学之美》

作者简介

阅读完整本书,给我的感觉就是吴军博士真的很用心地在写这本书,在书中介绍数学在搜索引擎下的应用之外,也描述了他任职Google所碰到的人和事。他在Google工作期间完成了很多有历史性突破的项目,书中有很多的介绍,Google的环境让吴博士更加优秀。书中提及的他的Partner都是个个性格分明且都有很好且值得我学习的优点。羡慕不来的。吴博士把这些他觉得值得后人学习的好的品质在书中传达,真的让我肃然起敬。分享知识,传道授业解惑是他唯一的目的。读书笔记我会在文章最后给大家分享。下面我就从我的角度来给大家介绍下吴博士眼中的这些拥有高尚品质的人及他们的优秀的习惯。

Google AK-47的设计者:阿米特·辛格

吴博士认为,在计算机科学领域,一个好的算法应该像AK-47冲锋枪那样:简单、有效、可靠性好而且容易读懂(或者说易操作),而不应该是故弄玄虚。Google Fellow、美国工程院院士阿米特· 辛格博士(Amit Singha!)就是Google AK-47的设计者,在公司内部,Google的排序算法Ascorer里面的A便是他的名字首字母。
吴博士是Google唯一一个学自然语言处理的中国人,而当时的中日韩搜索结果相比英文又很“烂”, 这件事便落到了我的头上。有了上次的经验,他这次也干脆直接用了一 个“简单”的方案。这个方法效果虽然很好,但是占用内存较多,当然 Google的服务器数昼还没有现在这么多,不可能为了中日韩这三个占总 流童不到10%的语言额外增加一批服务器。辛格提出用一个拟合函数替 代很耗内存的语言模型,这样不需要增加任何服务器。但是,这样一来 搜索质量的提高幅度只有原来采用大模型时的80%。他对此多少有点不甘心。辛格解释说,这样可以让他们至少早两个月将这个新算法提供给 中国的用户,他们的用户体验将比现在有质的提高,这是雪中送炭。他们暂时放弃掉的20%收益,对他们来讲是锦上添花的事。吴博士接受了他的建议,在2003年初吴博士发布了第一个专门为中日韩语言设计的搜索算法。 一年后,Google的服务器数量也有所增加。吴博士生在模型压缩上也有了进步, 这时便发布了完整的中日韩语言搜索算法。辛格这种做事情的哲学,即 先帮助用户解决80%的问题,再慢慢解决剩下的20%问题,是在工业界 成功的秘诀之一。许多失败并不是因为人不优秀,而是做事情的方法不对, 一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。
辛格非常鼓励年轻人要不怕失败,大胆尝试。有一次,一位刚毕业不久 的工程师因为把带有错误的程序推出到Google的服务器上而惶惶不可终 日。辛格安慰她说,你知道,我在Google犯的最大一次错误是曾经将所 有网页的相关性得分全部变成了零,于是所有搜索的结果全部是随机的 了。这位工程师后来为Google开发了很多好产品。

弗里德里克· 贾里尼克和现代语言处理

弗里德里克· 贾里尼克(Frederek Jelinek, 我们称他弗莱德)出生千捷 克克拉德诺(Kladno) 2一个富有的犹太家庭,他的父亲是一位牙科医生。 承袭了犹太民族的传统,弗莱德的父母从小就很注意他的教育,并且打 算送他去英国的公学(私立学校)读书0为了教他学好德语,还专门请 了一位德国的家庭女教师。但是第二次世界大战完全打碎了他们的梦想。 他们先是被从家中赶了出去,流浪到布拉格。他的父亲死在了集中营, 弗莱德自己成天在街上玩耍,完全荒废了学业。二战后,当弗莱德再度回到学校时,他不仅要从小学补起,而且成绩一塌糊涂,全部是D, 但是很快他就赶上了班上的同学。不过,他在小学时从来没有得过A。
后面因为家庭原因,弗里德里克· 贾里尼克的学业受到耽误。但是他也在自己成才的道理上遇到了很多伯乐,这可能也是后面他成才的一部分原因。
每当弗莱德和我谈起我们各自少年时的教育,我们都同意这样几个观点。

  • 首先,小学生和中学生其实没有必要花那么多时间读书,而他们的社会 经验、生活能力以及在那时树立起的志向将帮助他们的一生。
  • 第二,中学阶段花很多时间比同伴多读的课程,在大学以后用非常短的时间就可以读完,因为在大学阶段,人的理解力要强得多。举个例子,在中学需 要花500小时才能学会的内容,在大学可能花100小时就够了。因此, 一个学生在中小学阶段建立的那一点点优势在大学很快就会丧失殆尽。
  • 第三,学习(和教育)是一个人一辈子的过程,很多中学成绩好的亚裔 学生进人名校后表现明显不如那些因为兴趣而读书的美国同伴,因为前者不断读书的动力不足。
  • 第四,书本的内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。(因此,少年班的做法不足取。) 现在中国的好学校里,恐怕百分之九十九的孩子在读书上花的时间比我 当时要多,更比贾里尼克要多得多,但是这些孩子今天可能有百分之九十九在学术上的建树不如我,更不如贾里尼克。这实在是教育的误区。
    贾里尼克教授桃李满天下,这里面包括他的学生、过去的下属以及在学术界众多沿袭他的研究方法的晚辈,比如Google研究院的院长诺威格 (Peter Norvig)和费尔南多· 皮耶尔(Fernando Pereira) , 这些人分布在世界上主要的大学和公司的研究所,渐渐地形成了一个学派。而贾里尼克是这个学派的精神领袖。

    自然语言处理的教父马库斯和他的优秀弟子们

    桃李不言,下自成蹊?

    马库斯对这些领域数据的贡献可以说是独一无二的。当然,凭借 对数据的贡献,还不足以让马库斯获得教父的地位。马库斯有点像日本围棋领域的, 他的影响力很大程度上是靠他的弟子传播出去的。
    给予他的博士生研究自己感兴趣的课题的自由,这是他之所以桃李满天下的原因。马库斯的博士生研究的题目覆盖了自然语言处理的很多领域, 而且题目之间儿乎没有相关性,因为这些题目大多是博士生自己找的,而不是马库斯指定的。他的做法和中国大部分博士生导师完全不同。马库斯对几乎所有的自然语言处理领域都有独到的见解,马库斯让博士生提 出自己有兴趣的课题,或者用他巳有的经费支持学生,或者去为他们的项目申请经费。马库斯高屋建领,能够很快地判断一个研究方向是否正 确,省去了博士生很多做无诮尝试(Try-And-Error)的时间。因此他的博士毕业生素质都非常高,而且有些很快就拿到了博士学位。

真正的牛人——深奥的道理平民可理解化

对吴军博士这次写作帮助最大的是两本书和一个节目。他在初中时读了《从1到无穷大》,介绍宇宙的科普读物。作者G· 伽莫夫(George Gamow) 是美籍俄裔著名物理学家,他花了很多时间创作科普读物,影响了一代人。第二本书是物理学家霍金的《时间简史》,霍金把深奥的宇宙学原 理用最简单的语言讲出来,让这部科普读物称为全球的畅销书。影响我 的一个节目是美国主持人摩根· 弗里曼的“穿越虫洞”。我的写作大多是在飞机上完成的,写作累了便看石电视节目,一次碰巧找到“穿越虫洞” 这个节目。弗里曼把当今最前沿的物理学做成了用每个人都能懂的节目。节目中有包括很多诺贝尔奖在内的一流物理学家和数学家介绍他们的工作,这些人有一个共同的本领,就是把他们自己领域最深奥的道理用很简单的比喻介绍清楚我想这可能是他们成为世界顶级科学家的原因,他们一方面对自己的领域非常精通,同时他们能把道理讲清楚。世界上最好的学者总是可以深人浅出把大道理讲给外行听,而不是故弄玄虚 把简单的问题复杂化
因此,在写这本书的时候,他一直以霍金、伽莫夫为榜样,力图将数学之美展现给所有的,而不仅仅是专业的读者。为 了方便读者利用茶前饭后的时间阅读,他尽可能地做到每一章之间相对 独立自成一体,这样读起来不会太累,我知道让大部分读者从头到尾读 一本以数学为主的书是几乎不可能的。

思维导图分享

下载链接
密码: msmn

欢迎大家关注:huazi's微信公众号