0x01 广告

经过一年多的努力,我的书 《分布式机器学习——系统、工程与实战》终于上架了,在这里打个广告。

新书出版:《分布式机器学习——系统、工程与实战》

item.jd.com/10079265638…

product.dangdang.com/29594628.ht…

接下来是一些碎碎念。

0x02 感谢

在此书(包括博客)的写作过程之中,我参阅了很多的论文,博客和视频,在此,对这些作者再次表明深深的感谢。经常阅览我博客的朋友应该知道,我在每篇文章之后都会列出很多参阅链接。可是,出书社的规定是:书本中不能出现任何的网址。因而我只能把这些参阅链接提供给出书社,由出书社用网页方式出现。还请咱们了解。

0x03 痛苦

写书的难度和痛苦远远超过了我的预期。出书书是一个极端复杂的系统工程,没有阅历的人很难体会。比方,为了把文字从markdown迁移到word,并且根据修正的要求进行排版,我专门写了一个程序进行相关处理。又比方,技能人员和文字修正或许关于同一段文字的了解会完全不同。技能人员会觉得这段文字很正常很通畅,可是从文字修正的角度看,则会有很大问题,而修正的定见无疑是正确的。因而技能人员需求根据修正的定见对文字进行整改。本书就前后阅历了许多次大修正,这关于作者和修正(们)都是一项极端繁杂的作业,再次感谢我的责任修正黄爱萍在本书出书过程中给我的帮助。

0x04 惋惜

关于本书,还有不少惋惜,比方:

本书没能早点问世

由于去年疫情的原因,修正的作业受到很大影响,导致本书最少推迟几个月才能问世。

许多内容未能录入

我总共写了130多篇分布式机器学习方面的博客。我把这130多篇博客都进行了收拾,制作了许多新图,也添加了不少内容,许多行文、逻辑都做了调整和修正,总共收拾了将近两千页word文档。然而最终在和修正讨论之后,只从中选择了600页放入书中。这导致许多博客内容未能在书本之中表现,比方数据加载,弹性练习,通信优化,HugeCTR,Alink,深度学习和大数据结合等部分都没有表现。

0x05 论文

我在书和博客之中会对一些论文进行翻译解读,为什么要这样做?这是由于面对一个新领域,个人的定见是按照“论文→文档→用户手册→注释→源码”这个顺序来学习。为什么按照这个顺序?由于这个顺序的优势是:

从抽象逻辑(或者说系统架构)到具体细节。

  • 论文是作者的思想被提炼并进行逻辑化、系统化的结果,文档次之,而且重读经典论文,收获是多维度的。

  • 文档和手册会从运用或者注意点方面帮你完成对这个结构全体的认识。在深化了解结构功用的基础上,再带着实际问题在源码中求解,才会深刻了解结构的设计思路和理念。

  • 注释和源码则出现了很多的细节。由于技能文档往往不全,所以只能从源码来逆向反推设计。

从人的思想到机器的思想。

  • 注释是作者给阅览者看的,代码是作者给机器看的。

  • 注释会告诉你为什么这样完成(Why),代码告诉你怎样完成(How)。

关于咱们来说,应该首先寻求一种思想的改动(运用别的一种不同的方式来思考问题),和已有常识系统的更新与收拾(打破原有条条框框来建立一个更大的结构),然后才是用代码来分析验证(究竟纸上得来终觉浅)。当然,许多时分咱们只有源码,那么就只能从源码中根据细节来探寻,重建论文作者的思路,提炼其精华,争夺和作者达到一个跨越空间和时间的震动和共识。共识越多,你就越接近论文作者。

0x06 办法

有的同学问我为什么可以研讨这么多内容,有什么好的研讨办法。其实我也没有很好的学习办法,或许由于我比较喜欢钻研技能,假如某一个技能点没有想明白,我就会环绕这个点进行深化挖掘,而往往为了弄明白一个常识点,就会研讨其他相关常识点,这样从一个点很简单延申到一条线,进而扩展到一个面,最终构成一张网,就构建了自己的一个小小的常识系统。

0x07 展望

过去的一年实在太忙了,换了新城市新公司,咱们一同从无到有构建一个新产品,几乎没有自己的时间,而仅有的闲暇时间都用来收拾书本。导致有几篇一年前写的文稿都没有收拾。期望在接下来的日子中,可以有时间把这些文稿收拾出来发布。也期望可以有时间研讨一些新东西,最重要的是,期望咱们产品可以大卖。

良久没有发布博客,忽然发现,这几个网站的后台都不会运用了……