Skip to content
thzt edited this page Sep 25, 2015 · 1 revision

Book Information

Review by [thzt]

  • Rank: ★★
  • Hard: ★★★
  • Tag: 统计学习,模型,策略,算法,监督学习,分类问题
  • Reviews:

本书是一本数学书,

是在知乎上,某位大神与《集体智慧编程》一同推荐的,

可以作为上一本书的理论基础。


本书开篇,学术味道很纯正,

使用了严谨的态度描述统计学习这个庞大主题,

提出了统计学习的三要素,模型+策略+算法。


主要思路如下,首先对问题建模,

然后使用一定的策略选取最优模型,

最后转换为一个步骤性的算法问题。


按照这个套路,

可以对各种杂乱的方法进行统一,

时刻知道自己当前处在哪个维度。


本书区分了监督学习,非监督学习,半监督学习,强化学习。

区分了生成模型,判别模型。

区分了分类问题,标注问题,回归问题。

给人一种清晰透彻的感觉。


随后的每一章,分别介绍一种统计学习方法,

感知机,k近邻法,朴素贝叶斯法,

决策树,逻辑斯谛回归与最大熵模型,

支持向量机,提升方法,EM算法,

隐马尔可夫模型,条件随机场。


它们各自都有适用的场景,

逐一进行数学化的论证和推导,

介绍每一个方法的由来和局限性。


不足之处可能在于,

本来数学书的可读性就远不如它的参考性,

有些人可能对数学不太感兴趣,

很多严格的推导我也没有跟进,

只是看了一下思路和结果。


总体看来,

本书可以看做一个200多页的数学基础附录,

随时阅读,查漏补缺。


机器学习领域,真是博大精深,

稍微深入下去,可能又要度过十年时间了。

Clone this wiki locally