512页的深度学习宝典,专门把“神经网络为什么有效、什么时候用、怎么避开陷阱”这几个大问题说得特别透彻。作者Charu C. Aggarwal把IBM沃森研究中心的一线经验全都写进了书里,不再只是让人看不懂的学术论文,而是可以真正拿来用、反复用的工具箱。 这本书值得花时间看,它把经典的SVM、PCA这些理论跟最新的AlphaGo Zero这些进展并排放在一起,读者一眼就能看明白“为什么深度学习成了万能钥匙”。更难得的是,它给了50多个真实案例,涉及推荐系统、翻译、图像分类还有强化学习这些不同的场景。读完之后,你就知道怎么把算法跟实际业务的难点对上号了。 书分成了三大块,看的时候不容易迷路。前面两章是用数学语言把SVM、LR、SVD这些老模型翻译成神经网络的样子,一下子就把入门的门槛给降下来了。同时也把word2vec这种特征工程的方法拉到同一张图里讲,“词向量”这种东西一下子就不那么神秘了。 接下来的两章专门解析训练过程和正规化的问题,解释梯度消失爆炸、过拟合欠拟合这些现象,还给出了正则化、dropout、批量归一化这些实用的解决办法。再后面两章用RBF网络和受限玻尔兹曼机带着大家预热深度模型的概念,为后面讲卷积神经网络和循环神经网络做好准备。 最后两章把卷积神经网络(CNN)、循环神经网络(RNN)和生成对抗网络(GAN)这些前沿技术一网打尽。它把CNN处理空间维度的特点、RNN处理时间维度的特点讲得特别形象;还把强化学习、生成对抗网络这些方法讲成了能直接用在项目里的框架。 不管是研究生、搞科研的还是从业者,这本书都能用得上。随书附赠的练习和解决方案手册特别全;每一章最后都有“应用视角”,用实际的业务案例告诉大家这一章讲的技术到底能解决什么实际问题。 一句话总结:谁想系统提升自己的深度学习水平,谁就应该把这本书放在书架上好好看。