Skip to content

Commit 960e5a7

Browse files
committed
add ch01-03
1 parent 8ce791e commit 960e5a7

File tree

10 files changed

+3536
-9
lines changed

10 files changed

+3536
-9
lines changed

_config.yml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
# Site settings
2-
title: 机器学习训练秘籍
2+
title: 机器学习要领
33
44
description: >
55
Machine Learning Yearning 中文译稿,

_data/docs.yml

Lines changed: 45 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -19,27 +19,71 @@
1919

2020
- title: Basic Error Analysis
2121
docs:
22+
- ch13
23+
- ch14
24+
- ch15
25+
- ch16
26+
- ch17
27+
- ch18
28+
- ch19
2229

2330
- title: Bias and Variance
2431
docs:
32+
- ch20
33+
- ch21
34+
- ch22
35+
- ch23
36+
- ch24
37+
- ch25
38+
- ch26
39+
- ch27
2540

2641
- title: Learning curves
2742
docs:
43+
- ch28
44+
- ch29
45+
- ch30
46+
- ch31
47+
- ch32
2848

2949
- title: Comparing to human-level performance
3050
docs:
51+
- ch33
52+
- ch34
53+
- ch35
3154

3255
- title: Training and testing on different distributions
3356
docs:
57+
- ch36
58+
- ch37
59+
- ch38
60+
- ch39
61+
- ch40
62+
- ch41
63+
- ch42
64+
- ch43
3465

3566
- title: Debugging inference algorithms
3667
docs:
68+
- ch44
69+
- ch45
70+
- ch46
3771

3872
- title: End-to-end deep learning
3973
docs:
74+
- ch47
75+
- ch48
76+
- ch49
77+
- ch50
78+
- ch51
4079

4180
- title: Error analysis by parts
4281
docs:
82+
- ch52
83+
- ch53
4384

4485
- title: Conclusion
45-
docs:
86+
docs:
87+
- ch54
88+
- ch55
89+
- ch56

_docs/ch01.md

Lines changed: 28 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,28 @@
1+
---
2+
title: 为什么需要机器学习策略
3+
permalink: /docs/ch01/
4+
---
5+
6+
**机器学习(machine learning)**已然成为无数重要应用的基石,如今你在网络搜索、垃圾邮件检测、语音识别以及产品推荐等领域都能够发现它的身影。假设你或者你的团队正在研发一项机器学习应用并且想要取得较快的进展,这本书将会是你的得力助手。
7+
8+
<center>
9+
<div class="well well-lg">
10+
案例:建立猫咪图片初创公司
11+
</div>
12+
</center>
13+
14+
想象一下,你正在建立一家初创公司,这家公司可以为猫咪爱好者们提供不计其数的猫咪图片。同时你决定应用**神经网络(neural network)**技术来构建一套计算机视觉系统,通过该系统来识别图片中的猫。
15+
16+
<img src="{{ site.url }}{{ site.baseurl }}/img/ch01_cats.jpg">
17+
18+
对此团队提出了许多的改进方案:
19+
20+
- 获取更多的数据,即收集更多猫的图片
21+
- 收集更加多样化的训练数据集,比如处于不常见位置的猫的图片,颜色奇异的猫的图片,以及使用不同相机参数拍摄的猫的图片
22+
- 通过增加梯度下降的迭代次数,使算法训练得久一些
23+
- 尝试一个拥有更多层/更多隐藏元/更多参数的,规模更大的神经网络
24+
- 尝试加入正则化(例如 L2 正则化)
25+
- 改变神经网络的架构(激活函数,隐藏元数量等等)
26+
- ...
27+
28+
在上面众多的方向中,如果你选择正确,就将建立起一个处于领先地位的猫咪图片识别平台,并带领你的公司获得成功。但如果你选择了一个糟糕的方向,则可能因此浪费掉几个月甚至数年的开发时间。

_docs/ch02.md

Lines changed: 10 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,10 @@
1+
---
2+
title: 如何使用此书来帮助你的团队
3+
permalink: /docs/ch02/
4+
---
5+
6+
完成本书的阅读后,你将进一步理解如何在机器学习项目中设定一个技术方向,但你的团队成员可能不理解你为何要推荐一个特定的方向。情况可能像这样,你希望你的团队定义一个单值评估指标,但他们并不赞成你的观点,此时你将如何说服他们?
7+
8+
这正是我决定缩短章节篇幅的原因——这样你就能够将它们打印出来,并在需要之时让你的团队成员选择性地阅读其中的 1 至 2 页。
9+
10+
优先级的稍加改变会对团队的生产力产生巨大的影响,我希望你能帮助团队做出一些有效的改变,从而成为团队里的超级英雄!

_docs/ch03.md

Lines changed: 17 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,17 @@
1+
---
2+
title: 先修知识与符号说明
3+
permalink: /docs/ch03/
4+
---
5+
6+
如果你有学习过机器学习课程(例如我在 Coursera 开设的机器学习 MOOC),或者有监督学习的应用经验,则应当能够理解下面的文字。
7+
8+
**监督学习(supervised learning)**是指使用标记好(labeled)的训练样本
9+
10+
$$ (x,y) $$
11+
12+
来学习一个从 $ x $ 映射到 $ y $ 的函数。监督学习算法主要包括线性回归(linear regression)、对数几率回归(logistic regression,又译作逻辑回归)和神经网络(neural network)。虽然机器学习的形式有许多种,但当前具备实用价值的大部分机器学习算法都来自于监督学习。
13+
14+
我将经常提及神经网络(和“深度学习”中所提到的一致),但你只需对此有基础的了解就可以阅读后面的内容。
15+
16+
如果对上文提到的一些概念你还不是很熟悉,可以在 Coursera 观看《机器学习》前三周的课程内容。(课程地址:http://ml-class.org)
17+

_docs/index.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
---
2-
title: 欢迎阅读机器学习训练秘籍
2+
title: 欢迎阅读《机器学习要领》
33
permalink: /docs/home/
44
redirect_from: /docs/index.html
55
---

_includes/js_files.html

Lines changed: 4 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,7 @@
11
<script>
2-
var baseurl = '{{ site.baseurl }}'
2+
var baseurl = '{{ site.baseurl }}'
33
</script>
44
<script src="//code.jquery.com/jquery-1.10.2.min.js"></script>
5-
<script src="{{ "/js/bootstrap.min.js" | prepend: site.baseurl }} "></script>
6-
<script src="{{ "/js/typeahead.bundle.min.js" | prepend: site.baseurl }} "></script>
7-
8-
<script src="{{ "/js/main.js" | prepend: site.baseurl }} "></script>
5+
<script src="{{"/js/bootstrap.min.js " | prepend: site.baseurl }} "></script>
6+
<script src="{{"/js/typeahead.bundle.min.js " | prepend: site.baseurl }} "></script>
7+
<script src="{{"/js/main.js " | prepend: site.baseurl }} "></script>

img/ch01_cats.jpg

205 KB
Loading

index.html

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -32,7 +32,7 @@ <h2 class="header-light regular-pad">关于这本书</h2>
3232
<div class="col-sm-3">
3333
<h1 class="text-center"><i class="fa fa-code-fork" aria-hidden="true"></i></h1>
3434
<h3 class="text-center">加入翻译队伍</h3>
35-
<p>本书目前仍为样稿,Xiaowei Cao 已经获得中文翻译授权。为了使对应的中文内容尽快与大家见面,翻译时间仓促,部分内容难免有疏忽之处。大家可以通过右上角的 Github 图标进入仓库地址,提出一定的修改建议。</p>
35+
<p>本书目前仍为样稿,Accepted Doge 已经获得中文翻译授权。为了使对应的中文内容尽快与大家见面,翻译时间仓促,部分内容难免有疏忽之处。大家可以通过右上角的 Github 图标进入仓库地址,提出一定的修改建议。</p>
3636
</div>
3737
<div class="col-sm-3">
3838
<h1 class="text-center"><i class="fa fa-comments" aria-hidden="true"></i></h1>

0 commit comments

Comments
 (0)