【机器学习与深度学习理论要点】11.什么是L1、L2正则化？

机器学习中几乎都可以看到损失函数后面会添加一个额外项，常用的额外项一般有两种，一般英文称作 L1-norm 和L2-norm，中文称作 L1正则化和 L2正则化，或者 L1范数和 L2范数。L1正则化和L2正则化可以看做是损失函数的惩罚项，所谓"惩罚"是指对损失函数中的某些参数做一些限制。范数的表达式为：

∣

(

∑

∣

)

||x||_p=(\sum|x_i|^p)^{\frac{1}{p}}

∣∣x∣∣p=(∑∣xi∣p)p1
当p=1时，是L1范数，其表示某个向量中所有元素绝对值的和

当p=2时，是L2范数，表示某个向量中所有元素平方和再开根，也就是欧几里得距离公式

正则化通过降低模型的复杂性，达到避免过拟合的问题，原因是：

（1）加入正则能抑制系数过大的问题。

（2）从贝叶斯的角度来分析，正则化是为模型参数估计增加一个先验知识，先验知识会引导损失函数最小值过程朝着约束方向迭代。

【机器学习与深度学习理论要点】11.什么是L1、L2正则化？的相关教程结束。

《【机器学习与深度学习理论要点】11.什么是L1、L2正则化？.doc》

下载本文的Word格式文档，以方便收藏与打印。

【机器学习与深度学习理论要点】11.什么是L1、L2正则化？

【机器学习与深度学习理论要点】11.什么是L1、L2正则化？的相关教程结束。

相关推荐

js 关于 replace 取值、替换第几个匹配项（两种方式：正则、普通字符串操作）

深度优先搜索（DFS）和广度优先搜索（BFS）

深度优先搜索（DFS）与广度优先搜索（BFS）的Java实现

深度优先搜索DFS和广度优先搜索BFS简单解析（新手向）

Leetcode之深度+广度优先搜索（DFS+BFS）专题-934. 最短的桥（Shortest Bridge）

深度优先搜索DFS和广度优先搜索BFS简单解析

深度学习-05(tensorflow模型保存与加载、文件读取、图像分类：手写体识别、服饰识别)

深度解析SpringBoot内嵌Web容器