作者: 引线小白-本文永久链接:httpss://www.limoncc.com/post/baeffd0a1d876b77/
知识共享许可协议: 本博客采用署名-非商业-禁止演绎4.0国际许可证
一、EM算法
1.1、问题表述
考虑独立同分布数据集
1.2、痛点问题:对数里求和的复杂性
对于不完全数据集,也就是我们观测到的数据集的对数似然函数
1.3、完全数据集求解的简单性
隐变量加入后:求解
1.4、隐变量后验分布与数据点性质
混合模型中,我们会定义隐变量的后验分布:
【数据点对数密度分解引理】
不完全数据点对数密度可以被分解。
它的分解是
1、隐变量后验分布下,完全数据点对数密度期望
2、隐变量后验似然函数分布的交叉熵
证明:
然后针对一个后验分布
于是有:
这一结论是EM算法中隐变量基本变换技巧,起着至关重要的作用。
1.5、隐变量的若干符号
为简洁记,我们定义一下符号,这些符号的定义有助于我们清晰理解EM算法是如何工作的。
也就是说隐变量后验分布可以通过参数
1.6、不完全数据集对数似然函数等价变换
【不完全数据集对数似然函数等价变换引理】
不完全数据集对数似然函数可以被分解。
1、隐变量后验分布下,完全数据集对数似然函数的期望
2、隐变量后验似然函数分布的交叉熵
证明:我们参考【数据点对数密度分解引理】和隐变量符号有:
针对隐变量数据集的一个新后验分布
于是有:
注意,我们使用了乘法公式、熵的性质从而我们把数据点的规律,上升到数据集。这说明了独立同分布的可以分解性。
1.7、EM算法收敛定律
【EM算法收敛定律】
存在收敛参数,使得不完全数据集对数似然函数的最大化与完全数据集对数似然函数期望的最大化等价。
证明
1、下面我们引入一个辅助函数(auxiliary function):
同时有
2、下面我们将要构造出
令
通过迭代
这就证明了结论。
1.8、EM算法
我们总结前面的结论,写出EM算法。
算法:EM算法
1
2
3
4
#end while
二、评述
1、EM算法的关键在于引入隐变量,然后我们考察它的先验、后验和完全数据集分布,于是我们得到: 不完全数据集对数似然函数等价变换:
版权声明 | ![]() |
![]() | 由引线小白创作并维护的柠檬CC博客采用署名-非商业-禁止演绎4.0国际许可证。 本文首发于柠檬CC [ https://www.limoncc.com ] , 版权所有、侵权必究。 |
本文永久链接 | httpss://www.limoncc.com/post/baeffd0a1d876b77/ |
如果您需要引用本文,请参考: |
引线小白. (Mar. 13, 2017). 《EM算法和混合模型一:EM算法》[Blog post]. Retrieved from https://www.limoncc.com/post/baeffd0a1d876b77 |
@online{limoncc-baeffd0a1d876b77, title={EM算法和混合模型一:EM算法}, author={引线小白}, year={2017}, month={Mar}, date={13}, url={\url{https://www.limoncc.com/post/baeffd0a1d876b77}}, } |