作者: 引线小白-本文永久链接:httpss://www.limoncc.com/post/5afe722cdba3caacf42894f5bfd847d4/
知识共享许可协议: 本博客采用署名-非商业-禁止演绎4.0国际许可证
简介: 本文总结了狄利克雷-多项式模型的部分和我自己的一些体会,我们将再一次熟悉贝叶斯方法的基本概念、流程、特点。把我们思维进化到更高的维度。
摘要:本文意在狄利克雷-多项式模型的问题。若有错误,请大家指正。
关键词:狄利克雷-多项式模型
,分类分布
,狄利克雷分布
一、狄利克雷-多项式模型(dirichlet-multionmial model)
分类分布(Categorical distribution) 或者又叫1-C分布(multinoulli distribution)
其中
在这里有必要解释一下符号问题。首先分类分布是对0-1分布的推广,这句话可能不好理解。我们可以这样思考,0-1分布是抛硬币。而分类分布类似于掷骰子。为了让符号统一我们使用小写
变量
1、分类分布(multinoulli distribution)概率质量函数:
其中:
其他表示方法:
这个示性函数表示方法,有重要应用,降低表示维度,节约了有限的数学符号。
2、均值与方差
我们知道向量函数微分结果:
我们又知道特征函数:
于是可分析得到分类分布
其中:
3、似然函数(likelihood)
有数据集:
其中:
4、对数似然函数
5、求极大似然估计
分析可得
其中
6、多项式分布
我们定义
其中
我们有特征函数:
于是可得多项式分布的均值与协方差矩阵
7、共轭先验分布
把
我们知道狄利克雷分布
其中:
利用
为了方便使用,我们把它写成离散形式:
8、后验分布
我们用似然函数乘以狄利克雷先验得到后验分布:
1、在线学习
我们发现狄利克雷分布也具有再生性质,和在线性学习性质,我们假设,陆续观测到两个的数据集
1、当我们观察到
2、当我们观察到
易得:
2、后验分析
最大后验估计
极大似然估计:
后验均值:
后验均值是先验均值和最大似然估计的凸组合。知道
我们发现
同理可知最大后验估计是先验众数和最大似然估计的凸组合,而且更加倾向于最大似然估计,知道
3、 拉格朗日乘数法
首先为了让符号有意义我们定义向量点除运算
求解得:
知道:
写成离散形式有
4、后验协方差矩阵
当 N足够大时:
它随着我们数据的增加以
5、后验预测分布
开始分析之前,我们回忆一下B函数:
现在我们令下一次观测
所以可以看到,后验预测分布等价于
6、多试验后验预测
考虑这个问题,我们又观察到了
我们称
后验预测分布均值:
后验预测分布方差:
后验预测分布协方差:
后验预测分布协方差矩阵:
对于
比较大小容易证明:
所以
贝叶斯预测的概率密度更宽、拥有长尾,从而避免了过拟合和黑天鹅悖论。
7、数据集后验预测与边缘似然函数
有数据集
所以有:
9、评述
通过狄利克雷-多项式模型,我们从离散二维拓展到了离散多维。
1、上帝给
2、犹豫种种原因,人类也知晓了
3、人类的智者,选择了用概率来解决这个难题。并且动用了自己的经验和感觉,人类假设
4、上帝微微一笑, 人类继续开始征程:令
5、上帝开始感觉人类是个聪明的物种,甚为满意! 我们又观察到了 m个数据,那么发生
6、至此,由于
它随着我们数据的增加以
版权声明 | ![]() |
![]() | 由引线小白创作并维护的柠檬CC博客采用署名-非商业-禁止演绎4.0国际许可证。 本文首发于柠檬CC [ https://www.limoncc.com ] , 版权所有、侵权必究。 |
本文永久链接 | httpss://www.limoncc.com/post/5afe722cdba3caacf42894f5bfd847d4/ |
如果您需要引用本文,请参考: |
引线小白. (Mar. 8, 2017). 《狄利克雷-多项式模型(Dirichlet-Multionmial Model)》[Blog post]. Retrieved from https://www.limoncc.com/post/5afe722cdba3caacf42894f5bfd847d4 |
@online{limoncc-5afe722cdba3caacf42894f5bfd847d4, title={狄利克雷-多项式模型(Dirichlet-Multionmial Model)}, author={引线小白}, year={2017}, month={Mar}, date={8}, url={\url{https://www.limoncc.com/post/5afe722cdba3caacf42894f5bfd847d4}}, } |