无需数学知识:快速了博狗注册解马尔可夫链蒙特卡洛方法

2018-01-11 01:00

对于大多数朋友而言,贝叶斯(Bayesian)统计就像是一种魔法甚至是巫术,当然也有人将其视为一种完全主观的废话。而在贝叶斯方法家族当中,马尔可夫链蒙特卡洛方法(Markov chain Monte Carlo methods)显得尤为神秘。虽然其中确实涉及大量数学知识且需要昂贵的计算资源,但与数据科学领域的众多其它方法一样,其中的基本推理过程同样可以通过非常直观的方式进行归纳。而这正是本文的核心主旨所在。

那么,马尔可夫链蒙特卡洛方法(Markov chain Monte Carlo,简称MCMC)究竟是什么?简而言之:

MCMC.方法用于通过在概率空间中进行随机采样以近似地得出某一感兴趣参数的后验分布。

在本文当中,我将对这句简单的答案进行深入分析——而且不用担心,不涉及任何数学知识。

首先需要讲解一些术语。其中提到的感兴趣参数为用于总结我们所关注的某些现象的相关数字。一般来说,我们会利用统计方法估计此类参数。举例来说,如果我们希望了解成年人的身高水平,那么感兴趣参数很可能是以英寸为单位的平均身高数字。分布代表的则是该参数每个可能值的数学表达以及我们观察到各个数值的具体概率。其中最著名的当数贝尔(钟形)曲线:

无需数学知识:快速了解马尔可夫链蒙特卡洛方法

在贝叶斯统计方法当中,分布概念还拥有另一项额外解释。贝叶斯不仅仅代表参数的数值,同时亦用于表现每项参数的真实值大小——更具体地讲,贝叶斯可以被理解为我们对于某一参数的确定度。因此,以上贝尔曲线表明我们能够基本确定参数的实际值非常接近于零,但我们认为其真实值高于或者低于此值的可能是相等的。

事实上,人体身高确实遵循一条正常曲线,因此假设我们认定人体平均身高的真实值遵循以下贝尔曲线:

无需数学知识:快速了解马尔可夫链蒙特卡洛方法

很明显,以上图表所示的结果只可能来源于“巨人族群”——因为可以看到,大多数平均成年人身高为6英尺2英寸(不过其对结果并不是非常确定)。

下面让我们假想这位统计者收集到一批新的数据,其中出现了一部分身高在5英尺到6英尺之间的成年人。我们可以使用以下数据表达这种情况,由此得出的正常曲线能够对这一平均身高数据作出最佳解释:

无需数学知识:快速了解马尔可夫链蒙特卡洛方法

在贝叶斯统计当中,对于参数的确定度分布被称为先验分布,因为其会在获取任何实际数据之前首先捕捉到我们的确定度水平。似然分布则总结了观测数据所提供的结论,即通过将参数值范围同单项参数相结合以解释我们当前所观察数据的概率。对似然分布的参数值进行最大化估计,能够回答这样一个问题:哪些参数值决定了我们观察到当前数据的概率。如果缺少这种先验概率,我们将无法进一步作出分析。

不过贝叶斯分析的核心,在于将先验分布与似然分布相结合以确定后验分布。配合先验概率,后验分布能够告诉我们哪些参数值能够最大程度提升我们观察到特定数据的概率。在我们的示例中,得出的后验分布结果如下所示:

无需数学知识:快速了解马尔可夫链蒙特卡洛方法

如上图所示,红色曲线表示后验分布。大家可以将其视为一种先验与可能性的分布平均值。由于先验分布较短且更为分散,因此其代表着一种关于平均人体身高真实值的“不太确定”的预判。与此同时,概率会在相对较窄的范围内进行数据汇总,因此其代表着对真实参数值的“更加确定”的猜测。

当先验概率被合并进来后,该数据(表达为概率)成为假设个体在巨人族群内成长这一弱先验分布结论的主体。尽管统计者仍然认为人类的平均身高比其实际获得的数据略高一些,但其仍更相信实际数据所表达出的结果。

在拥有两条贝尔曲线的情况下,我们能够轻松解出后验分布——使用一条简单的方程式即可轻松将二者结合起来。但如果我们的先验分布与概率分布结果不够理想,又该如何?有时候,利用形状不规律的分布进行数据或者先验概率建模能够带来更准确的结果。如果我们的概率结果需要使用一项包含两个峰值的分布才能确切表达,而且出于某种原因我们需要解释一些非常古怪的先验分布结论,又该如何处理?下面,我以手工方式绘制了一条粗糙的先验分布曲线:

无需数学知识:快速了解马尔可夫链蒙特卡洛方法


上一篇:人工智能与深度学习技术博狗注册16大回顾,承包你一年的知识点
下一篇:假日"游四方"选银博狗娱乐联手机支付轻松走起
扩展阅读
问题来了,人“没”博狗
问题来了,人“没”博狗

固然你没几多钱,也买不起房,买不起车,更养不起娃。可是你必然思考过这样的问题:我假如不小心挂了,付出宝和微信零钱包里平时买煎饼果子省下的那一个亿可怎么办,家里人...点击了解…

不但微信,付出宝也将提
不但微信,付出宝也将提

继微信3月开始收取提现手续费后,付出宝方才宣布通告暗示,因综合策划本钱上升,自2016年10月12日起,付出宝将对小我私家用户超出免费额度的提现收取0.1%的处事费,小我私家用户每人累计...点击了解…