概率论与统计学的关系是什么?

我们平时都将概率论和统计学合称为“概率统计”,但显然这两者是有关系,但不是同一的,那么二者的关系究竟是什么呢?
关注者
1,905
被浏览
519,118

60 个回答

来自于微博的一张图:


--------------- 我是分割线 --------------

Lary Wasserman 在 All of Statistics 的序言里有说过概率论和统计推断的区别,相对于上面的图,更加透彻:

The basic problem that we study in probability is:
Given a data generating process, what are the properities of the outcomes?
...
The basic problem of statistical inference is the inverse of probability:
Given the outcomes, what can we say about the process that generated the data?

概率论是统计推断的基础,在给定数据生成过程下观测、研究数据的性质;而统计推断则根据观测的数据,反向思考其数据生成过程。预测、分类、聚类、估计等,都是统计推断的特殊形式,强调对于数据生成过程的研究。

统计和概率是方法论上的区别,一个是推理,一个是归纳。

打个比方,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率。而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?(参数估计)能不能认为红球40%,白球60%?(假设检验)

而概率论中的许多定理与结论,如大数定理、中心极限定理等保证了统计推断的合理性。做统计推断一般都需要对那个黑箱子做各种各样的假设,这些假设都是概率模型,统计推断实际上就是在估计这些模型的参数。