Lecture 4: Balance and Sequentiality in Bayesian Analyses#
首先来对目前所学进行简单的课程回顾,之前实际上有实质内容的课程大概是两节。在这两节课中,我们通过几个简单的例子,帮助大家建立了对贝叶斯方法的直觉。作为一门与统计学相关的课程,我们并没有一开始就让大家陷入复杂的公式计算,而是从一个非常简单的事例开始。
这个事例是心理学研究者们最近讨论的热门话题之一,即单个事件或单个研究,这种研究通常无法重复。接着我们引入先验概率和似然的概念。
先验概率: 是关于一个特定的心理学实验能否被重复的可能性。
似然: 新信息的引入,具体来说,就是关于文章语言的信息。
回顾 Bayes’ Rule#
在前面的课程中,我们讨论了贝叶斯模型在处理不同类型数据时的应用,包括单一事件、离散变量和连续变量。
现在我们对这些概念再次进行简要的回顾和总结:
知识点 |
内容描述 |
先验 |
似然 |
贝叶斯更新 |
---|---|---|---|---|
单个事件 |
一个使用特定语言风格的心理学实验被成功重复出来的可能性 |
OSC2015的结果 |
Psych sci 2024年的研究结果 |
可视化的方式 + 简单计算 |
离散变量 |
多次试验(多次进行重复实验)的成功率 |
人为分配的三种成功率(0.2, 0.5, 0.8)和它们出现的可能性 |
进行重复后的结果在三种成功率下出现的可能性 |
简单的手动计算 |
连续变量 |
多次试验(多次进行重复实验)的成功率/正确率 |
符合成功率/正确率(0~1)特点和先验经验的概率分布 |
进行重复后的结果在所有成功率/正确率下出现的可能性 |
已被证明的统计学公式 |
在第一个示例中,我们人为地将成功率设定为一个离散情况,分配了三种不同的成功率:0.2、0.5、0.8。同时,我们对每一种成功率出现的可能性进行了主观概率的分配。似然则是基于观察数据重复实验后的结果,它结合了数据和相应的概率。通过简单的手动运算,我们可以得到各种成功率的后验概率。先验概率是我们人为分配的,而通过计算,我们得到了后验概率。
在第二个示例中,我们处理的是一个人为设定为离散的变量。这是一个无法直接观测的概率,只能通过数据来推断。我们通过手动计算来确定这个概率。
🤔以上两节课我们学习到了什么?
贝叶斯更新本质上类似于数数,符合人类推理的直觉。
贝叶斯统计的主要作用在于将上述的直觉进行数学化,从而帮助我们在更复杂的情境中解决问题。
对于最简单的情况,我们可以通过数数来确定可能性。但对于更复杂的情况,手动计算变得困难。贝叶斯更新的思路是,看到数据后更新我们对事件的看法或信念,这符合人类的推理直觉。 贝叶斯更新的核心思想在于:当我们观察到新数据后,我们会更新对某个事件的看法或信念,这与人类日常推理的直觉相符合。在日常生活中,我们可能无意识地进行这样的推理,但贝叶斯统计将这种直觉数学化,使用数学和统计工具,包括编程,来解决更复杂的问题。
在之前的简单例子中,我们通过单个被试的数据来判断其在特定条件下判断方向的能力。然而,在真实的实验中,我们通常会有多个被试,每个被试可能在不同的时间点收集不同的数据,使得情境变得更加复杂。
🔍回顾:与心理学数据的结合——随机点运动任务(random dot task)
随机点运动任务要求被试判断运动点的移动方向(例如,向左还是向右)。
根据正确率的数据,可以使用心理物理曲线描述运动强度(点的一致性百分比)与决策正确率之间的关系。
![]() |
![]() |
一致性60% | 正确率与任务难度 |
Shooshtari, S. V., Sadrabadi, J. E., Azizi, Z., & Ebrahimpour, R. (2018). Confidence representation of perceptual decision by EEG and eye data in a random dot motion task. Neuroscience, 406, 510–527. https://doi.org/10.1016/j.neuroscience.2019.03.031
上一节课中,我们仅考虑了通过一名被试的数据来推断其方向判断的能力。
然而,在实际的实验中,我们通常会同时收集多个被试的数据,并希望通过这些数据来推断出被试的总体方向判断能力。
另一方面,上一节课仅考虑了一项研究的结果作为先验,不同研究之间的先验可能存在差异。
如下展示了不同被试在随机点任务中的正确率:
import pandas as pd
try:
data = pd.read_csv("/home/mw/input/bayes3797/evans2020JExpPsycholLearn_exp1_full_data.csv")
except:
data = pd.read_csv('data/evans2020JExpPsycholLearn_exp1_full_data.csv')
print("被试数量:", len(data.subject.unique()))
data.groupby(["subject"])[["correct"]].mean().head(10)
本节课的主要目标是加深两个关键的贝叶斯直觉:
数据对后验的影响:我们希望强调,不同的数据会导致不同的后验信念。后验信念是我们在收集数据后更新的信念,它反映了数据对我们原有信念的影响。
先验对后验的影响:我们同样希望强调,不同的先验信念会导致不同的后验信念。先验信念是我们在收集数据前对某一事件的信念。