Lecture 4: Balance and Sequentiality in Bayesian Analyses

Lecture 4: Balance and Sequentiality in Bayesian Analyses#

  首先来对目前所学进行简单的课程回顾,之前实际上有实质内容的课程大概是两节。在这两节课中,我们通过几个简单的例子,帮助大家建立了对贝叶斯方法的直觉。作为一门与统计学相关的课程,我们并没有一开始就让大家陷入复杂的公式计算,而是从一个非常简单的事例开始。

  这个事例是心理学研究者们最近讨论的热门话题之一,即单个事件或单个研究,这种研究通常无法重复。接着我们引入先验概率和似然的概念。

先验概率: 是关于一个特定的心理学实验能否被重复的可能性。

似然: 新信息的引入,具体来说,就是关于文章语言的信息。

回顾 Bayes’ Rule#

  在前面的课程中,我们讨论了贝叶斯模型在处理不同类型数据时的应用,包括单一事件、离散变量和连续变量。

  • 现在我们对这些概念再次进行简要的回顾和总结:

知识点

内容描述

先验

似然

贝叶斯更新

单个事件

一个使用特定语言风格的心理学实验被成功重复出来的可能性

OSC2015的结果

Psych sci 2024年的研究结果

可视化的方式 + 简单计算

离散变量

多次试验(多次进行重复实验)的成功率

人为分配的三种成功率(0.2, 0.5, 0.8)和它们出现的可能性

进行重复后的结果在三种成功率下出现的可能性

简单的手动计算

连续变量

多次试验(多次进行重复实验)的成功率/正确率

符合成功率/正确率(0~1)特点和先验经验的概率分布

进行重复后的结果在所有成功率/正确率下出现的可能性

已被证明的统计学公式

  • 第一个示例中,我们人为地将成功率设定为一个离散情况,分配了三种不同的成功率:0.2、0.5、0.8。同时,我们对每一种成功率出现的可能性进行了主观概率的分配。似然则是基于观察数据重复实验后的结果,它结合了数据和相应的概率。通过简单的手动运算,我们可以得到各种成功率的后验概率。先验概率是我们人为分配的,而通过计算,我们得到了后验概率。

  • 第二个示例中,我们处理的是一个人为设定为离散的变量。这是一个无法直接观测的概率,只能通过数据来推断。我们通过手动计算来确定这个概率。

🤔以上两节课我们学习到了什么?

  1. 贝叶斯更新本质上类似于数数,符合人类推理的直觉。

  2. 贝叶斯统计的主要作用在于将上述的直觉进行数学化,从而帮助我们在更复杂的情境中解决问题。

对于最简单的情况,我们可以通过数数来确定可能性。但对于更复杂的情况,手动计算变得困难。贝叶斯更新的思路是,看到数据后更新我们对事件的看法或信念,这符合人类的推理直觉。 贝叶斯更新的核心思想在于:当我们观察到新数据后,我们会更新对某个事件的看法或信念,这与人类日常推理的直觉相符合。在日常生活中,我们可能无意识地进行这样的推理,但贝叶斯统计将这种直觉数学化,使用数学和统计工具,包括编程,来解决更复杂的问题。

  在之前的简单例子中,我们通过单个被试的数据来判断其在特定条件下判断方向的能力。然而,在真实的实验中,我们通常会有多个被试,每个被试可能在不同的时间点收集不同的数据,使得情境变得更加复杂。

🔍回顾:与心理学数据的结合——随机点运动任务(random dot task)

  • 随机点运动任务要求被试判断运动点的移动方向(例如,向左还是向右)。

  • 根据正确率的数据,可以使用心理物理曲线描述运动强度(点的一致性百分比)与决策正确率之间的关系。

一致性60% 正确率与任务难度

Shooshtari, S. V., Sadrabadi, J. E., Azizi, Z., & Ebrahimpour, R. (2018). Confidence representation of perceptual decision by EEG and eye data in a random dot motion task. Neuroscience, 406, 510–527. https://doi.org/10.1016/j.neuroscience.2019.03.031

上一节课中,我们仅考虑了通过一名被试的数据来推断其方向判断的能力。

  • 然而,在实际的实验中,我们通常会同时收集多个被试的数据,并希望通过这些数据来推断出被试的总体方向判断能力。

  • 另一方面,上一节课仅考虑了一项研究的结果作为先验,不同研究之间的先验可能存在差异。

如下展示了不同被试在随机点任务中的正确率:

import pandas as pd

try:
  data = pd.read_csv("/home/mw/input/bayes3797/evans2020JExpPsycholLearn_exp1_full_data.csv")
except:
  data = pd.read_csv('data/evans2020JExpPsycholLearn_exp1_full_data.csv')

print("被试数量:", len(data.subject.unique()))
data.groupby(["subject"])[["correct"]].mean().head(10)

本节课的主要目标是加深两个关键的贝叶斯直觉:

数据对后验的影响:我们希望强调,不同的数据会导致不同的后验信念。后验信念是我们在收集数据后更新的信念,它反映了数据对我们原有信念的影响。

先验对后验的影响:我们同样希望强调,不同的先验信念会导致不同的后验信念。先验信念是我们在收集数据前对某一事件的信念。