本书从概率统计和编程两方面,由浅入深地指导读者如何对实际数据进行贝叶斯统计。全书分成三部分。第1部分为“基础篇:关于参数、概率、贝叶斯法则及R软件”;第2部分为“用于二元比例推断的基本理论”;第3部分为“广义线性模型的应用”.内容包括贝叶斯统计的基本理论、实验设计的有关知识、和以层次模型和马尔可夫链。蒙特卡罗方法(MCMC)为代表的复杂方法等;同时覆盖所有需要用到非贝叶斯方法的情况:t.检验、方差分析(ANOVA)和ANOVA中的多重比较法、多元线性回归、Logistic回归、序列回归和卡方(列联表)分析。针对不同的学习目标(如R、BUGS等)本书列出了相应的重点章节,整理出了贝叶斯统计中某些与传统统计学可做类比的内容,方便读者快速学习。
贝叶斯统计方法
R和BUGS软件数据分析示例
(影印版)
第1章 关于本书
1.1 目标读者
1.2 预备知识
1.3 本书结构
1.3.1 重点章节
1.3.2 与贝叶斯方法对应的传统检验方法
1.4 期待反馈
1.5 致谢
第1部分 基础篇:关于参数、概率、贝叶斯法则及R软件
第2章 我们所信的模型
2.1 观测模型与信念模型
2.1.1 先验信念与后验信念
2.2 统计推断的三个目标
2.2.1 参数估计
2.2.2 数值预测
2.2.3 模型比较
2.3 R编程基础
2.3.1 软件的获取和安装
2.3.2 激活R和命令行使用
2.3.3 应用实例
2.3.4 获取帮助
2.3.5 编程
2.4 练习
第3章 概率究竟是什么?
3.1 所有可能事件的集合
3.1.1 抛硬币实验
3.2 概率:意识内外
3.2.1 意识之外:长期相对频率
3.2.2 意识以内:主观信念
3.2.3 概率:量化可能性
3.3 概率分布
3.3.1 离散分布:概率质量
3.3.2 连续分布:密度初探
3.3.3 分布的均值与方差
3.3.4 反映信念不确定性的方差
3.3.5 最高密度区间(HDI)
3.4 双变量联合分布
3.4.1 边际概率
3.4.2 条件概率
3.4.3 独立事件
3.5 R代码
3.5.1图3.1的R代码
3.5.2 图3.3的R代码
3.6 练习
第4章 贝叶斯公式
4.1 贝叶斯公式简介
4.1.1 从条件概率的定义导出
4.1.2 受双因素表的启发
4.1.3 连续情形下的积分表达
4.2 在模型和数据中的应用
4.2.1 数据的顺序不变性
4.2.2一个例子:抛硬币
4.3 推断的三个目标
4.3.1 参数估计
4.3.2 数值预测
4.3.3 模型比较
4.3.4 为什么贝叶斯推断是困难的
4.3.5 贝叶斯推断在日常生活中的应用
4.4 R代码
4.4.1图4.1的R代码
4.5 练习
第2部分 用于二元比例推断的基本理论
第5章 二元比例推断的精确数学分析方法
5.1伯努利分布的似然函数
5.2贝塔分布简介
5.2.1先验贝塔分布
5.2.2后验贝塔分布
5.3推断的三个目标
5.3.1二元比例的估计
5.3.2预测数据
5.3.3模型比较
5.4总结:如何做贝叶斯推断
5.5R代码
5.5.1图5.2的R代码
5.6练习
第6章 二元比例推断的格点估计法
6.1θ取值离散时的贝叶斯准则
6.2连续先验密度的离散化
6.2.1离散化先验密度的例子
6.3估计
6.4序贯数据的预测
6.5模型比较
6.6总结
6.7R代码
6.7.1图6.2及类似图形的R代码
6.8练习
第7章 二元比例推断的Metropolis算法
7.1Metropolis算法的简单例子
7.1.1政治家巧遇Metropolis算法
7.1.2随机游走
7.1.3随机游走的性质
7.1.4为什么关注随机游走
7.1.5Metropolis算法是如何起作用的
7.2Metropolis算法的详细介绍
7.2.1预烧、效率和收敛
7.2.2术语:马尔可夫链蒙特卡罗方法
7.3从抽样后验分布到推断的三个目标
7.3.1估计
7.3.2预测
7.3.3模型比较:p(D)的估计
7.4BUGS的MCMC
7.4.1用BUGS估计参数
7.4.2用BUGS预测
7.4.3用BUGS进行模型比较
7.5结论
7.6R代码
7.6.1作者编写的Metropolis算法的R代码
7.7练习
第8章 使用Gibbs抽样推断两个二元比例
8.1两个比例的先验、似然和后验
8.2后验分布的精确表达
8.3使用格点估计近似后验分布
8.4使用MCMC推断后验分布
8.4.1Metropolis算法
8.4.2Gibbs抽样
8.5BUGS实现
8.5.1在BUGS中抽样获取先验分布
8.6潜在偏差有何差异?
8.7总结
8.8R代码
8.8.1格点估计的R代码(图8.1和图8.2)
8.8.2Metropolis抽样的R代码(图8.3)
8.8.3BUGS抽样的R代码(图8.6)
8.8.4画后验直方图的R代码
8.9练习
第9章 多层先验下的伯努利似然
9.1 单个铸币厂生产的单枚硬币
9.1.1 通过网格近似得到后验估计1
9.2 单个铸币厂生产的多枚硬币
9.2.1 通过网格近似得到后验估计2
9.2.2 通过蒙特卡罗抽样得到后验估计
9.2.3 单枚铸币估计的离群和收缩
9.2.4 案例研究:触摸治疗
9.2.5 硬币数量及每枚硬币的抛掷次数
9.3 多个铸币厂生产的多枚硬币
9.3.1 独立铸币厂
9.3.2 非独立铸币厂
9.3.3 个体间差异及Meta分析
9.4 总结
9.5 R代码
9.5.1 触摸治疗实验的分析代码
9.5.2 过滤冷凝实验的分析代码
9.6 练习
第10章 分层建模和模型比较
10.1 多层模型的模型比较
10.2 BUGS中的模型比较
10.2.1 一个简单的例子
10.2.2 带有伪先验的真实例子
10.2.3 在使用带有伪先验的跨维度MCMC时的一些建议
10.3 嵌套模型的模型比较
10.4 模型比较的分层框架回顾
10.4.1 MCMC模型比较的比较方法
10.4.2 总结和警告
10.5 练习
第11章 原假设显著性检验(NHST)
11.1硬币是否均匀的NHST
11.1.1 固定N的情况
11.1.2 固定z的情况
11.1.3 自我反省
11.1.4 贝叶斯分析
11.2 关于硬币的先验信息
11.2.1 NHST分析
11.2.2 贝叶斯分析
11.3 置信区间和最高密度区间(HDI)
11.3.1 NHST置信区间
11.3.2 贝叶斯HDI
11.4 多重假设
11.4.1 对实验误差的NHST修正
11.4.2 唯一的贝叶斯后验结论
11.4.3 贝叶斯分析如何减少误报
11.5 怎样的抽样分布才是好的
11.5.1 确定实验方案
11.5.2 探索模型预测(后验预测校验)
11.6 练习
第12章 单点检验的贝叶斯方法
12.1 单一先验的估计方法
12.1.1 参数的原假设值是否在可信范围内?
12.1.2 差异的原假设值是否在可信范围内?
12.1.3 实际等效区域(ROPE)
12.2 两个模型的先验比较方法
12.2.1 两枚硬币的均匀性是否相同?
12.2.2 不同组之间是否有差异?
12.3 模型比较的估计
12.3.1 原假设值为真的概率是多少?
12.3.2 建议
12.4 R代码
12.4.1 图12.5的R代码
12.5 练习
第13章 目标、势和样本量
13.1 势的相关内容
13.1.1 目标和障碍
13.1.2 势
13.1.3 样本量
13.1.4 目标的其他表现形式
13.2 一枚硬币的样本量
13.2.1 以否定原假设值为目的
13.2.2 以精确为目的
13.3 检验多家铸币厂的样本量
13.4 势:预期、回顾和重复
13.4.1 势分析需要逼真的模拟数据
13.5 计划的重要性
13.6 R代码
13.6.1 一枚硬币的样本量
13.6.2 检验多家铸币厂的势和样本量
13.7 练习
第3部分 广义线性模型的应用
第14章 广义线性模型概述
14.1 广义线性模型(GLM)
14.1.1 预测变量和响应变量
14.1.2 变量尺度类型:定量、顺序和名义
14.1.3 一元线性回归
14.1.4 多元线性回归
14.1.5 预测变量的非线性交互作用