本书一方面介绍流行病学基本分析方法和测量指标, 使读者了解基于数据的流行病学分析方法; 另一方面对Stata统计软件进行介绍, 使读者能够初步掌握Stata的使用方法, 熟练运用其进行流行病学统计计算。在章节设置上, 第一节进行Stata界面和基本命令的介绍, 让大家能够快速入门, 对Stata软件有一个初步的认识; 第二、三、四节进行流行病学相关的知识和计算方法讲解, 并介绍对应的Stata命令, 包括图表制作和假设检验等; 第五、六、七节围绕流行病学研究中的危险因素分析, 介绍Stata中回归相关的命令操作, 如线性回归、logistic回归、Cox回归等。
目前在计量经济学方面关于Stata应用的图书较多,而针对流行病学分析中Stata应用的图书较少。本书结合流行病学分析和Stata运用,一方面介绍流行病学基本分析方法和测量指标,使读者了解基于数据的流行病学分析方法;另一方面对Stata统计软件进行介绍,使读者能够初步掌握Stata的使用方法,并熟练运用进行流行病学统计计算。
本书将编写的重点放在对Stata操作和结果解释的讲解,内容简洁易懂。书中尽量选取Stata自带的网络数据或系统数据进行举例,也有部分数据来自其他文献或自编数据,其目的仅为帮助读者了解Stata的数据分析操作,部分不具有实际意义。
本书以Stata15.0为例,第一章进行Stata界面和基本命令的介绍,让读者能够快速入门,对Stata软件有一个初步的认识;第二章至第四章进行流行病学相关知识和计算方法讲解,并介绍对应的Stata命令,包括图表制作和假设检验等;第五章至第七章围绕流行病学研究中的危险因素分析,介绍Stata中回归相关的命令操作,如线性回归、logistic回归、Cox回归等。
本书是在相应的课堂教学经验基础上完成的编写,融入了平时教学中发现的操作难点和学生的相关诉求。书中未涉及Stata的一些相对复杂的模型、算法,这是因为编写本书的目的在于使读者初步了解并应用Stata进行流行病学分析,而非成为统计软件专家。基于本书的内容,读者可以不断探索,继续深入学习。
本书编写虽力臻完善,但难免存在疏漏与不足之处,恳请大家多提宝贵意见,以便进一步修订完善。
李晋磊,博士,中国医学科学院北京协和医学院群医学及公共卫生学院,副研究员。毕业于英国约克大学,健康科学博士,美国Framingham Heart Study访问学者,现担任北京协和医学院群医学及公共卫生学院流行病与卫生统计学系教师,《流行病学分析与Stata应用》课程负责人,主要从事慢性病流行病学研究及老龄化、老年痴呆等相关领域研究。承担多项国内外研究课题,具有丰富的现场调查经验和数据分析能力,在国内外期刊发表学术论文20余篇。
第一节 Stata简介与基本命令介绍 1.1 Stata软件 1.2 Stata的界面 1.3 操作方式 1.4 强大的HELP功能 1.5 数据录入 1.6 常用命令介绍 第二节 流行病学与Stata中的数据描述和图形绘制 2.1 流行病学中的疾病测量指标 2.2 疾病测量指标的标准化 2.3 Stata疾病分布描述与图形绘制 第三节 流行病学中的效应测量与Stata假设检验 3.1 流行病学设计和相应的效应测量 3.2 偏倚和混杂 3.3 Stata中的流行病学表格分析 第四节 Stata中的流行病学分析与表格报告 4.1 t检验 4.2 方差分析 4.3 非参数检验 4.4 卡方检验 第五节 Stata中的相关与线性回归 5.1 相关 Correlation 5.2 线性回归linear regression 5.3 二分变量为自变量 5.4 多元线性回归 第六节 logistic 回归相关命令介绍 6.1 logistic回归在流行病学中的含义 6.2 logistic回归命令 6.3哑变量 6.4因素调整 6.5 条件logistic 回归 6.6 do文件的建立和使用 第七节 利用Stata进行生存分析 7.1 生存分析的含义 7.2 生存分析在Stata中的变量设置 7.3 应用Kaplan Meier survival estimates 7.4生存曲线的比较 7.5 Cox 回归