Last updated: 21 Aug 25 08:56:55 (Asia/Shanghai)

医学统计学

This tutorial is powered by Bensz/黄伟斌

概论与定量数据的统计描述

一些基本的概念,适用条件,不要求掌握复杂的计算过程。

误差

类型定义(要点)主要原因与控制措施
系统误差观测值整体偏高或偏低,影响准确性原因:仪器未校准、标准试剂未校正、操作/判断标准偏差等。控制:定期对仪器/试剂校正、统一操作与判定标准、交叉验证与盲法、追踪并纠正来源。
随机测量误差同一对象重复测量结果有波动,方向与大小无固定规律(常近似服从正态分布)原因:偶然因素(环境、被测者生理波动、操作微差等)。控制:增加重复测量次数、使用精密仪器、标准化操作流程、在统计分析中估计并报告变异(如标准差、置信区间)。
抽样误差样本统计量与总体参数间的差异原因:总体内部存在个体变异且仅抽取总体的部分作为样本。控制:采用合适的抽样方法(随机、分层)、增大样本量、计算并报告抽样误差(标准误、置信区间),必要时进行加权或重复抽样设计。

变量类型

类型定义/特点举例(常见测量)
定性数据
(计数资料)
变量为类别或属性,观测值为非数值的分类项,表示性质或类别,类别之间无大小顺序关系;常用频数、构成比描述。性别:男/女;血型:A、B、O、AB;诊断分类;阴性/阳性。
定量数据
(计量资料)
变量为数值型,可用数值大小衡量特征水平,有计量单位。按取值域分:
• 离散型:取有限或可数整数值(计数)。
• 连续型:可取任意实数值(理论上无限精度)。
离散型:家庭成员数、脉搏次数、白细胞计数;连续型:血压、身高、体重、血糖浓度。
有序数据
(半定量/等级资料)
类别间有顺序但非数值等距,既有定性特征又含程度次序,常用中位数、四分位数或秩和检验处理。尿糖:阴性、±、+、++、+++;疗效:显著、有效、好转、无效;疼痛评分分级(轻、中、重)。

数值变量资料的统计描述

类型名称定义优势 / 劣势
集中趋势算术平均数所有观测值之和除以样本量(Σx/n)。利用全部数据,易计算与解释;适用于近正态分布。 劣势:对极端值和偏态分布高度敏感,可能误导代表性。
中位数将数据排序后处于中间位置的值(偶数样本为两个中间值之平均)。对离群值鲁棒,适合偏态分布与序数数据。劣势:忽略数值间距离与分布细节,样本间比较信息有限。
众数样本中出现频率最高的数值(可多众数)。适用于分类变量或离散数值;直观反映最常见值。劣势:连续变量常无明确众数,且可能不反映整体位置。
截尾均数(trimmed mean)去掉两端一定比例极端值后计算的算术平均(如5%截尾)。兼具均值效率与对极端值的鲁棒性,降低异常值影响。劣势:需主观选择截尾比例;丢失部分信息,样本量小时影响大。
几何平均数n次方根(Πx_i)^(1/n),用于正值乘法性尺度(如增长率)。适合表示比例或增长率的平均行为,减弱乘法极端影响。劣势:仅适用于正值;对零或负值无定义,解释较不直观。
调和平均数n / Σ(1/x_i),常用于速率或比率(如平均速度)。对速率加权合并合适,弱化大值影响,反映“平均耗时”。劣势:对接近零值极为敏感,仅用于正值且解释需谨慎。
离散程度极差(Range)最大值与最小值之差(max − min)。计算简单,给出总体变动范围的直观量。劣势:仅依赖两个值,对离群值高度敏感,不能描述内部分布。
四分位距(IQR)上四分位数Q3与下四分位数Q1之差(Q3 − Q1)。对极端值鲁棒,反映中间50%数据的离散程度,常用于箱线图。劣势:忽略尾部信息,对分布形状细节信息有限。
方差观测值与均值差的平方的平均(样本方差常除以n−1)。数学性质良好,可用于推断与建模(ANOVA、回归)。劣势:单位为原始单位平方,不直观;对极端值敏感。
标准差方差的平方根,与原始量纲一致。易于解释,常用于描述总体离散度。劣势:受极端值影响;偏态分布时解释需谨慎。
变异系数(CV)标准差与均值之比(SD/mean),常用百分数表示。无量纲,可比较不同量纲或均值差异大的变量。劣势:当均值接近零时无意义或极端;对均值估计不稳时不可靠。
平均绝对偏差(MAD, mean absolute deviation)各值与均值绝对差的平均(Σ|x−mean|/n)。比方差对极端值稍鲁棒,易解释为平均偏差。劣势:仍依赖均值,对强偏态数据不如基于中位数的鲁棒。
中位数绝对偏差(MedAD / MAD med)数据与中位数绝对差的中位数(median(|x−median|))。对离群值高度鲁棒,适合偏态分布与稳健统计。劣势:统计效率低于基于均值的测度(在正态下);解释范围有时不直观。
分布形态偏度(Skewness)反映分布不对称性的第三中心矩标准化量(或样本式)。量化偏态方向与程度,有助于选择变换或模型。劣势:估计受样本量和极端值影响;需结合分布图解释。
峰度(Kurtosis)反映分布尾部厚度与峰峭程度的第四中心矩标准化量。用于评估尾部风险和极端值出现概率。劣势:估计不稳,样本峰度受极端值强烈影响,易被误用。

正态分布

  • 标准正态分布(z分布)
要点标准正态Z范围正态曲线下面积(概率)
基本性质曲线下总面积恒等于1;曲线关于均值μ对称;区间下的面积等于随机变量落在该区间的概率。
近似规则(经验法则)μ±σ ≈ 68.27%μ±1.96σ ≈ 95.00%μ±2.58σ ≈ 99.00%(常用于置信区间与异常值判定)。
μ±σ±1 (−1 ~ +1)约 68.27%
μ±1.96σ±1.96(−1.96 ~ +1.96)约 95.00%
μ±2.58σ±2.58(−2.58 ~ +2.58)约 99.00%
  • Z vs. t
项目Z分布(标准正态)t分布
定义Z值(μ已知时)分布t值(μ或σ未知,用样本估计)分布
统计量Z = (X̄ − μ) / σ_X = (X̄ − μ) / (σ / √n)t = (X̄ − μ) / S_X̄ = (X̄ − μ) / (S / √n)
曲线特点以0为中心,左右对称的单峰分布以0为中心,左右对称的单峰分布;曲线随自由度ν改变
形态变化σ=1且为定值,形态固定(标准正态)t分布为一族曲线,随自由度ν变化:1) ν越小,t值越分散,曲线越扁低;2) ν增大时,t分布逐渐逼近标准正态
95% 置信区间(X̄ ± 1.96·σ_X̄)(X̄ ± t_{0.05/2, ν} · S_X̄) (双侧置信区间,t值取决于ν)

假设检验的基本步骤

步骤要点简明说明
1. 建立假设无效假设(H0)/ 备择假设(H1)H0 与 H1 是一对对立假设;检验围绕 H0 进行,若拒绝 H0 则接受 H1。
单侧/双侧检验根据问题与专业判断选择:比较两药优劣通常用双侧检验;仅检验方向性差异(如 A 是否优于 B)用单侧检验。若不确定,优先选双侧。
2. 确定检验水准显著性水平 α预先规定拒绝域概率,常用 α=0.05 或 0.01。α 越大,越容易判定为“有差异”(假阳性风险增大)。
3. 选定检验方法依据资料类型与设计根据变量(定类/定序/定量)、样本量、配对与否及分布情况选择合适方法(t 检验、χ2、秩和检验、F 检验、回归等),并计算相应的检验统计量。
4. 判断与结论P 值与拒绝域比较P值与 α 或将统计量与临界值比较:若 P ≤ α(或落入拒绝域)则拒绝 H0,接受 H1;否则不拒绝 H0。并报告效应方向、置信区间与临床意义。

Z检验 vs. t检验

检验适用范围要点 / 计算公式
Z检验 (u检验)样本均数与总体均数比较(总体标准差已知);两独立样本均数比较(大样本资料 n>50)资料应近似对称分布或正态分布
样本均数与总体均数比较: z=(X̄−μ)/σ_X̄ = (X̄−μ)/(σ/√n)
两样本均数比较: z=(X̄1−X̄2)/S_{X̄1−X̄2} = (X̄1−X̄2)/√(S1^2/n1+S2^2/n2)
t检验样本均数与总体均数比较(总体标准差未知);两独立样本均数比较(小样本资料 n<50);配对设计资料的比较资料服从正态分布;两均数比较时需检查总体方差齐性
样本均数与总体均数比较: t=(X̄−μ0)/S_{X̄} = (X̄−μ0)/(S/√n)
两独立样本均数比较:
- 方差相等(pooled): t=(X̄1−X̄2)/[S_{X̄1−X̄2}] , S_{X̄1−X̄2}=S_p√(1/n1+1/n2), S_p^2 = [(n1−1)S1^2+(n2−1)S2^2]/(n1+n2−2)
配对样本均数比较: t= (d̄−0)/(S_d/√n) ,自由度 ν=n−1

两类错误

一阳指(另外一个自然就是假阴性错误)

1-α为置信度,表明采用某方法重复做很多次样本抽取与区间计算,约 95% 的区间会覆盖真实参数 θ。

1-β为把握度/检验效能,表示在H1确实为真时,按规定的检验水准能正确拒绝H0的概率。1-β衡量检验发现实际存在效应(非零效应)的能力。

项目I 类错误II 类错误
错误类型拒绝实际上成立的 H0(“弃真”)未拒绝实际上不成立的 H0(“存伪”)
别称假阳性错误(Type I, false positive)假阴性错误(Type II, false negative)
概率符号αβ
概率大小(要点)若把检验显著性水平定为 α = 0.05,则犯 I 类错误的概率为 0.05(理论上每 100 次样本约 5 次发生)。β 的大小一般未知,只有在已知两总体的标准差、均数差(效应量)与样本量时,才能估算并计算检验的 检验力(power = 1−β)
二者关系与控制策略在样本量 n 固定时,α ↓ 则 β ↑;α ↑ 则 β ↓。同时减小 α 和 β 的唯一实用方法是 增加样本量(或增大效应量/降低测量误差以提高检验力)。

定性数据的统计描述

假设检验的表示、P值的判断,这些不要求复杂计算就能作答的内容。

分类变量资料的统计描述

指标定义优势劣势
频数 (n)样本中每一类别的绝对计数简单直观,易于报告与核查不反映样本大小差异或类别比例
比例 / 百分比 (%)某类别频数除以总体并乘100(如 45%)便于比较不同样本或不同规模群体在样本量很小时不稳定;多类别时总和解释需谨慎
众数出现频率最高的类别适用于名义/序数变量,易于理解可能非唯一;不反映类别间差异大小
列联表 / 交叉表显示两个或多个分类变量的联合分布直观展示关联方向与分布模式,可并入图形类别多或样本小会导致表格稀疏,难以解释
χ² 检验(卡方)检验两个名义变量是否独立(基于期望频数)广泛使用,计算与解释简单要求期望频数足够大;对样本量敏感(大样本易显著)
Fisher 精确检验替代卡方的小样本/稀疏表的精确概率检验适用于小样本或期望频数低的表计算量随表尺寸增加迅速上升;大型表不适用
比值比 (OR)病例对照等研究中两组事件发生比的比值可用于回归模型,适合稀有结局近似RR对常见结局解释困难(会夸大效应),需报告置信区间
相对风险 (RR)暴露组发生率与对照组发生率之比(队列研究)直观反映风险倍数,易于临床解释仅适用于有发生率估计的设计;不能在病例对照直接计算
Cramér's V基于χ²的关联强度度量(0–1)可量化名义变量间关联强度,类别数不同仍可比较不指示方向;随样本量与表结构解释需谨慎
Kappa 系数评估两名评估者对分类结果的一致性(校正偶然一致)考虑偶然一致,常用于诊断一致性评价对类别不均衡敏感;解释有主观阈值(低/中/高一致)

直线相关和回归、统计图表

相关系数和回归系数

名称定义适用场景优缺点(要点)
Pearson相关系数 (r)测量两个连续变量间的线性相关程度,r=Cov(X,Y)/(σXσY),取值范围为-1到1。量化线性关系强度与方向变量近似正态且关系接近线性;常用于生物统计、临床连续变量相关性分析。:计算简单、可进行显著性检验(t检验)。
:对离群值敏感,不能检测非线性关系,依赖正态性与同方差性假设。
Spearman秩相关系数 (ρ)基于秩的相关系数,计算变量秩次间的Pearson相关;衡量单调关系强度,范围-1到1。对分布与异常值更稳健变量非正态、有异常值或关系为单调但非线性;常用于序数数据或经转换的数据。:稳健于离群值、可捕捉单调但非线性关系、无需正态假设。
:对精确数值差异信息丢失(只用秩),统计效率低于Pearson(当线性且正态时)。
Kendall秩相关系数 (τ)基于成对秩次一致性/不一致性的比率,反映秩相关的概率差异;取值近似-1到1。强调顺序一致性样本量小、存在大量并列秩(ties),或关注成对顺序一致性时使用。:对小样本与并列值更稳健,解释直观(一致对不一致概率差)。
:计算较Pearson/ Spearman复杂,数值通常比ρ小,功效视情形而异。
回归系数(简单线性回归斜率 β)在模型 Y = α + βX + ε 中,β表示X变动一单位时Y的平均变动量;通常用最小二乘估计。用于因果或预测方向的量化评估自变量对因变量的平均影响、预测与调整混杂时;可扩展至多元回归以同时控制多个协变量。:提供方向性与量化效应(带置信区间与显著性检验),可用于调整混杂。
:需线性、残差独立同分布与同方差等假设;受多重共线性与离群点影响;斜率不等同于相关性(相关不等于因果)。

秩和检验

往年很少考。