Last updated: 21 Aug 25 08:56:55 (Asia/Shanghai)
医学统计学
This tutorial is powered by Bensz/黄伟斌
概论与定量数据的统计描述
一些基本的概念,适用条件,不要求掌握复杂的计算过程。
误差
类型 | 定义(要点) | 主要原因与控制措施 |
---|---|---|
系统误差 | 观测值整体偏高或偏低,影响准确性 | 原因:仪器未校准、标准试剂未校正、操作/判断标准偏差等。控制:定期对仪器/试剂校正、统一操作与判定标准、交叉验证与盲法、追踪并纠正来源。 |
随机测量误差 | 同一对象重复测量结果有波动,方向与大小无固定规律(常近似服从正态分布) | 原因:偶然因素(环境、被测者生理波动、操作微差等)。控制:增加重复测量次数、使用精密仪器、标准化操作流程、在统计分析中估计并报告变异(如标准差、置信区间)。 |
抽样误差 | 样本统计量与总体参数间的差异 | 原因:总体内部存在个体变异且仅抽取总体的部分作为样本。控制:采用合适的抽样方法(随机、分层)、增大样本量、计算并报告抽样误差(标准误、置信区间),必要时进行加权或重复抽样设计。 |
变量类型
类型 | 定义/特点 | 举例(常见测量) |
---|---|---|
定性数据 (计数资料) | 变量为类别或属性,观测值为非数值的分类项,表示性质或类别,类别之间无大小顺序关系;常用频数、构成比描述。 | 性别:男/女;血型:A、B、O、AB;诊断分类;阴性/阳性。 |
定量数据 (计量资料) | 变量为数值型,可用数值大小衡量特征水平,有计量单位。按取值域分: • 离散型:取有限或可数整数值(计数)。 • 连续型:可取任意实数值(理论上无限精度)。 | 离散型:家庭成员数、脉搏次数、白细胞计数;连续型:血压、身高、体重、血糖浓度。 |
有序数据 (半定量/等级资料) | 类别间有顺序但非数值等距,既有定性特征又含程度次序,常用中位数、四分位数或秩和检验处理。 | 尿糖:阴性、±、+、++、+++;疗效:显著、有效、好转、无效;疼痛评分分级(轻、中、重)。 |
数值变量资料的统计描述
类型 | 名称 | 定义 | 优势 / 劣势 |
---|---|---|---|
集中趋势 | 算术平均数 | 所有观测值之和除以样本量(Σx/n)。 | 利用全部数据,易计算与解释;适用于近正态分布。 劣势:对极端值和偏态分布高度敏感,可能误导代表性。 |
中位数 | 将数据排序后处于中间位置的值(偶数样本为两个中间值之平均)。 | 对离群值鲁棒,适合偏态分布与序数数据。劣势:忽略数值间距离与分布细节,样本间比较信息有限。 | |
众数 | 样本中出现频率最高的数值(可多众数)。 | 适用于分类变量或离散数值;直观反映最常见值。劣势:连续变量常无明确众数,且可能不反映整体位置。 | |
截尾均数(trimmed mean) | 去掉两端一定比例极端值后计算的算术平均(如5%截尾)。 | 兼具均值效率与对极端值的鲁棒性,降低异常值影响。劣势:需主观选择截尾比例;丢失部分信息,样本量小时影响大。 | |
几何平均数 | n次方根(Πx_i)^(1/n),用于正值乘法性尺度(如增长率)。 | 适合表示比例或增长率的平均行为,减弱乘法极端影响。劣势:仅适用于正值;对零或负值无定义,解释较不直观。 | |
调和平均数 | n / Σ(1/x_i),常用于速率或比率(如平均速度)。 | 对速率加权合并合适,弱化大值影响,反映“平均耗时”。劣势:对接近零值极为敏感,仅用于正值且解释需谨慎。 | |
离散程度 | 极差(Range) | 最大值与最小值之差(max − min)。 | 计算简单,给出总体变动范围的直观量。劣势:仅依赖两个值,对离群值高度敏感,不能描述内部分布。 |
四分位距(IQR) | 上四分位数Q3与下四分位数Q1之差(Q3 − Q1)。 | 对极端值鲁棒,反映中间50%数据的离散程度,常用于箱线图。劣势:忽略尾部信息,对分布形状细节信息有限。 | |
方差 | 观测值与均值差的平方的平均(样本方差常除以n−1)。 | 数学性质良好,可用于推断与建模(ANOVA、回归)。劣势:单位为原始单位平方,不直观;对极端值敏感。 | |
标准差 | 方差的平方根,与原始量纲一致。 | 易于解释,常用于描述总体离散度。劣势:受极端值影响;偏态分布时解释需谨慎。 | |
变异系数(CV) | 标准差与均值之比(SD/mean),常用百分数表示。 | 无量纲,可比较不同量纲或均值差异大的变量。劣势:当均值接近零时无意义或极端;对均值估计不稳时不可靠。 | |
平均绝对偏差(MAD, mean absolute deviation) | 各值与均值绝对差的平均(Σ|x−mean|/n)。 | 比方差对极端值稍鲁棒,易解释为平均偏差。劣势:仍依赖均值,对强偏态数据不如基于中位数的鲁棒。 | |
中位数绝对偏差(MedAD / MAD med) | 数据与中位数绝对差的中位数(median(|x−median|))。 | 对离群值高度鲁棒,适合偏态分布与稳健统计。劣势:统计效率低于基于均值的测度(在正态下);解释范围有时不直观。 | |
分布形态 | 偏度(Skewness) | 反映分布不对称性的第三中心矩标准化量(或样本式)。 | 量化偏态方向与程度,有助于选择变换或模型。劣势:估计受样本量和极端值影响;需结合分布图解释。 |
峰度(Kurtosis) | 反映分布尾部厚度与峰峭程度的第四中心矩标准化量。 | 用于评估尾部风险和极端值出现概率。劣势:估计不稳,样本峰度受极端值强烈影响,易被误用。 |
正态分布
- 标准正态分布(z分布)
要点 | 标准正态Z范围 | 正态曲线下面积(概率) |
---|---|---|
基本性质 | — | 曲线下总面积恒等于1;曲线关于均值μ对称;区间下的面积等于随机变量落在该区间的概率。 |
近似规则(经验法则) | — | μ±σ ≈ 68.27%;μ±1.96σ ≈ 95.00%;μ±2.58σ ≈ 99.00%(常用于置信区间与异常值判定)。 |
μ±σ | ±1 (−1 ~ +1) | 约 68.27% |
μ±1.96σ | ±1.96(−1.96 ~ +1.96) | 约 95.00% |
μ±2.58σ | ±2.58(−2.58 ~ +2.58) | 约 99.00% |
- Z vs. t
项目 | Z分布(标准正态) | t分布 |
---|---|---|
定义 | Z值(μ已知时)分布 | t值(μ或σ未知,用样本估计)分布 |
统计量 | Z = (X̄ − μ) / σ_X = (X̄ − μ) / (σ / √n) | t = (X̄ − μ) / S_X̄ = (X̄ − μ) / (S / √n) |
曲线特点 | 以0为中心,左右对称的单峰分布 | 以0为中心,左右对称的单峰分布;曲线随自由度ν改变 |
形态变化 | σ=1且为定值,形态固定(标准正态) | t分布为一族曲线,随自由度ν变化:1) ν越小,t值越分散,曲线越扁低;2) ν增大时,t分布逐渐逼近标准正态 |
95% 置信区间 | (X̄ ± 1.96·σ_X̄) | (X̄ ± t_{0.05/2, ν} · S_X̄) (双侧置信区间,t值取决于ν) |
假设检验的基本步骤
步骤 | 要点 | 简明说明 |
---|---|---|
1. 建立假设 | 无效假设(H0)/ 备择假设(H1) | H0 与 H1 是一对对立假设;检验围绕 H0 进行,若拒绝 H0 则接受 H1。 |
单侧/双侧检验 | 根据问题与专业判断选择:比较两药优劣通常用双侧检验;仅检验方向性差异(如 A 是否优于 B)用单侧检验。若不确定,优先选双侧。 | |
2. 确定检验水准 | 显著性水平 α | 预先规定拒绝域概率,常用 α=0.05 或 0.01。α 越大,越容易判定为“有差异”(假阳性风险增大)。 |
3. 选定检验方法 | 依据资料类型与设计 | 根据变量(定类/定序/定量)、样本量、配对与否及分布情况选择合适方法(t 检验、χ2、秩和检验、F 检验、回归等),并计算相应的检验统计量。 |
4. 判断与结论 | P 值与拒绝域 | 比较P值与 α 或将统计量与临界值比较:若 P ≤ α(或落入拒绝域)则拒绝 H0,接受 H1;否则不拒绝 H0。并报告效应方向、置信区间与临床意义。 |
Z检验 vs. t检验
检验 | 适用范围 | 要点 / 计算公式 |
---|---|---|
Z检验 (u检验) | 样本均数与总体均数比较(总体标准差已知);两独立样本均数比较(大样本资料 n>50) | 资料应近似对称分布或正态分布 样本均数与总体均数比较: z=(X̄−μ)/σ_X̄ = (X̄−μ)/(σ/√n) 两样本均数比较: z=(X̄1−X̄2)/S_{X̄1−X̄2} = (X̄1−X̄2)/√(S1^2/n1+S2^2/n2) |
t检验 | 样本均数与总体均数比较(总体标准差未知);两独立样本均数比较(小样本资料 n<50);配对设计资料的比较 | 资料服从正态分布;两均数比较时需检查总体方差齐性 样本均数与总体均数比较: t=(X̄−μ0)/S_{X̄} = (X̄−μ0)/(S/√n) 两独立样本均数比较: - 方差相等(pooled): t=(X̄1−X̄2)/[S_{X̄1−X̄2}] , S_{X̄1−X̄2}=S_p√(1/n1+1/n2), S_p^2 = [(n1−1)S1^2+(n2−1)S2^2]/(n1+n2−2) 配对样本均数比较: t= (d̄−0)/(S_d/√n) ,自由度 ν=n−1 |
两类错误
一阳指
(另外一个自然就是假阴性错误)1-α为置信度,表明采用某方法重复做很多次样本抽取与区间计算,约 95% 的区间会覆盖真实参数 θ。
1-β为把握度/检验效能,表示在H1确实为真时,按规定的检验水准能正确拒绝H0的概率。1-β衡量检验发现实际存在效应(非零效应)的能力。
项目 | I 类错误 | II 类错误 |
---|---|---|
错误类型 | 拒绝实际上成立的 H0(“弃真”) | 未拒绝实际上不成立的 H0(“存伪”) |
别称 | 假阳性错误(Type I, false positive) | 假阴性错误(Type II, false negative) |
概率符号 | α | β |
概率大小(要点) | 若把检验显著性水平定为 α = 0.05,则犯 I 类错误的概率为 0.05(理论上每 100 次样本约 5 次发生)。 | β 的大小一般未知,只有在已知两总体的标准差、均数差(效应量)与样本量时,才能估算并计算检验的 检验力(power = 1−β)。 |
二者关系与控制策略 | 在样本量 n 固定时,α ↓ 则 β ↑;α ↑ 则 β ↓。同时减小 α 和 β 的唯一实用方法是 增加样本量(或增大效应量/降低测量误差以提高检验力)。 |
定性数据的统计描述
假设检验的表示、P值的判断,这些不要求复杂计算就能作答的内容。
分类变量资料的统计描述
指标 | 定义 | 优势 | 劣势 |
---|---|---|---|
频数 (n) | 样本中每一类别的绝对计数 | 简单直观,易于报告与核查 | 不反映样本大小差异或类别比例 |
比例 / 百分比 (%) | 某类别频数除以总体并乘100(如 45%) | 便于比较不同样本或不同规模群体 | 在样本量很小时不稳定;多类别时总和解释需谨慎 |
众数 | 出现频率最高的类别 | 适用于名义/序数变量,易于理解 | 可能非唯一;不反映类别间差异大小 |
列联表 / 交叉表 | 显示两个或多个分类变量的联合分布 | 直观展示关联方向与分布模式,可并入图形 | 类别多或样本小会导致表格稀疏,难以解释 |
χ² 检验(卡方) | 检验两个名义变量是否独立(基于期望频数) | 广泛使用,计算与解释简单 | 要求期望频数足够大;对样本量敏感(大样本易显著) |
Fisher 精确检验 | 替代卡方的小样本/稀疏表的精确概率检验 | 适用于小样本或期望频数低的表 | 计算量随表尺寸增加迅速上升;大型表不适用 |
比值比 (OR) | 病例对照等研究中两组事件发生比的比值 | 可用于回归模型,适合稀有结局近似RR | 对常见结局解释困难(会夸大效应),需报告置信区间 |
相对风险 (RR) | 暴露组发生率与对照组发生率之比(队列研究) | 直观反映风险倍数,易于临床解释 | 仅适用于有发生率估计的设计;不能在病例对照直接计算 |
Cramér's V | 基于χ²的关联强度度量(0–1) | 可量化名义变量间关联强度,类别数不同仍可比较 | 不指示方向;随样本量与表结构解释需谨慎 |
Kappa 系数 | 评估两名评估者对分类结果的一致性(校正偶然一致) | 考虑偶然一致,常用于诊断一致性评价 | 对类别不均衡敏感;解释有主观阈值(低/中/高一致) |
直线相关和回归、统计图表
相关系数和回归系数
名称 | 定义 | 适用场景 | 优缺点(要点) |
---|---|---|---|
Pearson相关系数 (r) | 测量两个连续变量间的线性相关程度,r=Cov(X,Y)/(σXσY),取值范围为-1到1。量化线性关系强度与方向 | 变量近似正态且关系接近线性;常用于生物统计、临床连续变量相关性分析。 | 优:计算简单、可进行显著性检验(t检验)。 缺:对离群值敏感,不能检测非线性关系,依赖正态性与同方差性假设。 |
Spearman秩相关系数 (ρ) | 基于秩的相关系数,计算变量秩次间的Pearson相关;衡量单调关系强度,范围-1到1。对分布与异常值更稳健 | 变量非正态、有异常值或关系为单调但非线性;常用于序数数据或经转换的数据。 | 优:稳健于离群值、可捕捉单调但非线性关系、无需正态假设。 缺:对精确数值差异信息丢失(只用秩),统计效率低于Pearson(当线性且正态时)。 |
Kendall秩相关系数 (τ) | 基于成对秩次一致性/不一致性的比率,反映秩相关的概率差异;取值近似-1到1。强调顺序一致性 | 样本量小、存在大量并列秩(ties),或关注成对顺序一致性时使用。 | 优:对小样本与并列值更稳健,解释直观(一致对不一致概率差)。 缺:计算较Pearson/ Spearman复杂,数值通常比ρ小,功效视情形而异。 |
回归系数(简单线性回归斜率 β) | 在模型 Y = α + βX + ε 中,β表示X变动一单位时Y的平均变动量;通常用最小二乘估计。用于因果或预测方向的量化 | 评估自变量对因变量的平均影响、预测与调整混杂时;可扩展至多元回归以同时控制多个协变量。 | 优:提供方向性与量化效应(带置信区间与显著性检验),可用于调整混杂。 缺:需线性、残差独立同分布与同方差等假设;受多重共线性与离群点影响;斜率不等同于相关性(相关不等于因果)。 |
秩和检验
往年很少考。