一文详解区组随机化包教包懂!

Lin等人研究发现[1],2014年在新英格兰医学杂志、Lancet和JAMA发表的224个RCT中,使用简单随机分组的只有12个(6%),而分层(区组)随机分组的有156个(70%)(图1)。

检索万方数据库2014年全年“医药卫生”领域的“期刊论文”发现,主题词为“随机 and(区组 or 分层)”的文献数量仅占了主题词为“随机”的文献数量的1%(图2)。

大致浏览后发现,主题词包含“随机 and(区组 or 分层)”的这1%的文献,大多数是因为主题词中有“随机分组”和“分层分析”而被检索到,而不是“分层随机化”。

“只会简单随机化?Naive!”中已经介绍,简单随机分组时,组间人数不相等才是大概率事件。那么,为什么中文文献中,绝大部分采用简单随机分组,但两组样本量完全相等的研究报告那么多呢?

理想情况下,简单随机分组后,就能使1)组间基线)组间人数基本相等; 3)组间重要协变量均衡。(重要协变量指的是与主要评价指标具有较强相关关系的预后因子,如年龄、疾病严重程度等。)然而,实际情况并不是这样的。相反,简单随机分组时,组间人数不相等才是大概率事件。

举例来看,某RCT纳入10名研究对象,如果简单随机分组为干预组(A)和对照组(B),就有8.8%的概率产生分配出以下样本量:干预组8名,对照组2名;或者干预组2名,对照组8名。两组人数完全相等的概率只有24.6%。另外,如果不同特征的研究对象入组时间明显不同(如早期进入研究的都病情较重),也会对试验结果产生影响。