一文详解区组随机化包教包懂！

Lin等人研究发现[1]，2014年在新英格兰医学杂志、Lancet和JAMA发表的224个RCT中，使用简单随机分组的只有12个（6%），而分层（区组）随机分组的有156个（70%）（图1）。

检索万方数据库2014年全年“医药卫生”领域的“期刊论文”发现，主题词为“随机 and（区组 or 分层）”的文献数量仅占了主题词为“随机”的文献数量的1%（图2）。

大致浏览后发现，主题词包含“随机 and（区组 or 分层）”的这1%的文献，大多数是因为主题词中有“随机分组”和“分层分析”而被检索到，而不是“分层随机化”。

“只会简单随机化？Naive!”中已经介绍，简单随机分组时，组间人数不相等才是大概率事件。那么，为什么中文文献中，绝大部分采用简单随机分组，但两组样本量完全相等的研究报告那么多呢？

理想情况下，简单随机分组后，就能使1）组间基线）组间人数基本相等； 3）组间重要协变量均衡。（重要协变量指的是与主要评价指标具有较强相关关系的预后因子，如年龄、疾病严重程度等。）然而，实际情况并不是这样的。相反，简单随机分组时，组间人数不相等才是大概率事件。

举例来看，某RCT纳入10名研究对象，如果简单随机分组为干预组（A）和对照组（B），就有8.8%的概率产生分配出以下样本量：干预组8名，对照组2名；或者干预组2名，对照组8名。两组人数完全相等的概率只有24.6%。另外，如果不同特征的研究对象入组时间明显不同（如早期进入研究的都病情较重），也会对试验结果产生影响。