Reference Gene Validation for RT-qPCR, a Note on Different Available Software Packages
Ward De Spiegelaere / Jutta Dern-Wieloch / Roswitha Weigel / Valerie Schumacher / Hubert Schorle / Daniel Nettersheim / Martin Bergmann / Ralph Brehm / Sabine Kliesch / Linos Vandekerckhove / Cornelia Fink · PLOS ONE · DOI: 10.1371/journal.pone.0122515
文献核心摘要
这篇论文讨论的是 RT-qPCR 里很容易被忽略、但会直接影响结论的问题:内参基因不能只凭习惯选 GAPDH、ACTB 或 18S rRNA,而是要在具体样本和处理条件下验证稳定性。
作者把同一批候选 reference genes 放进不同软件包中分析,比较 geNorm、NormFinder、BestKeeper、qBasePLUS 以及 R 包的结果。论文的重点不是提出一个新的湿实验流程,而是告诉读者:内参验证的计算工具、PCR efficiency 输入方式和数据预处理都会影响最终排序。
这篇论文做了什么实验
论文使用 RT-qPCR 检测 14 个候选内参基因,并用不同软件对表达稳定性进行排序。作者特别关注一个现实问题:同一组 Cq 数据,放进不同工具后,内参排序是否一致。
这对普通实验很有参考价值,因为很多 qPCR 结果出问题,不是扩增曲线本身看起来很差,而是归一化时用了不稳定内参,导致目标基因 fold change 被放大或压低。
论文阅读笔记
作者为什么做这个实验
这篇论文的出发点不是“再证明一次内参重要”,而是更具体地问:当实验者已经决定验证内参时,不同软件会不会给出不同答案。
这个问题很实际。很多实验室会把候选内参的 Cq 值丢进 RefFinder、geNorm、NormFinder 或 BestKeeper,然后直接拿排名最高的基因做归一化。论文指出,软件之间的差异不只是界面不同,还包括输入数据形式、是否考虑 PCR efficiency、算法关注的变异类型,以及是否能给出推荐内参数量。
所以这篇论文更像一个“内参验证工具使用说明书”:它提醒读者不要把软件输出当成绝对答案,要先看输入数据和算法假设。
实验设计逻辑
作者用了两类样本体系做验证。一类是含 carcinoma in situ 的人睾丸组织样本,另一类是人 Sertoli 细胞系 FS1 的培养和共培养模型。这样设计的好处是:既包含组织样本,也包含细胞培养样本,能观察不同生物体系中内参稳定性和软件输出是否一致。
候选基因数量是 14 个,覆盖 TBP、UBC、SDHA、HMBS、B2M、HPRT1、GAPDH、ACTB、RPS18 等常见 reference genes。这个数量足够让算法比较出稳定性差异,也避免只在少数传统内参里“矮子里拔高个”。
读这篇论文时要抓住的主线
读这篇论文不要先纠结哪个基因排名第一,而是按下面这条线看:
- 作者先拿同一批 Cq 数据做内参稳定性分析。
- 再比较原始软件、R 包和 RefFinder 的输出差异。
- 然后单独测试 PCR efficiency 是否会改变 geNorm 和 NormFinder 的排序。
- 最后讨论为什么只输入 raw Cq 的工具可能带来偏差。
换句话说,这篇论文的重点不是给你一个“最佳内参名单”,而是告诉你内参验证的结论会被数据处理方式影响。
关键原文怎么读
Abstract:这篇论文真正要解决的问题
原文位置:Abstract 里关于 reference gene validation software 的描述。
这一段的重点不是“qPCR 需要内参”这个常识,而是作者明确把问题指向软件选择和数据处理:同一批候选内参,用不同工具分析时,结果可能并不完全一样。
中文理解可以抓住一句话:这篇论文是在提醒你,内参验证不是把 Cq 值丢进软件就结束了,软件背后的算法和输入要求会影响最终推荐。
对实验的意义:如果你的文章或实验报告里只写“使用 RefFinder 选择 GAPDH 作为内参”,但没有说明候选基因、扩增效率和其他软件验证,证据是不够完整的。
Introduction:为什么不能凭习惯选内参
原文位置:Introduction 中讨论 housekeeping genes 和 normalization 的部分。
作者在这里强调,传统 housekeeping genes 并不自动等于稳定 reference genes。GAPDH、ACTB、18S rRNA 这些基因在很多体系中常用,但它们也可能被组织类型、疾病状态、细胞培养条件或处理因素影响。
中文理解:内参稳定性不是基因名称自带的属性,而是实验条件下测出来的结果。
对实验的意义:如果你的处理会改变细胞代谢、增殖、应激或分化,传统内参反而可能成为误差来源。此时更应该做候选内参筛选,而不是默认使用实验室习惯。
Materials and Methods:看作者怎么组织输入数据
原文位置:Materials and Methods 中关于 RT-qPCR、reference gene selection 和 software packages 的部分。
这一部分要重点看三件事:作者检测了哪些候选基因,Cq 数据如何进入不同软件,是否使用了 PCR efficiency 校正。论文比较 geNorm、NormFinder、BestKeeper、qBasePLUS、RefFinder 和 R 包时,不只是比较软件名字,而是在比较不同输入和算法实现。
中文理解:软件分析前的数据准备,本身就是方法的一部分。
对实验的意义:你在复用这类方法时,不能只记录“用了 geNorm”。还要记录输入的是 raw Cq、delta Cq 还是 relative quantity,是否输入每对引物的 efficiency,以及样本分组如何设置。
Results:看 efficiency 校正如何改变排序
原文位置:Results 中关于 Table 2、Fig 1 和 Fig 2 的结果。
这一部分是整篇论文最值得细读的地方。作者比较了假设 100% PCR efficiency 和使用实际 efficiency 校正后的稳定性排序,发现 geNorm 和 NormFinder 的结果会发生变化。
中文理解:扩增效率不是论文 Methods 里可写可不写的附属参数,它会影响内参筛选结论。
对实验的意义:如果你没有做标准曲线,也没有确认每对引物的效率,就直接比较 Cq 稳定性,最后选出的内参可能只是“看起来稳定”。
Discussion:作者真正想让你带走的结论
原文位置:Discussion 中关于不同软件、效率校正和工具限制的讨论。
作者并不是说某一个软件最好,也不是说 RefFinder 不能用。更准确的意思是:不同软件适合不同输入和判断维度,实验者要知道工具的前提,而不是只接受最终排名。
中文理解:内参验证需要综合判断,不应该被一个软件排名绑架。
对实验的意义:如果多个工具给出不同结果,不一定说明实验失败。你应该回头看候选基因数量、扩增效率、样本分组、重复孔质量和表达范围,再决定最终内参组合。
具体操作方法
1. 先准备候选内参
论文不是只验证一个常用内参,而是准备多个候选基因。候选基因应尽量来自不同功能类别,避免同一处理条件同时影响一组相关基因。
如果实验条件会改变代谢、细胞周期、应激或分化状态,单独使用 GAPDH、ACTB、TUBB 这类传统内参风险会更高。
2. 获得每个候选基因的 Cq 数据
每个样本都需要检测所有候选内参。数据进入软件前,要先排查明显的技术问题,例如重复孔差异过大、熔解曲线异常、扩增效率不合格、NTC 出峰。
内参验证不是用来拯救低质量 qPCR 数据的,它只是在可靠扩增基础上比较表达稳定性。
3. 输入 PCR efficiency
论文强调 assay efficiency 会影响内参验证。若所有引物都默认 100% efficiency,计算会变得更简单,但不一定符合真实情况。
实际复用时,建议先用标准曲线或稀释梯度确认每对引物的效率和线性范围,再进入稳定性排序。
4. 用多个算法交叉判断
geNorm 更关注基因两两之间的表达稳定关系,NormFinder 会考虑组内和组间变异,BestKeeper 直接从 Cq 层面评估波动。不同算法关注点不同,所以排序不完全一致是正常的。
更稳妥的做法不是盲目相信某一个软件,而是看多个算法是否都支持同一批候选内参。
核心实验参数
| 参数 | 论文中的做法 | 复用时怎么理解 |
|---|---|---|
| 候选内参 | 14 个 reference genes | 候选数量太少会限制选择空间 |
| 分析工具 | geNorm、NormFinder、BestKeeper 等 | 不同工具结果可能不同,要看综合趋势 |
| 输入数据 | RT-qPCR Cq 与 efficiency | 扩增效率不是可有可无的参数 |
| 排序目标 | 找稳定内参或内参组合 | 最终常常需要 2 个以上内参 |
| 适用场景 | 表达量归一化 | 不适合替代扩增质量控制 |
主要结果怎么读
Table 1:先看引物信息是否完整
Table 1 列出了 14 个候选 reference genes 的引物信息和退火温度。这个表的意义不只是“告诉你作者用了哪些引物”,而是说明内参验证必须从 assay 层面开始。
复用时要注意两件事:
- 如果你自己设计引物,不能只照着候选基因名单做,还要重新确认特异性、扩增效率和熔解曲线。
- 如果你复用论文引物,也要确认物种、转录本版本、样本类型和扩增片段是否适合你的实验。
Table 2:重点看 efficiency 是否改变排序
Table 2 比较了使用 efficiency-corrected values 和假设 100% efficiency 时的稳定性排序。这个表是整篇论文最关键的证据之一。
作者发现,对于 geNorm 和 NormFinder,是否校正 PCR efficiency 会改变不少基因的排序。也就是说,如果某个工具只接受 raw Cq,或者你默认所有引物效率都是 100%,最终推荐的内参可能会变。
这个结果对实验者的直接提醒是:标准曲线和引物效率不是“附加信息”,而是会进入归一化决策。
Fig 1 / Fig 2:看排名变化,不是只看第一名
Fig 1 和 Fig 2 展示的是效率校正前后,geNorm 和 NormFinder 输出排序的变化。读图时不要只看哪个基因排第一,而要看排序是否整体稳定。
如果多个候选基因的位置发生明显移动,说明这个数据集对 efficiency 很敏感。此时最好不要只凭单个软件或单个排名做决定,而要回到扩增效率、重复孔质量和候选基因表达范围重新检查。
S1 Fig:看需要几个内参
geNorm 的 pairwise variation 可以帮助判断用几个内参比较合适。论文中 FS1 样本和 CIS 样本推荐的内参数量并不完全一样,这说明“用 2 个内参就够”也不是永远成立。
如果你的实验分组复杂、处理强度大、样本来源差异大,最好不要默认单内参或固定两个内参,而是根据自己的数据判断。
作者结论是否站得住
这篇论文的结论比较稳,因为它不是用一个软件证明另一个软件错,而是用同一批数据比较多种实现方式,并且把 PCR efficiency 作为单独变量拿出来测试。
作者的主要论点有三层:
- 多数算法在最稳定和最不稳定基因上有一定一致性。
- 原始软件、R 包和 RefFinder 的输出可能不同。
- 是否纳入 assay efficiency 会影响 geNorm 和 NormFinder 的排序。
这个推理链条比较清楚:如果同一数据在 efficiency 处理方式不同的情况下得到不同排序,那么工具输出就不能脱离输入条件来解释。
但也要看到限制:论文只验证了特定组织、特定细胞模型和 14 个候选基因。它能支持“内参验证要考虑 efficiency 和软件差异”,但不能支持“某个内参适合所有 qPCR 实验”。
实验结论
论文的核心结论是:内参验证需要把实验数据、扩增效率和算法选择一起考虑。R 包和商业软件在某些算法上可以得到一致排序,但前提是输入和参数处理一致。
这也说明,qPCR 结果报告中只写“normalized to GAPDH”是不够的。更合理的报告方式应包括候选内参、筛选方法、扩增效率和最终选择理由。
实验中的核心关键点
- 先验证再使用:内参稳定性是实验条件相关的,不是基因名称自带的属性。
- 候选数量要足够:只比较 2 个候选内参,容易被迫接受不够稳定的基因。
- 效率会影响排序:不同引物效率差异明显时,默认 100% 会带来偏差。
- 多个算法交叉判断:软件排序不同不一定是错误,而是统计假设不同。
- 最好使用内参组合:单内参归一化更容易被个别基因波动影响。
可以参考什么
可以参考这篇论文的内参验证流程:先筛候选基因,再做扩增质量控制,然后用多个工具比较稳定性,最后确定一个内参组合。
如果你的处理条件会改变细胞状态,尤其是刺激、药物处理、转染、分化、缺氧、炎症模型,更应该把内参验证作为正式实验前的一部分。
更具体地,可以参考这个执行顺序:
- 先选 8-15 个候选 reference genes。
- 对每对引物做标准曲线,得到 efficiency 和 R2。
- 用正式样本或代表性 pilot 样本跑全部候选内参。
- 剔除熔解曲线异常、重复孔差异过大或效率不合格的 assay。
- 分别用 geNorm、NormFinder、BestKeeper 等工具分析。
- 比较多个工具的共同推荐,而不是只看一个排名。
- 用 2 个或更多稳定内参计算 normalization factor。
这篇论文适合解决哪些问题
这篇论文最适合帮助你处理这些情况:
- qPCR 目标基因 fold change 看起来很大,但内参 Cq 也在变。
- 不知道 GAPDH、ACTB、18S rRNA 到底能不能用。
- RefFinder、geNorm、NormFinder 排名不一致。
- 审稿人要求说明 reference gene validation。
- 同一批样本用不同内参归一化后结论不同。
如果你的问题是“完全没有扩增”“熔解曲线多峰”“NTC 有曲线”,那这篇论文不是第一优先级。那些问题应先解决扩增体系和污染问题,再谈内参稳定性。
和 BioHelper 其他内容的关系
如果你的 qPCR 内参在处理组和对照组间明显波动,可以看 qPCR 内参不稳定怎么办。
如果要确认引物效率和特异性,可以配合 qPCR 标准曲线怎么做 和 引物分析工具。