qPCR 内参基因怎么选？

原始文献

Reference Gene Validation for RT-qPCR, a Note on Different Available Software Packages

Ward De Spiegelaere / Jutta Dern-Wieloch / Roswitha Weigel / Valerie Schumacher / Hubert Schorle / Daniel Nettersheim / Martin Bergmann / Ralph Brehm / Sabine Kliesch / Linos Vandekerckhove / Cornelia Fink · PLOS ONE · DOI: 10.1371/journal.pone.0122515

查看原文下载 PDF

文献核心摘要

这篇论文讨论的是 RT-qPCR 里很容易被忽略、但会直接影响结论的问题：内参基因不能只凭习惯选 GAPDH、ACTB 或 18S rRNA，而是要在具体样本和处理条件下验证稳定性。

作者把同一批候选 reference genes 放进不同软件包中分析，比较 geNorm、NormFinder、BestKeeper、qBasePLUS 以及 R 包的结果。论文的重点不是提出一个新的湿实验流程，而是告诉读者：内参验证的计算工具、PCR efficiency 输入方式和数据预处理都会影响最终排序。

这篇论文做了什么实验

论文使用 RT-qPCR 检测 14 个候选内参基因，并用不同软件对表达稳定性进行排序。作者特别关注一个现实问题：同一组 Cq 数据，放进不同工具后，内参排序是否一致。

这对普通实验很有参考价值，因为很多 qPCR 结果出问题，不是扩增曲线本身看起来很差，而是归一化时用了不稳定内参，导致目标基因 fold change 被放大或压低。

论文阅读笔记

作者为什么做这个实验

这篇论文的出发点不是“再证明一次内参重要”，而是更具体地问：当实验者已经决定验证内参时，不同软件会不会给出不同答案。

这个问题很实际。很多实验室会把候选内参的 Cq 值丢进 RefFinder、geNorm、NormFinder 或 BestKeeper，然后直接拿排名最高的基因做归一化。论文指出，软件之间的差异不只是界面不同，还包括输入数据形式、是否考虑 PCR efficiency、算法关注的变异类型，以及是否能给出推荐内参数量。

所以这篇论文更像一个“内参验证工具使用说明书”：它提醒读者不要把软件输出当成绝对答案，要先看输入数据和算法假设。

实验设计逻辑

作者用了两类样本体系做验证。一类是含 carcinoma in situ 的人睾丸组织样本，另一类是人 Sertoli 细胞系 FS1 的培养和共培养模型。这样设计的好处是：既包含组织样本，也包含细胞培养样本，能观察不同生物体系中内参稳定性和软件输出是否一致。

候选基因数量是 14 个，覆盖 TBP、UBC、SDHA、HMBS、B2M、HPRT1、GAPDH、ACTB、RPS18 等常见 reference genes。这个数量足够让算法比较出稳定性差异，也避免只在少数传统内参里“矮子里拔高个”。

读这篇论文时要抓住的主线

读这篇论文不要先纠结哪个基因排名第一，而是按下面这条线看：

作者先拿同一批 Cq 数据做内参稳定性分析。
再比较原始软件、R 包和 RefFinder 的输出差异。
然后单独测试 PCR efficiency 是否会改变 geNorm 和 NormFinder 的排序。
最后讨论为什么只输入 raw Cq 的工具可能带来偏差。

换句话说，这篇论文的重点不是给你一个“最佳内参名单”，而是告诉你内参验证的结论会被数据处理方式影响。

关键原文怎么读

Abstract：这篇论文真正要解决的问题

原文位置：Abstract 里关于 reference gene validation software 的描述。

这一段的重点不是“qPCR 需要内参”这个常识，而是作者明确把问题指向软件选择和数据处理：同一批候选内参，用不同工具分析时，结果可能并不完全一样。

中文理解可以抓住一句话：这篇论文是在提醒你，内参验证不是把 Cq 值丢进软件就结束了，软件背后的算法和输入要求会影响最终推荐。

对实验的意义：如果你的文章或实验报告里只写“使用 RefFinder 选择 GAPDH 作为内参”，但没有说明候选基因、扩增效率和其他软件验证，证据是不够完整的。

Introduction：为什么不能凭习惯选内参

原文位置：Introduction 中讨论 housekeeping genes 和 normalization 的部分。

作者在这里强调，传统 housekeeping genes 并不自动等于稳定 reference genes。GAPDH、ACTB、18S rRNA 这些基因在很多体系中常用，但它们也可能被组织类型、疾病状态、细胞培养条件或处理因素影响。

中文理解：内参稳定性不是基因名称自带的属性，而是实验条件下测出来的结果。

对实验的意义：如果你的处理会改变细胞代谢、增殖、应激或分化，传统内参反而可能成为误差来源。此时更应该做候选内参筛选，而不是默认使用实验室习惯。

Materials and Methods：看作者怎么组织输入数据

原文位置：Materials and Methods 中关于 RT-qPCR、reference gene selection 和 software packages 的部分。

这一部分要重点看三件事：作者检测了哪些候选基因，Cq 数据如何进入不同软件，是否使用了 PCR efficiency 校正。论文比较 geNorm、NormFinder、BestKeeper、qBasePLUS、RefFinder 和 R 包时，不只是比较软件名字，而是在比较不同输入和算法实现。

中文理解：软件分析前的数据准备，本身就是方法的一部分。

对实验的意义：你在复用这类方法时，不能只记录“用了 geNorm”。还要记录输入的是 raw Cq、delta Cq 还是 relative quantity，是否输入每对引物的 efficiency，以及样本分组如何设置。

Results：看 efficiency 校正如何改变排序

原文位置：Results 中关于 Table 2、Fig 1 和 Fig 2 的结果。

这一部分是整篇论文最值得细读的地方。作者比较了假设 100% PCR efficiency 和使用实际 efficiency 校正后的稳定性排序，发现 geNorm 和 NormFinder 的结果会发生变化。

中文理解：扩增效率不是论文 Methods 里可写可不写的附属参数，它会影响内参筛选结论。

对实验的意义：如果你没有做标准曲线，也没有确认每对引物的效率，就直接比较 Cq 稳定性，最后选出的内参可能只是“看起来稳定”。

Discussion：作者真正想让你带走的结论

原文位置：Discussion 中关于不同软件、效率校正和工具限制的讨论。

作者并不是说某一个软件最好，也不是说 RefFinder 不能用。更准确的意思是：不同软件适合不同输入和判断维度，实验者要知道工具的前提，而不是只接受最终排名。

中文理解：内参验证需要综合判断，不应该被一个软件排名绑架。

对实验的意义：如果多个工具给出不同结果，不一定说明实验失败。你应该回头看候选基因数量、扩增效率、样本分组、重复孔质量和表达范围，再决定最终内参组合。

具体操作方法

1. 先准备候选内参

论文不是只验证一个常用内参，而是准备多个候选基因。候选基因应尽量来自不同功能类别，避免同一处理条件同时影响一组相关基因。

如果实验条件会改变代谢、细胞周期、应激或分化状态，单独使用 GAPDH、ACTB、TUBB 这类传统内参风险会更高。

2. 获得每个候选基因的 Cq 数据

每个样本都需要检测所有候选内参。数据进入软件前，要先排查明显的技术问题，例如重复孔差异过大、熔解曲线异常、扩增效率不合格、NTC 出峰。

内参验证不是用来拯救低质量 qPCR 数据的，它只是在可靠扩增基础上比较表达稳定性。

3. 输入 PCR efficiency

论文强调 assay efficiency 会影响内参验证。若所有引物都默认 100% efficiency，计算会变得更简单，但不一定符合真实情况。

实际复用时，建议先用标准曲线或稀释梯度确认每对引物的效率和线性范围，再进入稳定性排序。

4. 用多个算法交叉判断

geNorm 更关注基因两两之间的表达稳定关系，NormFinder 会考虑组内和组间变异，BestKeeper 直接从 Cq 层面评估波动。不同算法关注点不同，所以排序不完全一致是正常的。

更稳妥的做法不是盲目相信某一个软件，而是看多个算法是否都支持同一批候选内参。

核心实验参数

参数	论文中的做法	复用时怎么理解
候选内参	14 个 reference genes	候选数量太少会限制选择空间
分析工具	geNorm、NormFinder、BestKeeper 等	不同工具结果可能不同，要看综合趋势
输入数据	RT-qPCR Cq 与 efficiency	扩增效率不是可有可无的参数
排序目标	找稳定内参或内参组合	最终常常需要 2 个以上内参
适用场景	表达量归一化	不适合替代扩增质量控制

主要结果怎么读

Table 1：先看引物信息是否完整

Table 1 列出了 14 个候选 reference genes 的引物信息和退火温度。这个表的意义不只是“告诉你作者用了哪些引物”，而是说明内参验证必须从 assay 层面开始。

复用时要注意两件事：

如果你自己设计引物，不能只照着候选基因名单做，还要重新确认特异性、扩增效率和熔解曲线。
如果你复用论文引物，也要确认物种、转录本版本、样本类型和扩增片段是否适合你的实验。

Table 2：重点看 efficiency 是否改变排序

Table 2 比较了使用 efficiency-corrected values 和假设 100% efficiency 时的稳定性排序。这个表是整篇论文最关键的证据之一。

作者发现，对于 geNorm 和 NormFinder，是否校正 PCR efficiency 会改变不少基因的排序。也就是说，如果某个工具只接受 raw Cq，或者你默认所有引物效率都是 100%，最终推荐的内参可能会变。

这个结果对实验者的直接提醒是：标准曲线和引物效率不是“附加信息”，而是会进入归一化决策。

Fig 1 / Fig 2：看排名变化，不是只看第一名

Fig 1 和 Fig 2 展示的是效率校正前后，geNorm 和 NormFinder 输出排序的变化。读图时不要只看哪个基因排第一，而要看排序是否整体稳定。

如果多个候选基因的位置发生明显移动，说明这个数据集对 efficiency 很敏感。此时最好不要只凭单个软件或单个排名做决定，而要回到扩增效率、重复孔质量和候选基因表达范围重新检查。

S1 Fig：看需要几个内参

geNorm 的 pairwise variation 可以帮助判断用几个内参比较合适。论文中 FS1 样本和 CIS 样本推荐的内参数量并不完全一样，这说明“用 2 个内参就够”也不是永远成立。

如果你的实验分组复杂、处理强度大、样本来源差异大，最好不要默认单内参或固定两个内参，而是根据自己的数据判断。

作者结论是否站得住

这篇论文的结论比较稳，因为它不是用一个软件证明另一个软件错，而是用同一批数据比较多种实现方式，并且把 PCR efficiency 作为单独变量拿出来测试。

作者的主要论点有三层：

多数算法在最稳定和最不稳定基因上有一定一致性。
原始软件、R 包和 RefFinder 的输出可能不同。
是否纳入 assay efficiency 会影响 geNorm 和 NormFinder 的排序。

这个推理链条比较清楚：如果同一数据在 efficiency 处理方式不同的情况下得到不同排序，那么工具输出就不能脱离输入条件来解释。

但也要看到限制：论文只验证了特定组织、特定细胞模型和 14 个候选基因。它能支持“内参验证要考虑 efficiency 和软件差异”，但不能支持“某个内参适合所有 qPCR 实验”。

实验结论

论文的核心结论是：内参验证需要把实验数据、扩增效率和算法选择一起考虑。R 包和商业软件在某些算法上可以得到一致排序，但前提是输入和参数处理一致。

这也说明，qPCR 结果报告中只写“normalized to GAPDH”是不够的。更合理的报告方式应包括候选内参、筛选方法、扩增效率和最终选择理由。

实验中的核心关键点

先验证再使用：内参稳定性是实验条件相关的，不是基因名称自带的属性。
候选数量要足够：只比较 2 个候选内参，容易被迫接受不够稳定的基因。
效率会影响排序：不同引物效率差异明显时，默认 100% 会带来偏差。
多个算法交叉判断：软件排序不同不一定是错误，而是统计假设不同。
最好使用内参组合：单内参归一化更容易被个别基因波动影响。

可以参考什么

可以参考这篇论文的内参验证流程：先筛候选基因，再做扩增质量控制，然后用多个工具比较稳定性，最后确定一个内参组合。

如果你的处理条件会改变细胞状态，尤其是刺激、药物处理、转染、分化、缺氧、炎症模型，更应该把内参验证作为正式实验前的一部分。

更具体地，可以参考这个执行顺序：

先选 8-15 个候选 reference genes。
对每对引物做标准曲线，得到 efficiency 和 R2。
用正式样本或代表性 pilot 样本跑全部候选内参。
剔除熔解曲线异常、重复孔差异过大或效率不合格的 assay。
分别用 geNorm、NormFinder、BestKeeper 等工具分析。
比较多个工具的共同推荐，而不是只看一个排名。
用 2 个或更多稳定内参计算 normalization factor。

这篇论文适合解决哪些问题

这篇论文最适合帮助你处理这些情况：

qPCR 目标基因 fold change 看起来很大，但内参 Cq 也在变。
不知道 GAPDH、ACTB、18S rRNA 到底能不能用。
RefFinder、geNorm、NormFinder 排名不一致。
审稿人要求说明 reference gene validation。
同一批样本用不同内参归一化后结论不同。

如果你的问题是“完全没有扩增”“熔解曲线多峰”“NTC 有曲线”，那这篇论文不是第一优先级。那些问题应先解决扩增体系和污染问题，再谈内参稳定性。

和 BioHelper 其他内容的关系

如果你的 qPCR 内参在处理组和对照组间明显波动，可以看 qPCR 内参不稳定怎么办。

如果要确认引物效率和特异性，可以配合 qPCR 标准曲线怎么做和引物分析工具。

下一步

把论文方法放回自己的实验

qPCR 实验设计完整指南

从实验目的到数据分析，系统介绍 qPCR 实验的完整设计流程和关键要点。

查看文章 qPCR 内参基因不稳定怎么办

内参基因波动会直接放大相对定量误差，常见原因包括处理条件影响、样本质量不一致和内参选择不合适。

查看文章 qPCR Ct 值波动很大怎么排查

Ct 值波动大时，应同时检查加样误差、内参稳定性、模板质量和标准品配置。

查看问题 扩增效率低

标准曲线斜率异常、效率偏低，通常和模板质量、梯度稀释、引物设计和体系设置有关。

查看问题

本页是对开放文献中实验方法的中文结构化拆解，用于科研学习、参数参考和结果判读辅助；论文条件不能直接照搬，不替代原文、实验室 SOP、试剂说明书或本实验室预实验。