你辛辛苦苦做完文献检索,找到一篇刚上传的预印本,研究问题和你的课题高度吻合,方法设计也很扎实。你如获至宝,把它写进文献综述,引用了核心观点。三个月后,这篇论文的正式版本发表了。你对比了一下,发现正式版修改了数据分析方法和结论——和你引用的内容已经完全不一样了。
另一个极端。你因为担心预印本没有经过同行评审,干脆把所有预印本都排除在外。结果你遗漏了这个领域最新、最重要的研究进展。等到你的论文写完投稿,审稿人问你“为什么没有引用某某的预印本”时,你才发现自己已经落后了。

预印本正在改变学术交流的方式。在arXiv、medRxiv、SSRN等平台上,越来越多的研究者选择在投稿期刊之前就把论文上传。这意味着,如果你只检索传统期刊论文,你可能会有三到十二个月的信息差——等正式论文发表出来,别人已经基于预印本完成了新一轮的研究。但预印本的问题也很明显:没有经过同行评审。质量参差不齐,有的和正式版几乎没有区别,有的则存在方法缺陷、数据分析错误,甚至结论完全不可靠。
那么,预印本论文到底要不要纳入你的文献筛选?如果纳入,怎么控制风险?这篇文章给你一套判断逻辑和可操作的风险控制方法。

一、为什么你无法回避这个问题
五年前预印本还是小众话题,现在arXiv每年收到超过二十万篇新论文,medRxiv和bioRxiv的投稿量在疫情期间爆发式增长,Google Scholar、Crossref、Dimensions等主要数据库已开始系统收录预印本。当你用常规关键词检索时,预印本很可能会出现在结果中,你无法回避它们。不同学科对预印本的接受度差异很大:物理学和计算机科学领域引用预印本是常态,NeurIPS和ICML等顶级会议明确允许;生物医学领域更加谨慎,《柳叶刀》等期刊允许引用但要求投稿时说明;社会科学领域预印本文化仍在形成中,不同期刊政策差异较大。所以,简单地说“全部纳入”或“全部排除”都不合理,你需要一个基于风险控制的筛选策略。
二、三个维度评估一篇预印本
当一篇预印本出现在检索结果中,我不会立刻决定要还是不要,而是从三个维度快速评估。
- 维度一:研究领域和期刊政策
这是最基础的判断依据。先查目标期刊的投稿指南。如果明确不接受预印本引用,直接排除。如果允许,再看领域内的通行做法。阅读几篇近期的综述文章,观察作者如何处理预印本引用,这是了解领域规范最快的方法。
同时,关注你所在研究社群的态度。如果你参加的学术会议上,大家都在讨论某篇预印本,那它很可能已经成为领域内的重要文献。
- 维度二:预印本本身的质量信号
没有同行评审,不代表没有其他质量信号。我通常看五个方面。
第一,作者背景。作者是否来自该领域有声誉的研究机构或团队?查看作者的Google Scholar主页,了解其过往发表记录。一个在顶级期刊有多篇发表的作者,其预印本的质量通常更有保障。
第二,论文完整性。一篇只有三页、没有方法细节的预印本,和一篇完整呈现了方法、数据、代码的预印本,可信度完全不同。完整的预印本意味着作者对自己的研究有信心,也意味着同行有足够的材料进行评估。
第三,发表状态。很多预印本会在更新版本中标注“accepted at XXX journal”或“under review at XXX”。这是一个很强的质量信号。如果已经被顶级期刊或会议接收,这篇预印本实际上已经经过了同行评审。
第四,同行反应。在Twitter、ResearchGate或PubPeer上有没有人讨论这篇预印本?有没有指出问题或提出质疑?正面的讨论是质量信号,负面的讨论则是预警信号。
第五,下载量和引用量。高下载量和早期引用往往意味着学界对这项研究的关注和初步认可。虽然这个指标不能替代同行评审,但它反映了研究社群的集体判断。
- 维度三:你在论文中如何使用它
预印本的使用方式决定了风险容忍度。如果只是用来支撑研究背景,比如“某某问题近年来受到广泛关注”,引用预印本是可以接受的,因为这种陈述不依赖具体数据或结论。如果用来支撑核心论点,比如“某干预措施的效果为X%”,则需要更加谨慎,建议找到正式版验证或寻找独立研究佐证。如果要批评某个方法或结论,引用预印本时格外小心,最佳批评时机是正式版发表之后。如果用来做方法参考,风险相对较低,但建议确认正式版中方法部分是否有重大调整。
在实际筛选中,如果需要同时评估多篇预印本,手动一篇篇判断很耗时。我常用的做法是,把这几篇预印本的PDF拖进UPDF,用AI总结功能快速提取每篇的研究问题、方法设计和主要结论,然后对照上述五个方面做批量评估。AI总结会直接给出论文的核心要素,不需要我通读全文。

三、四种场景的处理策略
基于上述三个维度,我总结出四种常见场景的处理策略。
场景一:领域接受度高 + 预印本质量信号强
正常纳入,把它当作普通文献处理。引用时标注“preprint”即可。例如,一篇来自知名团队、方法详实、已经标注被NeurIPS接收的arXiv预印本,完全可以正常引用。在这种情况下,预印本和正式版几乎没有区别,你甚至可以引用arXiv版本而不等正式版发表。
场景二:领域接受度高 + 质量信号弱
有条件地纳入。只用于支撑非核心论点,比如研究背景或问题提出部分,不用于支撑关键的数据或结论。同时在使用时明确标注其预印本状态。这类预印本的价值在于提示研究方向,而不是提供可靠的数据支撑。
场景三:领域保守 + 预印本质量信号强
谨慎纳入。在引用前找到正式发表版本进行比对。如果正式版尚未发表,在文献综述中单独说明“该研究以预印本形式发表,结论尚未经同行评审”。如果正式版已经发表,直接引用正式版。这类预印本的核心价值在于它的研究问题和方法设计,而不是最终结论。
场景四:领域保守 + 质量信号弱
直接排除。风险大于收益,不值得纳入。例如一篇来自不熟悉团队、方法描述简略、没有发表记录、也没有同行讨论的预印本,直接排除是最安全的选择。不要因为担心遗漏而把不确定的文献纳入,这会给你的论文带来潜在风险。
你可以根据自己的研究领域建立类似的决策矩阵。为了便于管理,我习惯用UPDF的知识库功能建立一个“待评估文献”文件夹,把不确定是否纳入的预印本先放进去,用标签标注评估维度和初步判断,等有时间再做深入筛选。这样不会打断检索节奏,也不会遗漏潜在的重要文献。

四、从检索到决策的完整操作流程
以下是我每次遇到预印本时的完整操作流程。
第一步:初步筛选
在检索结果中看到预印本,先看标题和摘要。如果主题明显不相关,直接跳过。如果相关,进入下一步。
这个阶段不需要深入阅读,快速判断即可。我给自己定的规则是:每篇预印本花不超过30秒做初步判断。
第二步:快速评估
用上述三个维度快速判断。研究领域是否接受?质量信号强不强?我打算怎么用它?这三个问题回答了,基本就有结论了。
如果需要批量评估,我用UPDF的AI总结功能提取核心信息。把几篇预印本同时拖进去,AI会自动生成每篇的总结,包括研究问题、方法、结论。我对照这些信息做快速判断,十分钟能处理十几篇。
第三步:分类管理
根据评估结果,把预印本分成三类:纳入、待定、排除。
纳入的直接下载并分类存放到知识库对应文件夹。我会按照研究主题建立不同的文件夹,比如“文献综述_核心文献”“文献综述_方法参考”“文献综述_背景支撑”。
待定的单独存放,标注需要进一步核实的信息点。比如“待查作者背景”“待查是否已正式发表”“待查同行反应”。这些标注帮助我知道下一步需要做什么。
排除的记录排除原因,避免重复劳动。比如“主题偏移”“方法不可比”“作者背景不明确”。记录排除原因还有一个好处:当你需要向导师或审稿人说明筛选标准时,这些记录就是你的依据。
第四步:追踪更新
对纳入和待定的预印本,我会记录下它们的发布时间和版本号。
在论文投稿前,快速检查一遍这些预印本是否有更新版本或正式发表。UPDF的AI论文搜索功能可以帮我快速追踪某篇预印本的发表状态,输入标题就能看到它是否已经被期刊收录。
如果发现预印本已经正式发表,我会把引用信息更新为正式版。如果发现预印本有重大更新,我会重新评估它是否仍然符合纳入标准。
第五步:引用前最终确认
在把预印本写进论文之前,最后一次确认它的状态。
检查三件事:第一,正式版是否已经发表;第二,预印本是否有更新版本;第三,预印本的核心结论是否与其他研究一致。
如果三件事都没有问题,可以放心引用。如果任何一件有问题,回到评估阶段重新判断。
五、三个常见误区
误区一:默认预印本和正式版一样
这是最危险的想法。预印本没有经过同行评审,正式发表前可能会经历重大修改。
我见过数据分析方法完全更换、主要结论被弱化或修正、甚至标题都变了的情况。一篇预印本声称“某药物有效”,正式版可能改为“某药物在特定亚组中有效”,或者“某药物无效”。如果你引用的是预印本,而正式版推翻了原有结论,你的论文就会出现事实性错误。
应对方法:在引用前检查正式版是否已经发表,或者至少在论文中明确标注这是预印本。
误区二:因为质量参差不齐而全部排除
这样做的代价是信息滞后。
在快速发展的领域,半年的时间差可能意味着你的文献综述已经过时了。以人工智能领域为例,从预印本上传到正式发表通常需要六到十二个月。在这段时间里,领域可能已经发生了重大变化。如果你只引用正式发表的论文,你的文献综述可能落后了半年到一年。
应对方法:建立分层纳入标准,而不是一刀切。
误区三:引用预印本时不做标注
读者有权知道你引用的是未经评审的版本。这是基本的学术规范。
不同引用格式对预印本有不同的标注要求。APA格式需要在末尾注明“Advance online publication”或“Preprint”。MLA格式要求在标题后注明“Preprint”。Chicago格式要求在引文中说明版本状态。
应对方法:在引用时明确标注版本状态,不要省略。

六、总结
预印本要不要纳入文献筛选,答案不是“是”或“否”,而是“看情况”。你需要考虑三个因素:研究领域的接受度、预印本本身的质量信号、你在论文中使用它的方式。
建立一套简单的决策标准,可以帮你在信息时效性和质量可靠性之间找到平衡。不要因为担心质量就全部排除,也不要因为追求时效就全盘接收。花十分钟评估一下,做出有依据的判断,这比花几天时间纠结要高效得多。
我日常使用的工具组合是:用UPDF的AI总结功能快速提取预印本核心信息,用知识库分类管理待评估文献,用AI论文搜索追踪正式发表状态。这三个功能配合使用,能把预印本筛选的时间压缩一半以上。
FAQ
Q1:预印本和正式发表版本的主要区别是什么?
预印本未经同行评审,正式版本经过了同行的审查和修改。
Q2:什么情况下可以放心引用预印本?
当预印本来自知名团队、方法详实且已标注被会议或期刊接收时。
Q3:UPDF能帮助预印本筛选吗?
能,AI总结功能提取核心信息,知识库分类管理,AI论文搜索追踪发表状态。
UPDF
AI 网页版
Windows 版
Mac 版
iOS 版
安卓版
AI 单文件总结
AI 多文件总结
生成思维导图
深度研究
论文搜索
AI 翻译
AI 解释
AI 问答
编辑 PDF
注释 PDF
阅读 PDF
PDF 表单编辑
PDF 去水印
PDF 添加水印
OCR 图文识别
合并 PDF
拆分 PDF
压缩 PDF
分割 PDF
插入 PDF
提取 PDF
替换 PDF
PDF 加密
PDF 密文
PDF 签名
PDF 文档对比
PDF 打印
批量处理
发票助手
PDF 共享
云端同步
PDF 转 Word
PDF 转 PPT
PDF 转 Excel
PDF 转 图片
PDF 转 TXT
PDF 转 XML
PDF 转 CSV
PDF 转 RTF
PDF 转 HTML
PDF 转 PDF/A
PDF 转 OFD
CAJ 转 PDF
Word 转 PDF
PPT 转 PDF
Excel 转 PDF
图片 转 PDF
Visio 转 PDF
OFD 转 PDF
创建 PDF
AI 生成书签
AI 总结书签
AI 生成水印
AI 生成背景
AI 生成贴纸
AI 生成印章
AI 编辑与润色
UPDF Copilot
AI 页面检查
AI 语义搜索
PDF 转 Word
PDF 转 Excel
PDF 转 PPT
企业解决方案
企业版定价
企业版 AI
企业指南
渠道合作
信创版
金融
制造
医疗
教育
保险
法律
政务
常见问题
新闻中心
文章资讯
产品动态
更新日志
科研指南