这几个月,DeepSeek因“乱编文献”问题引发了不少争议,甚至还冲上了微博热搜。但文献检索这一点,GPT却展示了强劲的实力。本文将通过实操示例,探讨如何利用GPT甄别和查找真实的学术文献,希望能给你带来实质性的协助!
第一阶段:检索准备
步骤1:明确检索需求
研究主题:用5-7个关键词来描述你的研究内容(列如:“CRISPR-Cas9脱靶效应检测”、“单细胞测序”、“全基因组测谱”)。
时间范围:提议选择近五年的研究(2019-2024年)。
文献类型:
1)期刊论文
2)会议论文
3) 预印本(请标明)
4)综述文章
质量要求:
1)影响因子要求(例如:期刊影响因子≥10)
2)被引用次数(例如:每年引用>20次)
3)优先选择开放获取的文章
步骤2:选择检索数据库
1)PubMed(生物医学领域)
2)Web of Science(多学科)
3)IEEE Xplore(工程技术)
4)arXiv(预印本验证)
5)Crossref(DOI校验)
第二阶段:结构化指令构建
步骤3:构建检索式
# 布尔逻辑表达式示例
(“CRISPR-Cas9” OR “基因编辑”)
AND (“脱靶效应” OR “off-target effects”)
AND (“检测方法” OR “单细胞测序” OR “全基因组测谱”)
NOT (“植物” OR “动物模型”) # 排除干扰项
步骤4:生成检索指令
请按照以下步骤操作:
检索文献:在PubMed和Web of Science平台上,查找过去3年内关于[主题]的相关论文。
筛选标准:
1)论文的第一作者或通讯作者的H-index要≥30。
2)选择那些提出新方法的论文。
3)论文中需要有独立验证实验。
输出格式:
[1] 论文标题(原文)
[2] 作者(姓氏全拼+机构缩写,例:Zhang J (MIT))
[3] 期刊名称(标准缩写,例:Nat. Biotechnol.)
[4] 论文DOI链接(以超链接形式展示:https://doi.org/xxx)
[5] 是否有补充材料(如果有,请标注“Dataset Available”)
分步示例演示:
分步骤演示前你需要知道你的需求背景,然后就是分步指令,包括检索要求、筛选条件、输出格式要求、验证要求…
需求场景
查找3篇2021年后发表的关于“阿尔茨海默病tau蛋白传播机制”的细胞实验研究
分步指令
请按照以下要求执行文献检索:
检索要求:
数据库:使用PubMed Central和ScienceDirect。
时间范围:2021年1月到2024年5月的文献。
筛选条件:
1)论文必须包含动物模型实验。
2)必须提供病理切片的原始数据。
3)排除纯粹的计算模拟研究。
输出格式要求:
[1] 论文标题(提供中文和英文对照标题)
[2] 作者(如果作者获得诺贝尔奖,标注★)
[3] 期刊名称(包括ISSN号和最新影响因子)
[4] 论文的DOI超链接和PMID号
[5] 补充材料的访问路径(提供Figshare或OSF的链接)
验证要求:
通过Europe PMC检查论文是否能获取全文。
在Methods部分检查是否详细描述了立体定位注射的技术细节。
整合一下指令:
作为Nature Neuroscience期刊的审稿人,请进行专业的文献检索。我需要查找3篇2021年后发表的关于“阿尔茨海默病tau蛋白传播机制”的细胞实验研究。 检索的要求:1)数据库:PubMed Central 和 ScienceDirect;2)时间范围:2021年1月到2024年5月。 筛选条件:1)必须包含动物模型实验;2)需要提供病理切片的原始数据;3)排除纯计算模拟类的研究。 输出要求:[1] 论文标题(中英文对照);[2] 作者(标注诺贝尔奖得主);[3] 期刊(包括ISSN号和最新影响因子);[4] DOI链接 + PMID号;[5] 补充材料访问路径(例如:Figshare或OSF链接)。 你需要验证:1)通过Europe PMC确认全文是否可以访问;2)检查方法部分是否提到了“立体定位注射”技术的细节。
效果如下:

根据GPT提供的期刊名称以及标题作者,我去找了一下第一篇文献,的确 在Neuron找到了这篇文献,它提供的DOI和期刊里的DOI都对的上,作者的名字也对的上,只是英译中,标题和作者名字翻译的不是很准确,列如MengMengWang翻译成了王萌萌,但问题不大。

目前我们来对DeepSeek输入这段指令,看看它是否如网传所说乱编文献,效果如下:

我发现生成的内容,看起来效果还不错。下面我们根据它给的第一篇文献的DOI链接,直接来验证,发现它给的作者名字和跳转过去的文献作者名根本就不一样,标题也不一样,妥妥张冠李戴了…


综上所述,面对DeepSeek存在的文献造假问题,GPT展现出了很牛的文献检索功能,只不过要用对合适的指令,并且检索出来的文献没有办法判断其质量。希望本文的实操示例能为学者们在文献查找上提供新的思路和协助。

