-
_NEWSDATE: 2025-07-08 | News by: 知识分子 | 有0人参与评论 | _FONTSIZE: _FONT_SMALL _FONT_MEDIUM _FONT_LARGE
更关键的是,NHANES是一个AI就绪(AI-ready)的数据集。 这意味着,研究者可以通过应用程序编程接口(API)轻松地、自动化地提取和分析数据。 这种设计本意是为提高科研效率,但它也为“数据挖掘”和批量生产论文打开了方便之门。
斯皮克团队认为,他们的研究结果很可能严重低估了问题的规模。他们的检索范围局限于符合利用NHANES的单因子研究。但更宽泛的搜索显示,仅在一年之间,使用 NHANES 数据发表的论文数量就从2023年的4926篇增长到了2024年的7876篇。
来自美国西北大(专题)学的研究者瑞兹·理查森(Reese Richardson)一直关注论文工厂的动向。他在一次快速检索中,就发现了5篇未被斯皮克团队纳入的 NHANES 论文,这些文章与某个可疑论文工厂有关联。它们的写作结构与斯皮克所识别出的论文非常相似,同样是围绕 NHANES 数据中的单一变量与某种疾病的简单相关性展开,例如电子烟使用与肺部疾病之间的关联[2]。
以“临床公共数据库挖掘”为关键词,在中国社交媒体平台上不难搜到大量提供服务的公众号。其中除了本文提到的 NHANES 数据库,GBD(Global Burden of Disease,全球疾病负担研究)等数据库也频繁出现在这些平台的推文和案例中,成为热门的数据来源。
这类公众号大多提供多种模式的服务,例如:根据研究主题协助下载公开数据,完成统计分析,撰写数据分析报告,或在已有数据和主题的基础上提供论文思路和写作指导。一些平台还进一步打出“全流程陪跑”的口号,从选题、分析到英文润色,覆盖论文写作的各个阶段。
在一些平台的广告中,造假的暗示已非常露骨。例如有平台写道:“因公共数据库的开放性,我们提供的统计服务可不断更换研究主题,挖掘数据,直至分析出发表级的统计分析结果,并可提供中英文的方法和结果。”换句话说,就是以发表为目标,围绕数据库中的变量反复组合、拆解、筛选,直到跑出一组足够显着的结果。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见