在2020年,诺贝尔化学奖得主Frances H. Arnold教授的一篇Science论文因部分关键实验数据缺失而被撤稿。对此,Arnold教授在推特上坦诚承认了这一问题,并表示这是她科研生涯中的一次深刻教训。实际上,因数据处理失误导致的撤稿并不少见,而这类撤稿通知通常缺乏具体细节,让作者在懊恼之余更加无从理解。
一、数据处理失误的类型
2025年1月,Nature杂志发布了题为《因诚实错误而造成的撤稿令研究人员感到极度压力》的文章。通过对6680份调查问卷的分析,总结出了5种常见的数据处理失误。研究人员通过Retraction Watch数据库,识别出5041篇因数据处理错误而被撤回的论文,并向6680名作者发送了调查问卷,以了解他们对撤稿原因的看法与分析。最终,从97个有效回复中总结出以下五种最常见的数据处理错误:
- 数据处理和分析错误(19%):在数据建模或统计分析中出现错误,导致实验结果偏离实际。
- 数据编码错误(14%):在脚本编写阶段,错误的变量定义可能直接影响分析的结果。
- 数据文件丢失(11%):原始实验数据未妥善保存或备份,导致无法重现研究。
- 数据输入错误(11%):手动录入数据时可能出现误输入、漏输或单位不一致等错误。
- 数据命名不当(8%):文件命名不清晰或不规范,导致数据处理时的错误。
其他类型的错误还包括:数据传输错误(7%)、错误的报告(6%)、编程错误(4%)、文件不充分或不正确(4%)等。造成这些失误的常见原因包括注意力不集中(14%)、技术性问题(13%)、沟通不畅(12%)、粗心大意(11%)以及缺乏经验(9%)。
二、如何避免数据处理失误?
为了减少数据处理失误的发生,科研团队应采取以下措施:
- 明确数据管理责任:项目中应指定专人负责数据管理,确保责任落实到位。
- 定期培训与学习:对数据管理和相关工具进行定期培训,以提升团队的技能水平。
- 引入双重核查机制:在数据提交前进行第二次审查,以减少因粗心导致的错误。
- 加强技术支持:购买可靠的存储设备,并使用自动化备份工具,确保数据安全。
此外,作者们希望期刊能够给出更明确的指引,说明哪些失误会导致撤稿,哪些可以通过修改来补救。这对于作者与编辑而言都至关重要。与其因撤稿而感到懊恼,不如提前做好预防措施:认真对待数据细节,谨慎处理每个环节,每位科研工作者都应保持对“数据”的高度关注。南宫28NG相信品牌力量,助您在科研上走得更稳、更远。
你是否有过“数据翻车”的经历呢?欢迎关注南宫28NG,并留言分享你的故事!