加入我们  |   English  |  常见问题 
 
 首 页 新闻动态 主要任务 成员风采 了解ICCBG 加入ICCBG
当前位置:Home > 新闻动态 > 科研进展
昆明植物所揭示植物基因组数据共享严峻现状,提出实现数据共享的可行路径
时间:2026-01-09  来源:昆明植物研究所  作者:杨昊  点击:

  自2000年首个植物基因组发表以来,全球已发表超过1500种植物的基因组数据。尽管开放科学和FAIR数据原则(Findable, Accessible, Interoperable, Reusable)已逐渐成为共识,但在实际数据共享过程中,仍普遍存在数据可获取性不足、共享标准不一致等问题,严重制约了其潜在价值的充分发挥,并影响科学研究的可重复性。因此,系统性地分析与评估当前植物基因组数据共享现状,对于推动其科学利用与发展至关重要。

  近日,中国科学院昆明植物研究所马永鹏研究员专题组基于PubPlant数据库,系统收集并整理了2018至2024年间发表的1717篇植物基因组论文,这一时间跨度覆盖了植物基因组测序技术快速迭代与基因组资源集中增长的关键阶段。为了评估基因组数据的共享情况,研究团队对这些论文中的原始基因组测序数据(Raw data)、组装数据(Assembly data)和注释数据(Annotation data)公开情况进行逐一核查。分析显示,植物基因组数据的公开情况令人担忧:高达40.83%的论文未能同时公开这三类数据。其中,注释数据未公开率最高,达34.07%,远超原始数据(16.07%)和组装数据(13.28%)。研究还发现,即使在论文发表后,通过邮件联系作者获取未公开数据也极为困难:近70%的数据请求未能成功,反映出当前数据共享机制在实践中的严重不足。

  为进一步分析影响这三类数据公开率的关键因素,研究团队采用多变量Firth校正逻辑回归模型(multivariable Firth-corrected logistic regression)和似然比检验(Likelihood Ratio Test)等多种统计方法,量化了期刊、国家、分类单元及基因组大小等因素对数据公开率的解释力度。统计结果显示,对于所有三类数据,“期刊效应”(Journal Effect)对数据是否公开的解释力度最高,显著强于“国家效应”(Country Effect),这表明期刊的数据政策在推动数据共享方面起着更关键的作用。

  为解决上述问题,研究团队呼吁科学共同体中的关键参与者:期刊、政策制定者、数据库平台、作者、审稿人以及读者,共同积极推动基因组数据的开放共享。建议通过在论文发表流程中核验数据真实性与可访问性、完善注释数据提交规范、鼓励同步公开标准化注释文件及质量控制信息,以提升数据共享的可用性;同时提出资助政策、数据库支持、审稿核验及规范引用与再利用实践等方面的建议。相关成果以Plant genome data sharing: a call towards fully open access为题在线发表于植物学知名期刊Plant Communications。中国科学院昆明植物研究所硕士研究生杨昊和博士后刘雄芳为论文共同第一作者,马永鹏研究员与博士研究生张仁纲为共同通讯作者。中国科学院西双版纳热带植物园硕士研究生罗贞参与了该工作。该研究获得了国家自然科学基金林草联合基金重点项目(U2571210)和中国科学院昆明植物研究所战略先导科技专项(KIBXD202401)等项目的支持。

  文章链接

  图1 植物基因组数据共享情况总览。A.三种数据类型公开与非公开数据比例; B.2018年至2024年非公开数据的年变化情况; C.按出版数量排序的前十种期刊的数据共享状态; D.按出版数量排序的前十个国家的数据共享状态; E.按期刊和国家分类的数据可用性气泡图; F. 基于似然比检验(LRT)比较国家与期刊在数据共享中的解释力。

 

相关信息:

No Related News
【打印本页】【关闭本页】
新闻动态
综合报道
工作进展
成员消息
科研进展
国际园讯
视频新闻
推荐资讯  
最近更新  
热门点击  
Copyright © CUBG 2013-ICCBG 2022 - 中国植物园联合保护计划办公室   滇ICP备13004273号-2   地址:云南省西双版纳州 勐腊县 勐仑镇   电话:0691-8713331   
关注微信