问题——“看得见的多样性”缺少“看得清的遗传底图”。
植物构成地球生物量的主体,支撑着人类食物、纤维、药用资源以及生态系统稳定。
然而,尽管拟南芥等模式植物基因组的发布开启了植物基因组时代,迄今全球陆地植物仍存在巨大的参考基因组缺口:大量目、科、属乃至绝大多数物种缺乏高质量遗传“底图”,导致植物类群之间的关键亲缘关系、分化时间与性状演化脉络难以被精确解析。
与此同时,物种加速消失的现实压力叠加气候变化、栖息地破碎化等因素,使得“在消失前理解并保存”成为紧迫命题。
原因——样本、数据与方法的“三重瓶颈”长期叠加。
一是样本获取与标准化难度高。
植物类群庞大、分布广泛,一些关键类群处于高山、岛屿、热带雨林等区域,采集、保存、溯源与共享存在天然门槛。
二是基因组复杂性突出。
植物基因组常见多倍化、重复序列丰富、结构变异频繁等特征,决定了高质量组装与注释成本更高、技术链更长。
三是数据零散导致系统推断不稳。
过去的基因组与转录组数据分散在不同研究中,覆盖不均、质量参差,使得系统发育推断、性状关联与功能预测容易出现“拼图缺角”,一些进化“节点”长期悬而未决。
随着测序、比较基因组、进化基因组及计算方法的迭代,叠加交叉学科融合与长期积累,推动发起面向全谱系的系统性工程成为可能。
影响——基础科学与现实需求在此交汇,成果外溢效应可期。
其一,服务粮食安全与农业育种。
对野生近缘种、耐逆植物以及特色作物的遗传解码,有望更快锁定抗旱耐盐、抗病虫、养分高效利用等关键基因与调控网络,为新种质创制和精准育种提供靶标。
其二,支撑生物多样性保护与生态修复。
厘清物种谱系位置与分化时间,可为保护优先级评估、濒危机制解析、种群管理与生态恢复提供科学依据。
其三,拓展医药与生物制造的“天然化学空间”。
植物次生代谢途径蕴含大量活性分子,系统化的基因资源库将为新药发现、功能成分开发与合成生物学应用提供源头创新。
其四,推动生命科学研究范式升级。
由零散知识走向系统知识,有助于从“发现现象”走向“总结规则”,提升对植物形态、气味、开花等复杂性状的机理解释力与可预测能力。
对策——以“补齐谱系缺口”为牵引,构建高质量、可共享的全球植物基因资源底座。
据项目负责人之一、中国农业科学院深圳农业基因组研究所研究员王丽介绍,计划将面向缺乏参考基因组的关键目、科、属开展采样,运用系统发育基因组学等方法,构建高分辨率、时间校准的完整陆地植物系统发育树,从而绘制更完整的“植物生命之树”。
中国植物学会理事长种康表示,生命科学进步与新技术应用,加上交叉学科融合与基础积累,为该计划实施提供了现实条件。
参与研究人员认为,下一步工作的核心,一方面是获取覆盖更广、质量更高的样本与基因图谱,另一方面是对基因功能进行系统注释与规律提炼,进而把“序列数据”转化为可解释、可应用的知识体系。
哈尔滨工业大学教授王亚东表示,相关计算方法可用于基因功能注释、未知序列与元件功能预测,并辅助发现进化规律。
前景——以十年为尺度推进阶段性成果,向“规则库”“语料库”升级。
中国科学院植物研究所所长汪小全介绍,目前针对被子植物的解码工作正在推进,计划用10年左右时间取得阶段性成果。
业内人士指出,类似国际大科学计划的组织方式,强调长期投入、开放协作和标准体系建设:既要形成可持续更新的高质量基因组与系统发育数据集,也要建立可复用的分析框架与共享平台,让更多研究机构在统一标准下开展比较研究。
随着数据规模扩大,未来有望形成前所未有的数字化植物基因资源“语料库”,促进对植物“共同语言”——隐藏在DNA序列背后的调控逻辑与编码规则——的系统识别,为应对全球性挑战提供更坚实的科学支撑。
从160多年前孟德尔发现遗传定律,到30多年前人类基因组计划开启生命科学新纪元,人类对生命奥秘的探索从未止步。
如今,植物星球计划的启动,标志着生命科学研究视野从人类自身拓展至整个植物王国。
这不仅是一次科学探索的壮举,更是人类文明在面对全球性挑战时展现的远见与担当。
当我们真正读懂植物在数亿年进化中书写的生命密码,或许就能找到与自然和谐共生的智慧钥匙。