【科技日报】以AI4S赋能凝聚态物质科学发展
2026-01-15
文章来源: 科技日报

  当前,全球科技竞争正向基础研究与前沿交叉领域纵深推进,人工智能驱动科学研究(AI for Science,AI4S)正成为实现高水平科技自立自强、重构科学研究范式的核心引擎。凝聚态物质科学与量子科技、新能源、新材料等产业紧密相关,在这一领域深度推进AI4S,直接关系到我国能否突破关键核心技术瓶颈,为培育新质生产力奠定坚实的科学基础。

  凝聚态物质科学领域发展AI4S面临挑战

  凝聚态物质科学包括实验制备、表征测试、规律发现和理论解释等相对独立的环节,过程高度依赖研究者经验与直觉,存在试错成本高、研发周期长等局限。随着研究体系日趋复杂及学科交叉需求日益迫切,传统模式的瓶颈愈发凸显。AI4S推动科研从“人力密集型”经验试错转向“数据与智能密集型”理性设计与预测。这一范式转变不仅能大幅提升研发效率、缩短从基础研究到产业应用的周期,更有望通过解析高维复杂关联,催生新的科学发现与理论体系。

  然而,凝聚态物质科学是典型的“小数据、大科学”,发展AI4S面临一系列挑战,主要集中体现在数据、技术与创新生态三个层面。

  高质量科学数据是AI4S的基石。目前,科研人员正通过构建数据汇聚与融合平台整合凝聚态物质科学数据,为AI模型性能的优化奠定坚实数据基础,其技术路径主要包括:在底层打通从大科学装置到数据平台的自动采集通道,确保数据源头可用、可管;在上层对多源异构数据进行汇聚、治理、标注与标准化,逐步构建跨学科、高质量的“AI-Ready”数据体系。尽管如此,凝聚态物质科学数据依然存在资源匮乏、孤岛化严重、数据量不足、标准不一、缺乏有效数据汇聚机制和工具、难以形成适合AI训练的优质数据集等问题,需进一步完善自动采集与全生命周期管理体系。

  数据治理技术是AI4S的驱动力。目前,一些研究团队正着力开发高效的数据处理算法与工具,提高数据治理的智能化水平,并充分发挥数据效能,支撑更多前沿突破。在月壤中首次发现含分子水的新矿物、实现十万量级新拓扑绝缘体的高效筛选、高温超导材料磁通钉扎智能设计与实验验证等,都彰显了数据智能应用在推动科学进展中的重要作用。然而,在科研实践中,凝聚态物质科学仍存在数据采集与处理自动化程度较低的问题,研究人员还需要花费大量时间在数据收集、清洗、整理等重复劳动上,流程没有系统化、智能化,严重制约科学研究效率。

  数据创新生态是AI4S持续发展的保障。研究人员正着力构建支持数据共享与协同的研究平台与社区,建立覆盖“数据—评测—应用”全流程的标准化体系,推动研究过程可追溯、结果可比较、协作可信任,并以此培育开放协同的创新生态。目前,已有相关实践初步展开,例如覆盖晶体材料拓扑分类、XRD智能结构解析等模型的标准化评测体系,有效支撑了规模化、协同化的数据驱动科技创新。然而,数据创新生态所必需的数据基础设施、存储算力、标准协议、共享机制、协同机制等基础支撑仍显不足,导致数据流通不畅、协作效率低,跨团队协同创新能力还有待进一步加强。

  多方发力促凝聚态物质科学数智化发展

  凝聚态物质科学数智化发展已成为全球主要经济体的国家战略。美国“创世纪计划”、英国“国家AI战略”等国家级战略布局,均将凝聚态物质科学与人工智能的深度融合置于核心位置,通过建立大规模、高质量的凝聚态物质数据库,并推动其与生成式AI的深度融合,以此变革研发范式,抢占信息、能源等关键领域的科技制高点。我国在该领域也进行了积极探索。以中国科学院凝聚态物质科学数据中心为例,通过前期部署,系统推进实验、理论和计算数据全链路的研发与整合,目前该中心已在软硬件平台、高质量数据集、数据标准、智能应用与生态共享等方面取得了系统性进展。

  面对AI4S的发展大势,为进一步在凝聚态物质科学领域推动AI4S,我国凝聚态物质科学数智化发展应从以下几方面着力。

  一是构建标准化、高质量的国家级数据基座。推进数据链的前后端协同建设:前端建设科学数据工厂,以提升标准统一的高质量科学数据的产出效率;后端建设自主实验室,加快数据赋能材料创新的场景探索和实际落地。

  二是持续推动科学数据基础能力建设。重点强化数据采集、治理、应用和共享服务,增强数据平台与实验设备的结合,开发智能化数据采集工具,探索“计算—实验”迭代优化模式,支撑前沿科技创新与重大成果产出。

  三是营造开放、协同、可持续的数据生态。通过降低数据使用门槛、明确权属收益机制、强化培训服务,将“不敢、不会、不愿、不便”转化为“敢用、会用、愿享、便取”的新格局。

  四是构建“产学研用”深度融合的创新联合体。完善从数据源头到应用市场的全链条数据生态,推动科学数据应用的市场化运作,前瞻布局数据产品、智能软件、解决方案等多元化服务模式,为实现科学数据平台长期自主运营与价值创造奠定基础。

  数据科技的突破将直接增强我国在凝聚态物质科学领域的自主创新能力和国际竞争力。面向未来,需系统推进数据基础设施建设与生态培育,强化高质量数据供给与智能工具赋能,支撑量子材料、新能源等关键领域的源头创新,为我国加快实现高水平科技自立自强、发展新质生产力提供坚实的数据基石和持续的创新动力。

  (作者系中国科学院物理研究所研究员、中国科学院凝聚态物质科学数据中心主任翁红明)

来源:https://epaper.stdaily.com/statics/technology-site/index.html#/home?isDetail=1¤tNewsId=f280e0001602416e8f6af050c834ba6c