第六届先进光源中子源科学数据与软件研讨会

Asia/Shanghai
中环102报告厅 (HEPS高能同步辐射光源)

中环102报告厅

HEPS高能同步辐射光源

北京市怀柔区
会议主席:董宇辉 , 会议联席主席:刘啸嵩 中国科学技术大学 , 会议联席主席:陈刚
Description

       第六届先进光源中子源科学数据与软件研讨会将于2026年6月22-26日在北京市怀柔区召开,会议由国家高能物理科学数据中心主办。

       先进光源与中子源是支撑国家重大科技战略的核心基础设施,为物理、化学、材料、生命科学等多学科领域的前沿研究提供不可替代的支撑手段。随着装置研发及先进实验技术的持续发展,相关数据呈现海量、多模态、高维度等特征,同时具有稀缺性、独特性和不可再生性,已成为重要的国家战略科技资源。本次会议将围绕设施运行及总体进展、信息化基础设施、装置控制与数据获取、运行数据与科学数据管理、科学数据处理、公共信息服务及人工智能等方面的最新进展,开展技术交流与研讨。

        诚挚邀请您莅临参会!

 

一、会议日期与地点

会议日期:2026年6月22-26日(22日报到,23-25日会议报告,26日离会)

会议地点:北京市怀柔区HEPS高能同步辐射光源中环102报告厅

 

二、会议注册及相关费用

1、会议注册

  请点击左侧栏目“注册参会”进行会议注册。线上注册的截止时间为6月14日

2、会议注册费

(1)早享优惠2026年6月5日止:职工及博士后1600元,学生1000元。

(2)标准注册费2026年6月6日起:职工及博士后2000元,学生1400元。

3、付款方式

  请点击左侧栏目“会议费缴纳”进行缴费,会议注册流程须完成缴费后方可正式生效

 

 

Participants
  • Bo Zhuang
  • Chen Huang
  • Fengyao(丰尧) HOU(侯)
  • Gholamhossein Haghighat
  • Haoxu Li
  • Jianshe 曹建社
  • Li Wang
  • Qi Luo
  • Wei Zheng
  • Wenshuai文帅 Wang王
  • Wujun Shi
  • xiaoqian ren
  • Xiaowei JIANG Xiaowei
  • Yihe Pang
  • Zheng-De Zhang (张正德)
  • zhuo chen
  • 一 张
  • 世园 符
  • 世杰 李
  • 东宸 黄
  • 东晖 金
  • 东波 熊
  • 丰彦 谷
  • 为明 朱
  • 丽娜 赵
  • 书书 刘
  • 乾辉 牟
  • 云强 赵
  • 云霄 杨
  • 亚康 李
  • 仁忠 邰
  • 付成 蔡
  • 伟 宋
  • 伟 鲍
  • 佳 于
  • 佳伟 寇
  • 佳君 钟
  • 佳慧 张
  • 佳鸿 吴
  • 俊 程
  • 俊荣 张
  • 健 何
  • 光存 单
  • 兴忠 曹
  • 再禹 王
  • 冠群 蔡
  • 冬牛 王
  • 冬牛 王
  • 冶 陶
  • 刚 陈
  • 力源 伍
  • 功发 刘
  • 勇敢 聂
  • 华 李
  • 双 吕
  • 吉平 徐
  • 吴 小璇
  • 啸嵩 刘
  • 喀米力 阿卜力孜
  • 嘉成 吕
  • 国勇 秦
  • 圣奥 孙
  • 坦 张
  • 垚松 程
  • 声翔 王
  • 妮 杨
  • 娜 李
  • 娟 杨
  • 娟 陈
  • 子健 蔡
  • 宇 卢
  • 宇琨 熊
  • 宇辉 董
  • 安博 孔
  • 宏庆 王
  • 宏庆 王
  • 宗文 马
  • 小芸 李
  • 尧 罗
  • 平 怀
  • 庆梦 李
  • 建 庄
  • 建利 刘
  • 建巧 熊
  • 弈博 陈
  • 强 王
  • 彦明 王
  • 彦智 舒
  • 彦棡 王
  • 徐 涛
  • 德海 安
  • 志 刘
  • 怀正 杨
  • 思琦 侯
  • 怡 徐
  • 悦 周
  • 慧宾 常
  • 敏 李
  • 文耀 王
  • 文韬 戈
  • 新红 田
  • 方宇 廖
  • 旭 杨
  • 旭敏 殷
  • 明宇 闫
  • 明涛 康
  • 春雷 张
  • 春鹏 王
  • 晋 张
  • 晓东 张
  • 晓东 张
  • 晓东 李
  • 晓峰 张
  • 晓康 孙
  • 晓彦 胡
  • 晓琳 边
  • 晓飞 闫
  • 权 王
  • 权 郝
  • 杨杰 王
  • 杰承 刁
  • 林望 汪
  • 林轩 慕
  • 林静 李
  • 柳军 韩
  • 梅娟 于
  • 欢 赵今
  • 正恒 李
  • 殿斗 徐
  • 泉生 吴
  • 法制 齐
  • 洪 汪
  • 济舸 陈
  • 浩 王
  • 浩军 蔡
  • 浩凯 孙
  • 浩然 蒋
  • 海云 滕
  • 海力 肖
  • 涛 张
  • 清茹 米
  • 然 鄢
  • 煜辉 李
  • 爱国 李
  • 玮 丁
  • 珺怡 刘
  • 瑀 方
  • 瑞帅 柴
  • 申奥 高
  • 畏 吴
  • 留国 陈
  • 皓 胡
  • 眉娟 李
  • 磊 王
  • 科杰 游
  • 程宇 刘
  • 章玲 陈
  • 红梅 张
  • 红霞 张
  • 纯 李
  • 耀东 程
  • 聪聪 尹
  • 胡 庆宝
  • 舒远 李
  • 航 罗
  • 芹 袁
  • 苓竹 边
  • 英才 姜
  • 莎莎 卢
  • 菊萍 徐
  • 蒙 董
  • 蒙汉 刘
  • 蓉 杜
  • 蕾 雷
  • 虹 王
  • 誉 胡
  • 诗语 朱
  • 贺闯 李
  • 赵 昆
  • 超 张
  • 超 袁
  • 辰州 崔
  • 邱 勇翔
  • 铮铮 娄
  • 雅倩 牛
  • 雨樵 张
  • 雪婷 吴
  • 雯静 黄
  • 霁亮 刘
  • 静 叶
  • 飞 谢
  • 马 占文
  • 骐骁 马
  • 鹏 胡
  • 鹤云 王
  • 鼎文 陶
    • 1
      会议报到
    • 2
      闭门会议
    • 3
      开幕式
    • 装置总体介绍: 大会报告
      Convener: 刚 陈 (高能所)
      • 4
        高能同步辐射光源进展
        Speaker: 董宇辉
      • 5
        上海光源运行与智能化升级
        Speaker: 仁忠 邰
      • 6
        硬X射线自由电子激光装置建设进展
        Speaker: 刘志
    • 10:15
      茶歇 / Coffee Break(合影)
    • 装置总体介绍: 大会报告
      Convener: 刚 陈 (高能所)
      • 7
        中国散裂中子源运行及建设
        Speaker: 张俊荣
      • 8
        光源中子源数据和软件合作进展
        Speaker: 法制 齐 (高能所)
      • 9
        中国先进研究堆中子科学平台进展及应用介绍
        Speaker: 眉娟 李
    • 12:00
      午餐 / Lunch Break
    • 装置总体介绍: 大会报告
      Convener: 平 怀 (Shanghaitech University)
      • 10
        HIAF上智能化加速器控制平台软件
        Speaker: 付成 蔡 (中国科学院近代物理研究所)
      • 11
        服务于先进光源实验的第一性原理材料计算
        Speaker: 汪林望
      • 12
        冷中子三轴极化谱仪“行知”和广谱谱仪“博雅”的建设、运行及科研进展
        Speaker: 红霞 张 (中国人民大学)
      • 13
        中国蛋白质结构数据库的建设与进展
        Speaker: 权 王
      • 14
        数据期刊(DEBS)
        Speakers: UNKNOWN YU Jian, 刚 陈
    • 15:20
      茶歇 / Coffee Break
    • 数据管理与存储
      Conveners: 皓 胡 (高能所) , 蕾 雷 (上海科技大学)
      • 15
        面向AI的材料数据基础设施:模块化数据标准及其在同步辐射光源的应用

        随着人工智能技术的发展,材料科学已迈入“数据+AI”的第四范式。建立面向AI的国家级材料数据基础设施意义重大。同步辐射作为基础研究设施,是重要的数据来源,能够批量产生大量有价值的材料数据,其数据利用价值尤为突出。新范式下,数据使用转向高度定制化的“数据集”。因此,数据基础设施的核心并非静态汇聚,而是打造高维度、动态更新的标准化“全息数据源”,完整涵盖材料合成、表征与性能环节,从而按需源源不断地组合出高质量的 AI-ready 数据集。
        然而,构建全链条材料数据源面临巨大挑战。材料数据极具多样性与多变性,底层数据库难以提前预定大一统的信息结构。为此,CSTM《材料基因工程数据通则》提出了破局性的“可扩展模块化数据模型”。该模型犹如“乐高”积木,将制备工艺、表征测试及计算过程解耦为独立的“模块单元”,并建立严格的局部接口规范。研究者可自由调用和拼接这些模块,通过“全面的局部标准化”实现了复杂全链条数据的逻辑统一,赋予了数据系统极强的向后兼容力与生命力。
        这一模块化数据模型和标准在上海同步辐射光源得到了初步落地验证。目前,光源各实验站的数据采集遵循各自独立的系统规范。为打通数据壁垒、充分发挥CSTM模块化数据模型的整合优势,依托正在建设的多模态数据融合管理系统,光源以《重大科技基础设施平台 光子与射线实验数据元数据》、《材料基因工程数据通则》及其系列标准为依据,对各个系统采集的实验参数、样品信息及表征结果进行统一的标准化治理与整合,将分散的异构数据按模块化规范重新组织,逐步构建起可动态组合的“全息数据源”,为按需生成AI-ready数据集奠定基础。

        Speaker: 洪 汪 (苏州国家实验室,上海交通大学材料科学与工程学院,材料基因组联合研究中心,张江高等研究院)
      • 16
        上海光源AI4S科学数据底座建设

        上海光源作为先进的表征平台,在解析物质微观结构、动态行为及极端条件下物性方面具有不可替代的作用。面对实验数据量激增与用户对智能化实验日益增长的需求,上海光源正在系统推进大科学装置AI4S建设,旨在通过数据服务能力提上与人工智能技术应用革新大科学装置的运行与科学发现模式。本报告将介绍上海光源在智能设施架构与数据治理体系等方面的整体布局与实践进展。
        在智能设施架构方面,通过整合数据中心高性能集群与光束线边缘服务节点,上海光源已形成支持在线预处理与动态算力调度的“边云协同”智能算力底座。基于智能算力底座进一步研发自主可控的数据快速处理框架,深度集成于晶体学与成像线站数据处理流水线,大幅加速了数据处理效率。在数据治理体系方面,研制了覆盖上海光源用户实验全流程的大数据管理平台,统一元数据标准,实现从课题申请、实验执行到数据分析与共享的全生命周期管理。
        以此为基础,上海光源数字化智能化改造项目将进一步提升AI for Facility的基础底座能力建设,并实现光束线站智能调束、实验流程自动化与实时分析决策。未来,我们将以AI4S智慧光源为目标,进一步在AI模型底座,多智能体协同交互和AI模拟与实验验证融合方面开展技术攻关,推动形成“智能实验‑高通量表征‑数据挖掘‑科学发现”的闭环大科学装置科研新范式。

        Speaker: 春鹏 王 (中国科学院上海高等研究院)
      • 17
        PhotonZip:面向同步辐射光源的高效数据缩减技术与软件

        同步辐射光源实验产生的海量成像数据,给 I/O 与存储系统带来了巨大压力。现有压缩方案难以兼顾光源场景下对高吞吐、高保真及多算法灵活集成的需求。为此,我们研制了面向光源数据流的压缩工具包 PhotonZip。PhotonZip 从三个维度实现统一支撑:支持 CPU/GPU 异构环境的统一部署;覆盖无损与有损压缩的统一策略;集成传统与 AI 压缩方法的统一软件框架。在无损压缩模式下,PhotonZip 显著提升了压缩与解压缩速度,并大幅提高了数据 I/O 性能。通过提供 Python API 与 HDF5 Filter 等标准化接口,PhotonZip 构建了涵盖在线缩减、存储传输与后分析处理的完整工具链,为同步辐射光源场景下的数据压缩提供高性能、可扩展的软件解决方案。

        Speaker: 鼎文 陶 (中国科学院计算技术研究所)
      • 18
        先进光源科学数据管理软件框架DOMAS及面向HPES的应用与升级

        先进光源类大科学装置(包括第四代同步辐射光源与X射线自由电子激光等)具有高亮度、低发射度、高相干性等优异性能,能够支撑高通量、多模态、超快频率、原位及动态加载等前沿实验方法。随着此类装置的建成与运行,科学数据的总量与产出速率相比传统光源装置提升了3至4个数量级,年数据通量急剧增长,对数据管理提出全新挑战。
        为应对先进光源科学数据管理的重大需求,高能所计算中心数据团队自主研发了科学数据管理软件框架DOMAS。该框架核心功能模块包括:元数据访问接口可视化自动生成工具、数据传输模块、元数据提取与处理模块以及数据服务网站。目前,DOMAS已在多个大科学装置成功部署与应用,涵盖高能同步辐射光源(HEPS)、上海硬X射线自由电子激光装置、中国散裂中子源(CSNS)等,并拓展应用于空间粒子天体物理实验领域。
        自2025年底,高能同步辐射光源(HEPS)已完成项目验收并投入试运行。DOMAS为HEPS的试运行与用户实验提供了稳定、高效的数据全生命周期管理服务。同时,团队针对工程实践中遇到的具体问题,对系统进行了多项功能升级与优化,包括实施细粒度数据权限控制、优化数据上传流程、提升数据从磁带库取回的效率等,进一步增强了系统的稳定性与易用性,为后续大规模数据分析和共享奠定了坚实基础。
        本报告系统介绍DOMAS软件框架的整体设计,重点汇报其在HEPS应用中的最新升级进展,并探讨当前数据管理面临的关键问题。此外,结合人工智能技术的快速发展,报告也对未来科学数据服务模式的演进方向进行了展望。

        Speaker: 皓 胡 (高能所)
      • 19
        SHINE数据管理软件线站联调实践及相关算法进展

        硬X射线自由电子激光装置(SHINE)进入密集的线站安装联调阶段,实验数据不仅仅是采集落盘问题,而是贯穿实验提案、在线采集、事件构建、数据迁移、离线索引与长期保存的一整套流程。我们围绕SHINE实验数据管理软件系统(基于DOMAS构建),按装置科学数据管理策略,与线站数据采集(DAQ)、离线事件构建(Event Builder)协同,在SES TAP等线站开展了联调。联调中已跑通“采集-打包-迁移-数据按提案可见”的主流程,也暴露了存储挂载、目录权限设置等需要继续打磨的问题,为FEL-II各站的联调测试积累经验。
        在此框架下,我们同步推进两类与数据管理直接相关的算法研究工作。
        一是数据压缩算法。面向高重频带来的高通量原始数据,传输带宽与离线存储容量将是必须考虑的因素。我们开展衍射成像数据压缩算法研究,目标是在可控科学误差下减轻传输与归档压力。针对单颗粒成像等实验图像数据背景噪声大、有效信号稀疏等特点,探索根据探测器背景水平设定误差界的压缩方案,并在LCLS、EuropeanXFEL等装置的公开数据样例上进行了测试,初步显示单文件压缩比达到约10倍量级。后续将结合SHINE实际数据格式,提升数据压缩效率,并评估其嵌入数据迁移与归档流程的可行性。
        二是数据质量评估算法。我们规划以串行飞秒晶体学SFX实验为切入点,开展结构数据质量评估工作。参照CrystFEL社区以及wwwPDB审校惯例,在数据合并与结构模型阶段建立可重复检查项,并与PDB China新一代审校流程衔接,使线站产出数据在入库后仍有清晰的质量依据。

        Speaker: Lei Lei
      • 20
        HEPS存储系统运行与新特性

        中国高能同步辐射光源(HEPS)已于 2025 年底完成设施建设,截止目前已经完成了多轮调光测试与数据采集。根据测试情况,来自不同领域的上层应用呈现出跨平台分析、数据访问不可中断、短时高速数据产生等特征。这对数据存储系统的兼容性、可用性以及聚合读写性能提出了挑战。我们在“热-温-冷”三层存储架构的基础上,通过拓展各个组件的能力来满足应用需求。例如采用TCP & RoCE并行网络架构、双活共享存储、部署HA软件等

        Speaker: 垚松 程 (高能所)
      • 21
        CSNS实验数据存储与数据管理系统的现状及规划

        随着中国散裂中子源(CSNS)合作谱仪的开放运行及CSNS-II谱仪的建设,其数据量预计超2PB/年,且作为用户类装置,其数据来源广、涉及学科多、计算复杂度高。为了整合这些数据资源,实现数据从采集->传输->存储->分析->共享->知识发现的全生命周期的管理,CSNS基于Lustre和EOSCTA建设分级存储系统,并为支撑未来光源与中子源数据的融合分析及跨装置共享使用,将数据管理平台由ICAT向DOMAS数据管理与编排框架演进。本文首先介绍CSNS的数据存储现状,在存储体系方面,CSNS采用分级存储架构,满足数据全生命周期的差异化需求。中心存储基于分布式文件系统Lustre,实现实验数据及分析数据的存储;后端归档层基于EOSCTA和CTS,通过策略驱动机制,保障海量数据的长期、低成本与安全保存。然后介绍了数据管理系统DOMAS的设计和在CSNS中的实现,完成从数据产生、重建、规约到用户分析的一体化统一管理,深度融合实验提案、样品信息、仪器参数、分析过程及原始数据等多源异构数据,构建以科学实验为中心的数据视图。最后对CSNS的数据存储与数据管理系统进行总结,并提出对未来的展望,该系统将直接服务于三大应用场景:面向用户的一站式数据分析、支撑AI模型训练的标准化数据集构建,以及中子领域的专业知识库与数据库建设。

        Speaker: UNKNOWN 陈娟
      • 22
        面向储能材料的局域结构数据整理与数据库构建

        本报告围绕以储能材料为主的局域结构数据库(Local Structural Database, LSD)的初步建设工作,介绍近期基于现有超胞结构数据开展的数据整理、结构归档与数据库框架构建进展。针对已有CIF结构文件和能量排序结果,建立材料体系、计算任务、原始CIF、超胞构型及库仑能量排序之间的对应关系,完成低能、随机和高能三类构型数据的统一提取与汇总,形成可用于检索和统计分析的结构-能量索引表。在此基础上,初步搭建以MongoDB为核心的数据库框架,实现材料、任务、构型、能量及文件路径等基础元数据的入库管理,并形成面向后续局域结构描述符扩展的基础数据模型。相关工作为后续开展局域结构编码、结构描述符提取及结构-性能关联分析奠定了数据基础。

        Speaker: Junyi Liu (IHEP)
      • 23
        华为全闪存&AI数据湖存储解决方案
        Speaker: 陈琳
    • 24
      合肥先进光源建设进展
      Speaker: 刘啸嵩
    • 装置控制与数据获取
      Convener: 功发 刘 (高能所)
      • 25
        MatElab:物质科学数据采集系统与智能科研平台

        MatElab:物质科学数据采集系统与智能科研平台

        Speaker: 泉生 吴
      • 26
        SHINE束线站定时与数据采集

        定时与数据采集系统是SHINE装置实现高精度实验控制与高速数据获取的核心基础设施。该系统需支持超过24种设备类型,涵盖定时触发、泵浦-探测激光控制、光学诊断、实验站仪器控制等功能。核心目标包括:基于Bunch-ID实现最高100kHz的数据采集速率,集成加速器与环境数据,并提供用户友好的统一图形界面。
        依托White Rabbit(WR)高精度定时架构与EPICS/Bluesky软件框架,近年来围绕定时系统部署、多实验站DAQ软件开发、事件构建与数据管理平台等方面开展系统性研究与集成测试。其中,定时系统提供亚纳秒级同步精度与皮秒级抖动;DAQ软件覆盖SES、AMO、SSS、HSS、CDS等多个实验站及PAM、WFS、PES、GMD/Hamps、Imager等诊断设备;事件构建模块实现多源数据融合与统一存储。报告将介绍定时与DAQ系统原理、集成测试进展与典型应用成果,为SHINE装置高性能运行提供方法支撑与实践参考。

        Speaker: 聪聪 尹
      • 27
        上海光源加速器控制系统运行优化与国产化升级研究

        上海光源(SSRF)作为高性能同步辐射光源装置,其控制系统是保障束流稳定、设备安全与高效供光的核心支撑。针对控制系统在长期运行中出现的硬件老化、通信瓶颈、操作系统停止服务及关键器件进口依赖等问题,展开了系统性升级改造与运维优化工作。通过将传统VME电源控制架构替换为SoftIOC及以太网分布式架构、升级插入件前馈控制系统、控制网络交换机升级改造、搭建高精度时标系统与历史数据平台、研制国产处理器IOC控制器并使用国产Linux操作系统,全面提升了系统稳定性与自主可控水平。对比2022年和2025年运行数据,控制系统年故障次数由29次降至8次,影响束流时间由4.29小时降至1小时,MTBF(平均无故障工作时间)由292小时提升至973小时,运行稳定性显著提升。该工程实践可为同步辐射光源及同类大科学装置控制系统的长期运维、技术升级与国产化替代提供参考。

        Speaker: 鹤云 王 (中国科学院上海高等研究院)
      • 28
        200TW激光尾场电子加速器控制系统

        200TW激光尾场电子加速器控制系统

        Speaker: 雨樵 张
      • 29
        合肥光源光电子能谱实验站自动化控制改造

        随着合肥光源(HLS-II)重大维修改造的顺利完成,装置性能得到了极大提升,传统依赖人工控制的谱学实验方法已经无法满足装置连续实验的控制需求。同时,合肥光源光电子能谱实验站(BL10B)样品与光斑对齐依靠实验站科学家通过监控画面手动调节样品台完成,耗时较长且精度无法保证。为应对样品种类多、测试需求量大,以及人工操作复杂、经验依赖强、对齐精度和效率低等问题,本工作对HLS-II BL10B进行了自动化控制改造,开发了自动对光控制系统。
        针对BL10B超高真空实验环境以及低照度图像的观测需求,工作提出一套面向光电子能谱实验的视觉识别与定位方法,实现了谱学表征位点的三维空间定位、基于实验序列的样品台移动路径规划及自动样品切换功能。该系统已投入正式使用,实际运行结果表明,实验的对光效率至少提升5倍、平均定位误差小于0.45 mm,有效解决了对光效率与精度差、装置机时利用率低的问题,提升了BL10B谱学实验的自动化水平,也为合肥光源后续实验站的控制自动化升级提供了经验借鉴与方法参考。
        下一步,系统将联合已安装的飞扫控制系统在线调试,实现能量扫描、样品切换及数据采集的全流程自动化,为实验站的智能化升级与 AI 赋能科学实验(AI4S)奠定工程与算法基础。
        关键词:光电子能谱实验站;自动对光;超高真空;三维空间定位;飞扫;全流程自动化

        Speaker: 圣奥 孙 (中国科学技术大学国家同步辐射实验室)
      • 30
        深信服在AI Infra的业务创新成果介绍
        Speaker: 浩斌 李
    • 10:25
      茶歇 / Coffee Break
    • 装置控制与数据获取
      Convener: 蓉 杜 (高能所)
      • 31
        基于代理模型的光束线智能调优方法研究

        目的:同步辐射光束线的性能对于实验的有效开展至关重要。合肥光源(Hefei Light Source,HLS)是一台专用真空紫外和软X射线同步辐射装置,共振软X射线散射线站(BL05U-B)为软物质材料的微观结构与成分表征提供重要的实验平台。由于光束线结构高度复杂,手动调优通常需要数小时甚至更长时间。智能调优方法能显著提高效率,但实际在线测试机会有限。因此,亟需开发虚拟光束线平台以开展智能调优的方法研究与验证。

        方法:本研究基于实验物理与工业控制系统(Experimental Physics and Industrial Control System,EPICS)架构搭建虚拟光束线平台。利用XRayTracer(XRT)束线追迹软件构建BL05U-B的仿真模型,并生成虚拟光斑预测模型的数据集。为了充分利用这些数据,采用K折交叉验证方法训练基于神经网络(Neural Network,NN)的虚拟光斑替代模型。在此基础上,对两个模型应用智能调优算法,以优化光束性能。

        结果:NN替代模型将调优的收敛时间从小时级缩短至分钟级,且两者优化后得到的光通量与分辨率几乎一致。相较于XRT仿真模型,NN替代模型将计算时间缩短至原来的1/3000,大大提高了虚拟光束线平台的实时性。

        结论:本文提出的虚拟光束线平台为智能调优方法的离线测试提供了安全、高效的调试环境,并为后续在物理光束线上的软件部署与在线调优奠定了基础。当前替代模型与物理实体之间仍存在一些差异,但该平台有望为自主调优实验提供支撑,进一步提高大科学装置的运行效率。

        Speaker: 佳慧 张 (中国科学技术大学)
      • 32
        SHINE加速器控制与数据平台

        本报告以SHINE加速器为背景,围绕其复杂运行环境下控制与数据管理的核心需求,构建了一套覆盖底层控制、平台支撑与智能分析的全栈式技术体系。在控制系统方面,基于硬件设施与虚拟化集群,实现了统一、高可用且弹性可扩展的控制平台。在数据层面,采用Archiver Appliance多节点集群化配置实现过程数据的高可靠记录,采用HDF5格式进行波形数据和图像数据的采集与管理,并基于Phoebus/alarms与MPS联锁信息构建综合报警系统。在此基础上,建立多模态分析平台以支持多样化统计与分析任务,并专门开发了定时系统分析诊断平台与联锁系统故障智能分析平台,分别用于运行异常的定期诊断与联锁事件的根因定位。进一步地,引入数字孪生技术实现装置状态的实时映射与预测分析,并对未来AI技术在智能决策、故障预测及运行优化等方面的应用进行了展望。

        Speaker: 清茹 米 (中科院上海高等研究院)
      • 33
        从实时处理到实时调控:HEPS实验数据在线处理的探索与实践

        先进光源、中子源等大科学装置正面临数据通量的爆发式增长,线站科学家对与数据获取高度耦合的实时在线处理及闭环调控需求日益迫切。本报告将介绍我们在高能同步辐射光源(HEPS)上,从实时数据处理到实时实验调控的渐进探索与实践。相关工作旨在帮助实验站及时获取数据反馈、辅助实时决策,甚至直接干预实验流程,让数据在产生的第一时间发挥最大价值。实时处理与离线处理各有所长、相互补充。

        首先,在高分辨谱学线站(ID33),针对X射线拉曼散射(XRS)和共振非弹性散射(RIXS)实验,我们开发并部署了数据在线组装与处理算法,完成了带光调试,且RIXS在线处理流程已面向用户开放,实现了实验数据的实时处理,为实时调控奠定了基础。在此基础上,我们于硬X射线纳米探针线站(ID19)将在线分析向前推进一步——在Ptychography CT实验中穿插一维荧光谱(XRF)扫描,通过更新实验控制与数据采集软件Mamba的前端客户端功能,实现从数据实时分析走向实时调控:在线分析结果直接触发运动控制,实现自动找样与样品对准。在实验过程中主动干预和调控,免去了大范围扫描无实际样品区域的麻烦。目前该工作正根据这一轮调光进度安排带光测试。最后,我们归纳上述实践,提炼出这种从实时处理到实时调控的在线方法范式,认为其具有相当的通用性,未来可推广至更多实验模态的数据获取与在线调控过程中。谨分享我们在HEPS数据在线处理方面的探索与实践,希望能为相关同行提供参考和启发,期待与各位专家进行更深入的交流。

        Speaker: 纯 李
      • 34
        智能化的Nano-ARPES实验控制与数据采集软件

        报告HEPS-BC实验控制与数据采集软件的框架及现状,以及K-means聚类算法与软件的结合。

        Speaker: 苓竹 边
      • 35
        SHINE AMO实验站数据采集软件及联调测试介绍

        原子分子反应成像(AMO)实验站是上海硬 X 射线自由电子激光装置(SHINE)束线站总体首批规划建设的实验站之一, 可以实现在飞秒时间尺度和原子空间尺度上直接观察复杂原子分子反应过程。AMO实验站多功能成像系统的主要探测设备包括微通道板(MCP)、延迟线(Delay line)和时间数字转换器(TDC)。其中MCP和延迟线用于记录反应过程中产物粒子的飞行时间,后续从这些数据可以重建出这些粒子的三维动量;TDC的功能则是把MCP和延迟线的探测信号转换成时间信号输出来。AMO实验站数据采集软件的核心功能就是把TDC产生的数据读取出来保存到本地,同时还需要兼顾与控制系统、定时系统、在线分析系统、数据管理系统等软件的联动。本报告将介绍TDC数据采集软件的需求分析、架构设计、技术路线、测试结果以及与其它软件的联调测试结果。

        Speaker: 晓峰 张 (ShanghaiTech University)
      • 36
        STARLIGHT像素探测器高通量数据获取系统研制

        STARLIGHT 为一款在研的主要面向 SHINE 高重频 XFEL 应用需求的大面阵、高帧频 X 射线像素探测器。该探测器预计产生的超高通量数据(STARLIGHT1-4M@10kHz,80GB/s)对读出电子学和数据获取系统均提出了巨大挑战。数据获取系统对接读出电子学,负责配置命令的下发和高通量数据的接收及处理等。本报告将主要介绍 STARLIGHT数据获取系统的软硬件研制进展,包括 STARLIGHT0 上位机软件的开发和应用情况,以及针对STARLIGHT1的近百 GB/s 超高通量数据获取的方案设计和实施进展。

        Speaker: Zhengheng Li (上海科技大学)
    • 12:15
      午餐 / Lunch Break
    • 人工智能
      Convener: Chenzhou Cui (University of Chinese Academy of Sciences)
      • 37
        从高端仪器到大科学设施:AI4S的框架构建与工程实践
        Speaker: 泽中 张
      • 38
        人工智能赋能科研的共性问题与挑战

        人工智能赋能科研的共性问题与挑战

        Speaker: Linjing Li (CASIA)
      • 39
        先进光源智慧化建设的思考与进展

        以同步辐射光源、中子源为代表的平台类核技术大科学装置能够支撑国家重点产业需求与安全保障任务,通过深度融合人工智能、数字孪生、多智能体与科学大模型等新兴技术,这类国家大科学平台将重塑形成自主智能研究范式。本报告基于同步辐射光源智慧化布局的思考探索,具体论述多技术联用实验方案智能推荐、线站实验智能化自动化调控、高维实验数据挖掘理解等光源智慧化建设进展。

        Speaker: 赵 丽娜 (高能所)
      • 40
        基于大语言模型智能体的生物大分子晶体结构解析流水线构建

        生物大分子X射线衍射晶体结构解析是揭示生物大分子三维结构最重要的手段之一。据统计,当前Protein Data Bank(PDB)数据库已收录的252,842个生物大分子结构中,80.5%由X射线衍射晶体学方法解析获得。作为同步辐射光源的核心应用方向,生物大分子晶体学在HEPS(高能同步辐射光源)已建设专用衍射线站,面向国内外用户提供高通量结构解析服务。
        然而,该领域涉及从衍射实验、数据处理到相位解析、模型精修的长链条工作流程,涵盖大量晶体学专业方法与参数调优,非晶体学专业用户使用门槛较高。为降低这一门槛,国内外主要生物大分子线站普遍开发了从衍射图像处理到结构精修的全流程自动化程序。由中国科学院物理研究所与高能物理研究所联合研发的AutoPD流水线,专为新一代高能同步辐射光源(北京光源/HEPS)设计,集成了具有自主知识产权的方法学模块,目前已完成部署并正式向用户提供解析服务。但现有流水线程序多采用预设固定流程,尽管自动化程度已达到较高水平,整体弹性与适应性仍显不足:面对常规样品可实现全自动解析,但遇到晶胞异常、衍射数据质量不佳、相位解析困难等复杂情况时,往往无法自主调整策略以获得理想结构,必须依赖人工干预;同时,由于流程固化,历史上积累的大量解析经验与专家知识难以反馈至后续数据解析中,导致流水线无法实现自我进化与知识积累。
        近年来,大语言模型(LLM)在复杂逻辑推理、工具自主调用与长程任务规划方面展现出显著突破,特别是随着推理增强型大模型技术的快速发展,基于LLM的智能体(AI Agent)在科学研究中的应用迎来规模化落地的新阶段。针对传统流水线"固化流程、缺乏弹性、无法进化"的结构性缺陷,我们构建了面向生物大分子晶体结构解析的大语言模型智能体系统。该智能体采用"感知-决策-执行-反思"的闭环认知架构,依托可扩展的SKILLS技能库动态调用图像积分、相位解析、分子精修等专业化工具,能够基于衍射数据质量进行实时诊断并自主重构解析路径,实现了从"按固定脚本执行"到"依情境自主决策"的根本转变。系统通过解析日志挖掘与专家反馈强化学习,持续积累晶体学领域知识,形成"数据解析-经验沉淀-能力进化"的正向循环,展现出高度的智能化、鲁棒性与自我迭代能力。本报告将系统介绍该智能体的认知架构设计、SKILLS技能编排与工具链集成机制、多轮对话式推理决策流程等方面面临的挑战与应对思路。

        Speaker: 涛 张涛 ( )
      • 41
        上海软X射线自由电子激光装置智慧FEL系统

        上海软X射线自由电子激光装置(简称SXFEL)数字化智能化改造项目计划于2027年初建成一个智慧FEL系统,实现从传统物理装置向“物理+数字”装置的转型。智慧FEL系统包括数字建模、XFEL科学数据库以及智能加速器,以系统化及智能化手段提高装置效率。科学家将因此拥有更高效、直观的数据交互方式,更准确的调整加速器运行参数、提升装置性能和分析用户实验结果。
        数字建模实现装置硬件设备的全面1:1数字化建模,涵盖束流元件、工艺管线及公共设施等。数字模型与实时运行数据、科学数据库和智能加速器功能相结合,为科研人员提供直观的调试和运行平台。XFEL科学数据库统一管理装置的运行数据、设备参数和实验数据,确保信息安全和可靠;借助硬时序系统,构建的多维度检索平台,可实现全装置数据精准关联和统一整合,为科研人员提供一站式、全维度数据统一视图。智能加速器则基于装置长期运行数据、机器学习算法和物理模型,能够自动调节加速器参数并精确预测加速器状态。这项智能化技术实现了动态优化加速器运行状态,提高光源的稳定性和输出效率。同时,系统具备故障识别和处理功能,能够及时发出预警信息并快速自动处理,提升机器运行安全、降低整体故障率。
        综上所述,智慧FEL系统的建成将显著提高SXFEL的调试效率和光源供给率,为加速器运行及用户实验提供有力的数字支撑,开辟新的研究思路与机会。

        Speaker: Ms 欢 赵 (中国科学院上海高等研究院)
    • 14:55
      茶歇 / Coffee Break
    • 人工智能
      Convener: 赵 丽娜 (高能所)
      • 42
        基于边缘计算的端侧实验信息处理和智能化应用探索研究

        在中子谱仪动态实验和智能化趋势的背景下,本团队借鉴边缘计算的思路,通过将实验的多模态数据与控制信息进一步紧密结合,探索实验信息的端侧实时处理与智能化基座。在具体研究路线上,多模态的探测器流式数据与仪器传感数据、实验控制配置等信息内容经过新的数据聚合接口统一为适合高维稀疏分析的张量化参数形式,由嵌入式GPU的异构计算平台承担端侧的数据处理和AI算法内容,实验信息的在线分析和控制反馈融合为各种算法流水线的调度引擎,直接面向实验运行逻辑提供现场闭环的全部信息处理和智能控制功能。新研究计划依托散裂中子源2期的单晶中子衍射谱仪展开尝试,初步实现在线智能化的自动对准、完整度扫描、晶面指数判断等实验信息处理功能,同时对仍需人工经验的复杂精修分析则预留信息接口保持与现有系统生态的兼容。期望面向单晶衍射测量的逻辑,探索传统实验控制到智能信息化处理的模式转变,令实验获得现场信息观测和实验效率上的便利性、扩展性与效能改善。

        Speaker: UNKNOWN 滕海云 (高能所)
      • 43
        CSNS中子数据处理与AI智能分析
        Speaker: 蓉 杜 (高能所)
      • 44
        基于XRD/XAFS多模态融合解析的材料性能预测

        ABX3型卤化物钙钛矿因其卓越的结构灵活性和可调谐的电子性质而备受关注,在光电子学、催化和光伏太阳能电池等领域展现出广阔的应用前景。尽管其庞大的组分空间涵盖了多种结构组合,但寻找兼具热力学稳定性与理想电子特性的候选材料仍是材料设计中的核心挑战。材料的宏观性质由长程晶格周期性和局域配位几何共同决定,X射线衍射(XRD)与X射线吸收精细结构(XAFS)互补地表征这些不同尺度的结构信息。然而,现有大多数深度学习模型仅能处理单一表征数据,无法捕捉长程晶格结构与局域配位几何之间复杂的非线性跨模态关联。为此,本文提出一个端到端的多模态深度学习框架,采用双向交叉注意力机制实现晶格结构与配位几何的跨模态耦合,从而预测形成能、费米能和带隙。在ABX3型钙钛矿数据集上的实验结果表明,该模型性能显著优于单模态解析方法。进一步通过特征重要性归因分析,识别出主导各项性质的关键光谱特征。这种可解释的多模态融合解析展示了多模特光谱融合方法在先进钙钛矿材料筛选与发现中的巨大潜力。

        Speaker: Dr 芹 袁
      • 45
        面向HEPS构建高质量数据集与领域知识库的实践与思考

        高能同步辐射光源(HEPS)作为新一代大科学装置,将产生海量、多模态、高维度实验数据。随着人工智能的迅猛发展,如何构建面向AI4S的高质量数据集、领域知识库以及相关工具,已成为未来智慧光源建设的重要方向之一。本文围绕HEPS实验全生命周期,探讨面向同步辐射实验的数据、知识与工具体系建设。在数据层面,HEPS在产生原始实验数据之后,还可进一步形成分析处理数据,以及计算模拟数据和文本知识等多类型科学数据资源。围绕实验方法学、科学研究、装置应用等方向,有必要逐步构建谱学数据集、图像数据集、材料结构-性能数据集等典型数据集,形成面向人工智能训练与科学发现的高质量数据基础。在知识层面,探讨基于科学文献、实验报告、用户手册以及实验日志等非结构化文本构建领域知识库的方法。利用大模型与文本知识解析技术,可抽取实验方法学、线站知识、实验流程、数据分析流程等领域知识,构建知识图谱与结构化知识体系,实现实验数据与文本知识的融合组织,为实验问答、知识检索与科学推理提供支撑。在工具体系方面,HEPS目前已建设并运行数据管理系统与数据分析系统,并正在进一步探索计算模拟系统、文本知识库系统以及多源数据智能融合工具等。其中,计算模拟系统可实现实验数据与理论计算结果的关联组织,支撑实验—模拟协同研究;文本知识库系统面向科学文献与实验知识的结构化解析与管理,为领域知识积累与智能检索提供支撑;多源数据智能融合工具则致力于实现不同线站、不同实验方法以及不同尺度数据之间的关联与协同,推动跨模态、多维度科学数据融合分析。最后,讨论了当前面临的关键挑战,包括实验元数据标准化不足、多源异构数据融合困难。未来需要进一步推动“数据—知识—工具”协同建设,实现多模态科学数据与领域知识的深度融合,支撑HEPS向智慧光源发展。

        Speaker: 鹏 胡 (高能所)
      • 46
        国产算力“芯”引擎-海光芯片解决方案助力光源与中子源科研攀峰之旅
        Speaker: 麻清刚
    • 16:30
      装置参观 / Facility Tour
    • 人工智能
      Conveners: Zheng-De Zhang (张正德) (IHEP(高能所)) , 彦棡 王 (中国科学院计算机网络信息中心)
      • 47
        面向AI4S的国家天文科学数据中心数智化服务体系建设与科学应用实践

        Confronted with the challenges of governing massive and heterogeneous datasets, the efficiency bottlenecks of traditional data service models, and the mission of supporting cutting-edge AI4S innovation, the China-VO, or National Astronomical Data Center (NADC), has systematically planned and implemented a next-generation astronomical data service system characterized by “Digital-Intelligent Integration”. This talk first presents a comprehensive description of the system. A standardized and intelligent data service layer is established with IVOA specification based APIs and the Model Context Protocol (MCP) as dual cores. An one-stop research support layer is built upon the cloud-based scientific research platform, the China-VO Science Platform, which deeply integrates data, software, computing resources, and models. An open and collaborative application ecosystem layer is cultivated through deep engagement with major scientific projects, innovation in science–education integration models, disciplinary and talent development, expansion of citizen science initiatives, and strengthened international collaboration. The talk focuses on analyses of successful practices within this system, including standardized and intelligent services for the LAMOST astronomical spectral database, AI agent-driven time-domain astronomical discovery with EP satellites, and citizen science programs. These cases demonstrate the system’s significant effectiveness in enhancing intelligent data provision, lowering the barriers to adopting advanced AI technologies, and empowering discoveries in time-domain astronomy.

        Speaker: Chenzhou Cui (University of Chinese Academy of Sciences)
      • 48
        科学数据智能就绪度研究
        Speaker: 胡晓彦
      • 49
        Open Dr.Sai科学智能体框架在光源智能化中的应用

        随着基座模型性能的快速迭代,智能体技术迅猛发展,其能力边界持续拓展,已逐步深入科研工作的各个环节。智能体架构已从简单的ReAct模式演进至基于Tool Call Loop等范式驱动的工程化体系,工程应用能力正成为其核心发展方向。我们积极推进Open Dr.Sai科学智能体框架在大科学装置数据分析等科研场景中的工程落地,通过构建与适配同步辐射光源、散裂中子源等装置数据处理工具链、分析流程及领域知识库,将科学智能体应用于知识检索、技能培训、科学数据分析等关键环节。我们构建了Open Dr.Sai的Web、CLI及桌面等多端应用,并研发了Synchrotron Agent、RongZai Agent等专业科学智能体,作为科研用户在文献调研、实验方案构建、专业数据处理与学术写作等方面智能助手。目前,Synchrotron Agent已可实现对数千篇同步辐射相关论文的深度检索与智能综述,并支持对B9等线站用户的操作培训,使线站科学家能够在线完成知识与科学工具的维护与升级;RongZai Agent已支持基于GSASII/Z-Rietveld的粉末中子衍射结构精修及基于SasView的小角中子散射数据多模型拟合。未来,我们将持续扩展Open Dr.Sai在大科学装置领域的工程化应用能力,推动智能化深度融合于科研流程,切实提升用户科研效率。

        Speaker: DONGBO Xiong (IHEP)
      • 50
        NRS Agent: An AI Agent for End-to-End Nuclear Resonant Scattering Data Analysis at Synchrotron Facilities

        We introduce an AI-driven multi-agent system that automates the processing of Nuclear Resonant Scattering (NRS) measurements. Developed atop the Dr. Sai ecosystem, the system addresses two primary experimental techniques within the NRS domain: coherent scattering methods and inelastic scattering approaches for phonon studies. The agent is optimized for operation at the High Energy Photon Source (HEPS) in China. It wraps existing computational engines, including CONUSS for spectral modeling and PHOENIX for vibrational property extraction, into a unified analytical pipeline. Starting from raw instrument outputs, the assistant manages preprocessing steps such as reformatting detector streams, assembling input decks, and verifying parameter consistency. A standout capability is the orchestration of simultaneous analysis jobs, allowing researchers to test competing theoretical interpretations or model variations across large datasets without manual intervention. The design prioritizes workflow consistency, offering fine-grained control over adjustable parameters. Tasks that were previously error-prone and required substantial manual effort are now performed autonomously by the agent, significantly reducing both the risk of mistakes and the time spent on analysis. Graphical summaries of output results are generated automatically, aiding both real-time decision-making and post-experiment documentation. The system is now in its final deployment phase, with ongoing work focused on integration into routine experimental workflows at HEPS, where it is expected to shorten analysis cycles, enhance output uniformity, and support systematic comparative studies across the NRS user community.

        Speaker: Gholamhossein Haghighat ( (Institute of High Energy Physics, Chinese Academy of Sciences, Beijing 100049, China) )
      • 51
        粒子加速器数据管理现状及高质量数据集生成研究

        随着粒子加速器装置向高性能、复杂化和智能化方向发展,装置运行过程中产生了海量的多源异构的数据资源。当前,粒子加速器领域的数据管理仍存在数据分散存储、多模态耦合复杂、标准规范缺失以及共享复用能力不足等问题,制约了数据资源的高效管理与深度利用,也限制了人工智能方法在智能调节、故障诊断和预测性维护等场景中的应用效果。针对上述现状,高质量数据集生成已成为推动粒子加速器智能化研究的重要基础。
        本文面向高能同步辐射光源(HEPS)和中国散裂中子源(CSNS)等典型粒子加速器装置,围绕人工智能应用需求,研究高质量数据集生成方法,设计并实现了一个遵循FAIR原则的AI-Ready数据集生成平台——FARAD。平台采用任务驱动的微服务架构,集成数据清洗、多源时序对齐、特征工程、标签组织与多模态融合等功能模块,构建了从原始数据采集到标准化数据集生成的完整流程。平台结合统一数据模型、元数据管理和语义对齐机制,提升了异构数据的组织、融合与追溯能力。研究表明,FARAD能够有效改善粒子加速器领域数据管理分散和数据利用不足等问题,为高质量数据集构建及人工智能模型应用提供可靠支撑。

        Speaker: 伟 鲍 ( )
      • 52
        高能光源数据解析智能体HEPSBot

        高能同步辐射光源产生的实验数据具有海量、多模态、高维度等特征,给用户的实验数据处理与解析带来了巨大挑战,传统数据解析模式难以适应新一代光源高通量运行需求。本报告介绍HEPSBot面向高能同步辐射光源的实验数据解析智能体系统。该系统基于大语言模型构建,通过知识库与语义理解辅助用户开展同步辐射实验,并与面向同步辐射多模态高通量数据解析的人工智能平台“智慧光源大脑”(IPSBrain)深度融合,实现对HEPS多模态实验数据的快速解析与深度挖掘。HEPSBot将智能问答与高通量数据解析功能有机整合,面向HEPS线站用户提供从实验前设计、实验中参数配置到实验后数据解析的全链条智能化服务。

        Speaker: 一鹤 庞 (高能所)
      • 53
        面向复杂科学计算任务的异构算力智能体系统

        针对复杂科学计算任务,科研人员通常需要调用本地工作站、高性能计算集群和云服务平台等多类异构算力资源,手工完成资源查询、环境配置、任务组织、作业提交、状态跟踪和结果获取等操作。由于不同平台在接口形式、任务描述方式和执行流程上存在差异,科研人员需要在多个工具和系统之间切换,导致学习和操作成本高、流程衔接困难以及自动化程度不足等问题。针对上述问题,本文提出并实现了一种面向复杂科学计算场景的异构算力智能体系统。该系统以大语言模型为核心,构建了面向异构算力资源的智能化服务框架。围绕科学计算任务执行过程,该系统能够通过自然语言交互理解用户需求,完成工具选择、资源查询、任务组织、任务提交与状态跟踪,将复杂算力操作转化为从需求理解到结果反馈的连续执行流程。同时,系统将不同算力平台能力封装为符合 MCP(Model Context Protocol)的标准化工具服务,既可支撑系统内部智能体调用,也可作为独立服务供其他兼容 MCP 协议的智能体复用。该系统已与多组学智能体等领域智能体开展协作验证,可提供工作流组织与执行、算力资源调用和状态反馈等支撑能力。实践表明,该系统能够降低科研人员使用异构算力资源的技术门槛,减少人工配置与跨平台切换负担,提升复杂科学计算任务的自动化处理能力和科研工具协同效率。

        Speaker: 莎莎 卢 (中国科学院计算机网络信息中心)
      • 54
        AI赋能HEPS用户服务系统

        HEPS作为第四代同步辐射光源,首期已建成14条实验线站,在用户试用实验期间征集到约580项课题申请,2026年首批课题征集到1700余项课题申请,未来将建成更多实验线站,研究领域涵盖众多学科门类,科学用户数量与提案量都将呈指数级增长。
        当前HEPS用户服务系统还是人工主导的提案管理模式,在面对未来激增的提案数量时,存在着多重瓶颈:科研人员难以精准定位最适合的装置配置,往往依赖反复咨询和试错;管理员面对海量提案难以高效识别高价值申请,HEPS首轮普通课题征集期间峰值时一天收到500多项课题申请,人工筛选的公平性和一致性难以保证;评审专家在有限时间内审阅大量跨学科提案,缺乏智能辅助工具导致评审质量波动,评审周期长,大量前沿提案可能因“排队”错失窗口期;机时分配依赖人工经验,面对突发情况(设备故障、紧急科学需求)调整效率低下且易引发连锁冲突。
        人工智能技术的飞速发展,为系统性解决用户服务系统面临的挑战提供了历史性机遇。大语言模型在自然语言理解、知识推理、决策辅助等方面展现出前所未有的能力。将AI能力全面融入提案工作流:从起草、审查、评审与机时规划全程智能辅助,可以显著提升提案效率与提案水平,最大化国家重大科技基础设施的科学与社会效益。
        本文介绍HEPS用户服务系统近一年来运行情况和下一步规划。

        Speaker: Wenshuai文帅 Wang王 (Institute of High Energy Physics 高能所)
      • 55
        基于机器学习加速从小角散射信号求解粒径分布
        Speaker: 飞 谢 (中国科学技术大学)
      • 56
        上海光源束线寻优数字化平台介绍

        本研究面向上海光源 10 条功能差异化同步辐射光束线开展智能化升级,对标国际主流同步辐射装置 AI 调光技术,针对光束低频热致慢漂、高频机械振动耦合引发的通量与光斑位置失稳难题,构建感知 - 认知 - 决策三级闭环智能调控体系,核心技术指标为全线路一键智能调束≤5min,纳米探针线站光斑抖动控制至 20 nm RMS。
        系统采用四层软硬件架构,分层部署用户交互、算法应用、异构数据库与算力硬件,基于 MySQL、MongoDB 分别存储设备结构化参数与荧光靶、CCD 非结构化图像数据。研究形成三项核心算法:依托神经网络自适应 PID 实现光学元件二次闭环稳控;采用多尺度 CNN 融合 QBPM 点位与荧光成像多源信息完成局部光束反馈;结合皮尔逊特征降维、差分进化与随机森林构建全局逆向参数寻优模型,并引入时序漂移检测算法提升复杂工况鲁棒性。项目基于 SHADOW 与 EPICS-Simmotor 搭建数字孪生仿真平台,实现光路全参数离线仿真与真机虚实迭代优化;国产化研制 QBPM、荧光靶探测器、ARM+DSP 反馈主控、激光干涉仪等测控硬件,完成多站点光学腔体与机械结构定制化改造。
        研究突破传统人工调束高耗时、非线性耦合难以精准控束瓶颈,形成可复用的通用算法与硬件方案,完善国内同步辐射光束智能调控技术体系,助力提升大科学装置实验运行稳定性与科研使用效能。

        Speaker: 健 何 (中国科学院上海高等研究院)
      • 57
        用 AI 来保障重大基础设施和装备的高质量运行
        Speaker: 陶建辉
    • 11:15
      茶歇 / Coffee Break
    • 公共服务与IT基础设施
      Convener: 胡 HU Qingbao (高能所)
      • 58
        SHINE数据中心建设进度

        SHINE束线站数据中心分布在4号井和5号井的2个建筑内,由4个机房组成,分别是4号井和5号井前端数据采集机房和4号井和5号井主机房,机房的基建部分已经基本完成,目前已经开始对光束线和实验站提供服务。本报告中将会介绍SHINE数据中心机房的建设概况,分享在建设过程中遇到的一些问题,以及如何我们是如何应对;同时分享目前4号井的高性能计算平台以及在线高速存储的建设情况,设备性能以及我们如何测试得到的性能等。最后简单介绍数据中心后期的规划以及对外合作等。

        Speaker: Wujun Shi (ShanghaiTech University)
      • 59
        大型科学装置骨干网络建设关键技术

        大型科学装置的骨干网络是装置控制运行的神经干线和科学数据共享的底座。其网络建设主要涵盖以下维度:物理网络架构采用Spine-Leaf架构,通过两层扁平化设计有效收敛路由表项、降低转发延迟,显著提升东西向数据吞吐效率。虚拟架构基于VXLAN协议封装数据报文,实现底层物理链路与上层业务网络的逻辑解耦,满足大规模数据隔离与灵活扩展需求。路由规划在Underlay层部署OSPF动态路由保障底层连通性,Overlay层引入BGP EVPN架构实现VXLAN网关集中控制与跨域多活负载分担。设备部署实行“集中核心+分布式接入”策略,脊交换机、叶交换机、计算和存储服务器等均集中式部署在数据中心;服务器通过光纤跳线上行至叶交换机;接入交换与网线配线架分布到现场各处的网络机柜,再通过光缆上行到数据中心的叶交换机。协议适配方面,被控设备均基于TCP/IP协议栈接入;针对RS485/RS232等传统串口仪器,通过串口服务器或前置网关完成协议转换,实现统一接入。高可用与安全设计采用核心设备ECMP负载分担及双链路Eth-Trunk技术,彻底规避单点故障;同时结合VLAN逻辑隔离、IP/MAC/端口三绑定策略与边界防火墙,构建纵深防御体系,全面保障装置稳定运行。综上,该骨干网络凭借高可用拓扑、智能路由调度与多维安全防护,全面构筑了支撑大型科学装置精准控制与海量数据高效流转的可靠数字基座。

        Speaker: 建巧 熊
      • 60
        多物理谱仪(MPI)用户实验运行管理系统

        中国散裂中子源(CSNS)作为全球主要的散裂中子源之一,为多学科研究提供了世界级的实验平台。在此背景下,由东莞理工学院、 和香港城市大学依托CSNS共同建设的多物理谱仪(MPI),成为国内首台中子全散射衍射仪,也是CSNS的第一台用户合作仪器。
        MPI具备大范围探测器覆盖角度、高中子通量及高实空间分辨能力,同时集成了中子全散射与中子衍射测试功能。该谱仪能够胜任液体、玻璃、纳米材料及晶体材料等不同有序度材料的结构分析,尤其聚焦于长程有序-局部无序材料以及长程无序-短程有序材料的微观结构研究。此外,MPI配备了极为丰富的原位样品环境,支持在温度、压力、力热耦合、充放电等多种条件下实时监测材料结构演化。其研究领域广泛涵盖电池能源、化学环境、合金材料、稀土磁性材料等,为材料科学、物理、化学及环境科学等多学科交叉研究提供了高性能的材料结构研究平台。
        随着MPI的投入运行,其用户实验运行管理面临诸多挑战:人工管理效率低下:传统依靠纸质记录和人工协调的方式,导致实验安排、样品流转等环节耗时长、易出错;安全管理难以追溯:样品的辐照状态、剂量检测结果等关键安全信息缺乏系统化记录,存在安全隐患且难以追溯;流程衔接不顺畅:从课题申请、样品装样、实验执行到样品出园等各环节缺乏有效衔接,信息传递滞后;数据管理分散:实验数据、样品信息、安全记录等分散存储,不利于统计分析和科研管理。因此,亟需开发一种专门面向多物理谱仪用户实验的全流程运行管理系统,实现从课题实验安排、实验前的样品装样与打签、实验执行、实验后的样品拆样、剂量检测、安全存放及最终出园的全过程电子化管理,从而提升实验运行效率、保障辐射安全并提高科学研究水平。

        Speaker: Ms Li Wang (高能所)
      • 61
        超融合基础设施与 K8s 集群统一管理平台搭建及应用实践

        本报告详细阐述了基于Harvester 超融合基础设施与Rancher Kubernetes 管理平台构建统一资源管控体系的完整实践。项目通过开发Foreman 自动化部署模板,实现了 Harvester 及 RKE2 Kubernetes 集群的快速、标准化部署。通过将 Harvester 无缝集成至 Rancher 平台,成功达成了对虚拟化资源(VM)与容器化资源(K8s 集群)的统一视图管理与生命周期自动化。目前,该平台已稳定Prometheus 监控系统puppet+xman等核心业务,目前正在搭建HAIk8s以及Dirac等服务。验证了其在提升运维效率、优化资源利用及支持业务敏捷交付方面的显著价值,为构建现代化、自动化的云原生基础设施提供了一套行之有效的落地方案。

        Speaker: 晓飞 Yan (IHEP)
    • 12:45
      午餐 / Lunch Break
    • 数据处理与科学计算
      Conveners: 春鹏 王 (中国科学院上海高等研究院) , 誉 胡 (高能所)
      • 62
        HEPS科学数据处理软件框架及基于框架的多装置、多方法学数据融合处理设想

        HEPS是第四代高能同步辐射光源,计划于2026年6月正式投入运行。凭借高亮度和先进的探测技术,HEPS一期14条光束线预计每年将产生超过200 PB的实验数据。这些数据涵盖成像、衍散射和谱学等多种实验方法,在数据量、吞吐率和处理复杂性上差异巨大,为大规模科学数据处理带来了严峻挑战。
        为应对这些挑战,我们开发了通用科学数据处理框架DAISY(Data Analysis Integrated Software System)。DAISY提供高吞吐的数据读写能力、统一的异构数据访问接口,并支持弹性和异构计算。基于该框架,已开发多个面向不同学科的科学应用软件并部署于HEPS光束线站,通过在线或近实时处理,支持光束线站的调试、工艺验收和用户实验。同时,我们正在探索跨多方法学的联合数据处理方法,以满足日益复杂的科学应用需求,未来还将引入人工智能方法,进一步提升数据处理的效率、准确性和自动化水平。
        本文介绍了DAISY框架的发展现状、基于DAISY的科学软件在HEPS多条光束线的应用情况,以及在HEPS正式运行前的数据处理实践与经验。

        Speaker: 誉 胡 (高能所)
      • 63
        面向生物溶液散射的智能数据处理与科学计算平台建设

        随着同步辐射生物小角散射(BioSAXS)实验向高通量、自动化与智能化方向发展,科学数据处理与计算分析面临新的挑战与机遇。依托上海同步辐射光源建成的国家蛋白质科学研究(上海)设施BioSAXS线站BL19U2,构建了覆盖样品信息管理、自动采集、在线处理、结构分析与结果输出的一体化数据处理平台,实现了SEC-SAXS、时间分辨SAXS等实验模式下的数据自动化流转与实时反馈。平台集成背景扣除、Guinier分析、距离分布函数反演、三维模型重构及多尺度模型拟合等算法模块,支持高通量结构表征与标准化报告生成。同时,围绕核酸递送系统、脂质纳米颗粒及蛋白复合物等应用场景,建立实验-结构-功能关联数据库,探索基于大模型与智能体的实验推荐、异常识别及构效关系预测框架。相关工作为先进光源科学数据治理、AI赋能科学计算及大科学装置智能化运行提供了实践基础。

        Speaker: Prof. 娜 李 (中国科学院上海高等研究院)
      • 64
        基于物理知识引导与机器学习的智能化ARPES能带解析

        第四代同步辐射光源的问世将催生海量高维角分辨光电子能谱数据,使得手动提取能带色散关系成为电子结构分析中的主要瓶颈。尽管深度学习技术为实现自动化提供了可能,但其“黑箱”特性及对大规模标记训练数据的严重依赖,往往限制了其在数据稀缺场景下的可解释性与适用性。为此,本文提出一种基于马尔可夫随机场(MRF)的鲁棒且可扩展的物理信息融合框架,用于电子能带结构的自动化重构。该方法通过衔接理想密度泛函理论(DFT)先验知识与含噪实验观测,构建了一条兼顾物理一致性与计算效率的多阶段处理流程。核心方法学创新包括:1)双路径校准模块,利用二阶导数谱图实现精确的动量对齐与自动化的能量偏移优化,确保了理论与实验的稳健耦合;2)基于k-d树的正则化策略,有效抑制实验噪声并消除了传统图像处理中常见的边界伪影。我们在Kagome金属RbTi₃Bi₅及Au(111)表面上验证了该框架。结果表明,该模型能从复杂的光谱中成功解析出包括高速狄拉克锥、微弱的II型狄拉克点及平带在内的复杂电子特征。与纯粹的数据驱动模型不同,这一基于MRF的推理引擎具有高度的物理可解释性,且在小样本条件下依然保持高效。该可靠流程为高通量分析奠定了基础,并为下一代同步辐射光源实现“自驱动”ARPES实验铺平了道路。

        Speaker: Dr 力源 伍
      • 65
        全散射数据处理与分析浅见

        全散射包含反映平均结构信息的Bragg散射与反映无序结构信息的弥散散射,是研究结构无序的重要实验表征手段。然而,弥散散射信号通常较为微弱,有时与噪音很难直接区分,使得相关实验的精准测量与数据的合理分析解读充满挑战。本报告将详细介绍全散射实验,数据处理与分析的流程与特点,突出精准合理的全散射研究在材料结构与性能构效关系中的重要作用。

        Speaker: 冠群 蔡 (四川大学)
      • 66
        高通量实验调控锂离子电池材料中的多尺度结构

        传统的层状锂离子电池正极材料(如NMC)高度依赖钴、镍等关键原材料以维持其电化学性能。相比之下,阳离子无序岩盐(DRX)正极材料不依赖于特定元素稳定结构,因此可完全使用低成本、地壳丰度高的过渡金属来降低成本。同时,富锂DRX中可以得到较高的理论容量和能量密度。尽管DRX材料缺乏长程周期性,但其内部仍存在短程有序(SRO)或中程有序(MRO)。由于锂离子的渗流路径高度依赖于局域富锂0-TM通道的统计分布,因此这些局域结构特征对材料的电化学性能起着决定性作用。 本报告将阐述一种综合策略,多尺度调控结构有序性,显著来调节局域环境。在短程尺度上,我们引入特定的阳离子掺杂剂量[1],并通过合成过程中的热力学控制,优化SRO,从而优化锂离子输运网络[2]。在中程尺度上,通过机械化学法合成了部分无序的尖晶石类结构(相),并实现了对“有序-无序”程度的连续调控[3]。通过调控无序度, 相不仅增强了锂离子通道连通性,还抑制了传统尖晶石中常见的有害相变,从而展现出优异的倍率性能。此外,在锰基DRX中,可以利用电化学循环,原位生成相,并通过组分调控解决了富锰材料的电压衰减问题[4]。在此基础上,进一步开发了化学脱锂的的合成方法,快速合成了亚稳态相,大大推动了锰基无序型正极的产业化进程[5]。
        References:
        [1] Zhong, P., Cai, Z., et al. Chemistry of Materials 2020, 32, 10728-10736.
        [2] Cai, Z., et al. Advanced Energy Materials 2022, 12, 2103923.
        [3] Cai, Z., et al. Matter 2021, 4, 3897-3916.
        [4] Cai, Z., et al. Nature Energy 2024, 9, 27-36.
        [5] Hau, H.-M., Cai, Z., et al. Nature Nanotechnology 2024, 1-9.

        Speaker: Prof. 子健 蔡
      • 67
        基于CSNS-MPI谱仪的从数据到多尺度结构解析方法

        结合了衍射与对分布函数的中子全散射技术,是获取材料多尺度结构信息(如短程有序、非晶态、纳米晶、界面等)的关键表征手段。近年来,随着中子源与谱仪技术的进步,数据处理策略也在不断演进,显著提升了全散射方法结构解析能力与适用范围。本研究系统梳理了中子全散射当前主流数据分析策略,基于中国散裂中子源多物理谱仪(CSNS-MPI)的实践经验,给出其数据预处理与归一化流程,继而阐述了结构建模的正向拟合方法及其在晶体、非晶材料等领域的广泛应用。最后,讨论了近年来新兴的机器学习在加速拟合及实现高通量对分布函数解析中展现出的巨大潜力。

        Speaker: Prof. 菊萍 徐
    • 15:30
      茶歇 / Coffee Break
    • 数据处理与科学计算
      Conveners: Chun Li, 小芸 李
      • 68
        同步辐射微区衍射数据的自动处理及分析

        微区衍射基于同步辐射的微聚焦光源,通过结合扫描模式及原位实验环境,可以实现对样品的高空间分辨和高时间分辨表征,从而解析材料的结构-性能关系。目前国内外的新一代同步辐射光源都建有专门的微区衍射线站。但是微区衍射技术的高空间分辨在提供更加精细的结构信息同时,也造成数据洪流问题。目前在四代同步辐射光源的微区衍射实验数据量可以轻易达到TB级别。此外,针对特殊材料,如块状合金或薄膜样品,需要引入专门衍射模式,这也造成数据分析难度的大幅提升。因此,本报告将讨论微区衍射的数据解析,包括数据清洗,预处理及可视化,同时对比传统的衍射数据分析方法与基于机器学习辅助的分析方法,并展望人工智能在微区衍射技术上的应用。

        Speaker: 霁亮 刘 (上海高等研究院)
      • 69
        从传统到新潮~结构分析软件的发展探索

        人工智能快速发展的当下,各类分析软件正经历从以数理公式为基础的传统计算模式,向以模型与数据集为核心的训练分析模式的转变。生物大分子结构分析软件同样面临这一转型。本报告将回顾本团队过去几年在该领域的研究工作,探索一条适应未来发展趋势的研究道路。

        Speaker: Wei Ding
      • 70
        正电子技术在核材料缺陷分析领域的应用

        金属及合金材料被广泛用于核能领域,核材料的微观结构演化对核反应堆安全运行至关重要。原子尺度点缺陷广泛存在于金属材料中,如单空位、空位团、空位-溶质复合体与溶质团簇等,此类结构往往是材料纳米-微米尺度微观结构演化的起点。正电子湮没谱学(PAS)被广泛用于研究材料的原子尺度结构,利用理论模拟与实验相结合的分析探测手段,实现缺陷尺寸和浓度更精确的定量分析,对全面理解缺陷演化规律具有重要意义。通过建立标准化数据存储,实现正电子科学的发展和推广。

        Speaker: 双 吕
      • 71
        理论计算与模拟耦合大科学装置实验的协同研究

        复杂体系的微观作用机制是材料、能源、医学等领域的核心挑战,单一的实验或计算手段往往难以同时实现宏观性能与微观机制的精准关联。大科学装置同步辐射技术可实现原子级的高精度结构表征,但对实验现象背后的作用机制的深度解析仍需理论计算的支撑;理论计算的预测结果也急需大科学装置的验证,以确保其可靠性与实际意义。
        针对这一问题,我们建立了密度泛函理论(DFT)量化计算与分子动力学(MD)模拟协同上海光源同步辐射实验的研究范式,在储能、核医学、海水提铀等多个前沿领域开展了系列研究:一方面,我们通过 DFT 计算与MD模拟,解析了同步辐射 EXAFS、GIWAXS等实验观测到的微观结构,揭示了离子溶剂化调控、放射性核素稳定配位的微观机制,实现了计算对实验机制的验证与阐释;另一方面,我们通过理论计算预测了配体与目标离子的配位作用模式,由大科学装置的高分辨实验对计算预测的机制进行了精准验证,实现了从计算预测到实验证实的闭环研究。
        基于该协同研究范式,我们在水系锌电池稳定电极、放射性治疗微球、高效海水提铀材料等方向取得了系列突破,相关成果已发表于Adv. Funct. Mater.、Adv. Sci.、Chem. Eng. J.等国际顶级期刊。该研究模式突破了单一研究手段的局限,为复杂体系的微观机制研究与功能材料的设计提供了新路径。

        Speaker: 杨杰 王 (中国科学院上海高等研究院)
      • 72
        重庆大学超瞬态同步辐射光源科学数据处理平台规划与设计

        “超瞬态实验装置”(Ultrafast Transient Experimental Facility,UTEF)是结合光子探针和电子探针实现超高空间分辨率、能量分辨、超快时间分辨率的重大科技基础设施。它由两大类核心部分构成:一是提供高通量同步辐射光的超瞬态同步辐射光源,二是超瞬态电子显微镜集群。其一期建设的直线加速器、0.5GeV低能储存环和角分辨光电子能谱线站,实验数据需要得到存储、共享,并能够进行准确实时的处理与分析。科学数据处理平台包括基础设施、网络、计算、存储、科学软件等系统。该平台将为UTEF设施、科研人员、工程技术人员以及用户提供包括设数据传输、数据存储、数据分析、数据共享、科研协同等在内的网络、计算、存储等基础设施能力,以及提供科学软件、通用软件和网络信息安全服务等。

        Speaker: 明涛 康 (重庆大学)
      • 73
        面向同步辐射光电离质谱的实验数据处理软件平台

        同步辐射真空紫外光电离质谱技术在燃烧、催化和大气化学等复杂反应体系研究中具有重要作用,可用于关键物种鉴别、反应中间体捕获和温度依赖反应机理分析。然而,相关实验通常产生大量能量扫描和温度扫描谱图,数据解析涉及定标、寻峰、积分、归一化和多物种判别等连续步骤,人工处理不仅效率较低,也不利于结果复现和跨实验比较。针对这一问题,本文发展了一套面向同步辐射光电离质谱实验的数据处理与 PICS 辅助物种解析软件平台。该平台面向实验数据的完整解析过程,建立了从谱图标准化处理、定量信号提取到候选物种辅助判别的一体化工作流;通过将质谱信号与光电离截面数据库关联,可在同一质荷比通道中评估不同候选物种对实验信号的相对贡献,从而为复杂体系中的物种归属提供更加系统的依据。对于温度扫描实验,软件进一步结合光强归一化、膨胀效应修正和曲线形态分析,辅助识别生成物、反应物消耗和中间体等不同温度响应行为。平台同时提供本地交互、网络服务和批处理等使用方式,适应实验现场快速分析、多人协同和结果复核等需求。该工作将同步辐射光电离质谱实验中分散的经验性处理步骤转化为规范化、可复现的数据分析流程,为相关装置的数据服务能力提升和后续智能化解析方法发展提供了基础。

        Speakers: 晨 黄 (中国科学技术大学人工智能与数据科学学院) , 祥 邓 (中国科学技术大学国家同步辐射实验室)
      • 74
        HEPS科学计算系统功能设计及运行现状

        High Energy Photon Source(HEPS,高能同步辐射光源)位于北京,是一座面向多学科科学创新与高技术发展的先进公共科研设施。HEPS 计划于 2026 年建成并投入运行。该装置将提供具有高能量、高亮度和高相干性的同步辐射光,其空间分辨率、时间分辨率和能量分辨率分别可达到纳米、皮秒和毫电子伏特量级,使其成为世界上最亮的第四代同步辐射光源之一。

        在运行过程中,HEPS 将产生海量、异构且具有高度时效性的实验数据,这对计算资源调度、数据处理效率以及分析环境的灵活性提出了巨大挑战。为应对实验数据类型多样化、分析流程异构化以及用户计算需求动态变化等问题,本工作融合多种数据分析场景,构建了一套面向 HEPS 的统一计算平台。

        该平台基于云原生技术体系构建,融合虚拟化、容器化以及高性能计算资源,形成了覆盖在线监测、离线数据重建、大规模批量数据分析以及交互式科学计算等多种应用场景的综合计算服务架构。通过统一的资源管理与调度,实现了计算资源的弹性分配与高效利用。此外,平台通过标准化的数据访问机制以及封装化的分析环境,降低了用户使用门槛,并提高了数据分析流程的可复现性与自动化程度。

        在 HEPS 的调试运行阶段,该平台已在多条光束线及相关数据处理任务中完成部署与验证。结果表明,该平台能够有效支撑 HEPS 复杂且多样化的数据分析需求,显著提升数据处理效率与系统稳定性。本文提出的设计理念与实践经验,也为其他大型科学装置计算平台的建设提供了有价值的参考。

        Speaker: 胡 HU Qingbao (高能所)
    • 75
      闭幕式 / Closing Ceremony
    • 76
      离会返程
Baidu
map