机器化学家的诞生:中国团队花8年打造“最密集大脑”

零距离

中国队历时8年打造“最强大脑”

机械化学者诞生记

在中国科学技术大学的机械化学者实验室里,可以看到——具科技感的“敦实”,动作敏捷的机器人穿梭于操作台之间,伸出机器人的手臂调制试剂的场景。 在实验室的另一边,年轻的科研人员输入指令,对机器人进行“隔离”控制。 在大多数情况下,这个机器人会自主考虑实验的步骤和方案。 就像一个不知疲倦的“小化学家”。

这是中国科学技术大学化学物理系教授江俊团队的“作品”,该团队在世界范围内首次阅读文献,自主设计实验,开发出涵盖材料开发全流程的机械化学者平台,并在数以亿计的可能组合中找到最优解,加速材料开发。 “实验数据经过处理后,输入平台自主的计算大脑,生成理想的人工智能模型,有助于科研人员优化实验方案。 ”江俊说。

江俊团队有近30名成员,其中大多是90后、95后。 10月上旬,团队又增加了科研进展——,通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库,他们开发了数据智能驱动的全流程机械化学者。

该研究成果论文在最新一期《国家科学评论》学术杂志上发表。 国际审阅者评价说,这一成果“机器人系统、工作站、智能化学大脑都是最先进的”“对化学科学产生了巨大的影响”。 业内专家认为,机械化学者的研究工作摆脱了传统的试错研究范式的限制,显示出“最强化大脑”指导的智能新范式的巨大优势,将推动化学研究朝着知识理解数字化、操作指令化、模板化的未来趋势前进。

那么,进行化学实验的“聪明”机器人是如何诞生的,其背后凝聚着年轻人怎样的努力和心血呢? 中青报中青网记者进行了采访。

"建立中国人自己的材料数据库. "

随着化学研究对象的日益复杂和高维化,传统研究范式成本高、周期跨度长的问题日益突出。 近年来,科技界逐渐认识到数据对学术研究和产业创新发展的重要意义,大数据科学与人工智能技术相结合的手段也在先进材料研发方面崭露头角。

团队核心成员肖恒宇是1995年出生的人,他本科就读于中国科技大学少年班学院,出于兴趣自学了人工智能。 有一次,他写的智能程序有问题,于是向时任班主任的江俊请教。 江俊指出:“算法没有问题,但算法所依赖的实验数据过于片面。”

江俊发现,一段时间以来,中国科研团队将科研数据写成英文论文,在国外期刊发表,但在引用数据之前,必须额外花钱买。

“建立中国人自己的材料数据库”成了江俊的梦想。 在他的影响下,肖恒宇等人一起踏上了实现这个梦想的道路。

肖恒宇的同学霍姚远、冯超学习数学和化学,喜欢研究数据。 从2014年开始,3人收集数据,挖掘文献,寻找框架,江俊提供原理指导和研究资源。 2023年,他们搭建了第一代材料数据检索平台,但反馈使用不太理想,有老师抱怨“数据不准确”。

肖恒宇等人注意到,数据不仅多,而且质量好。 他们的数据库缺少最重要的一环——知识图,这导致数据质量恶化,无法进行有效的检索。

制作知识地图并不容易。 学生们必须用专业知识区分数据的关联性,在图像上打上识别标签,让计算机知道每个数据背后的物理意义。

团队成员张百成博士说,最初几个同学都是靠自己“贴标签”,几个星期没日没夜地贴标签。 大家读了文献后脑子一片混乱,但只完成了任务量的1%,记得几近绝望。

为此,江俊找到了中国科大校董会,开展了有奖阅读文献比赛,与更多专业背景的大学生合作参与。 这使得他们生成了第一批个高质量的标记数据。

“人捡柴火焰高,在大数据时代,必须融合知识、整合资源。 ”张百成表示,通过利用这些数据训练智能算法,他们实现了第一代化学命名实体识别程序,在后续的标记工作中,可以先让计算机自动识别,然后进行人工检测,大大提高了效率。

最终,他们擦亮了我国第一代材料科学知识图谱。 2023年,团队用图鉴赋予机器人“小”的科学思维,团队的自然语言处理技术也随之“鸟枪换炮”,机器自动读取和识别准确率从提高提高到90%。

“将数据转化为实际生产力”

2023年,肖恒宇参加互联网创新创业大赛,获得安徽省冠军、全国银奖。 投资机构将为他和团队提供第一笔创业资金。 公司成立后,团队三次重复知识图谱,建立了包含9000万个化合物、1100万条化学反应途径的大规模材料数据库。 小组借此帮助一些科研机构解决了技术难题。

例如,一家航天企业发现需要改进发动机内置配件的材料,尝试了很多方案也没能实现。 肖恒宇等人利用数据平台模拟燃烧流场、大涡流场,找到了记忆金属设计配方。 这为该公司节省了4300多万元成本。

肖恒宇团队还迎来了意外之喜——,他们在为这家企业解决问题的过程中,收集了10万种合金演化结构数据和金属原子间相互作用能数据,这些反过来丰富和完善了他们现有的数据库平台体系。

“在以往的研究中,有人习惯于按照自己希望的方向调整数值,但研究需要数据的多样性,必须记录有偏见和误差的数据。 ”江俊表示,数据是科研和产业的通用语言,数据库平台是连接科研和产业的桥梁,相信必须产生更高标准的数据来反哺科研,把数据转化为实际生产力。

目前,该团队还建立了材料基因创新研究平台,建设了亚洲最大的材料数据库平台——架大型材料库。

江俊表示,机械化学者平台具有更强的化学智能和广泛的新材料开发能力,涵盖光催化和电催化材料、发光分子、光学薄膜材料等领域,适用范围随着平台的升级和扩大将继续扩大。

“决不腐朽,决不应对交往”

在每周的小组会议上,江俊只需向机器人提出希望其解决的问题,学生们就会自己讨论实施方案。 如果设备没有基本驱动程序,学生们会智能升级。 后来,在会上,江俊只能坐在一边听,甚至不敢说话。

幸运的是,几个有交叉学科背景的年轻博士正在成长为团队的“主心骨”。 肖恒宇设计软件框架。 张百成编写程序,让机器人阅读论文,提出科学假设,形成实验报告和方案; 赵路远先生主导电化学测试,负责干燥设备、光谱仪等硬件的驱动程序开发。

25岁的赵路来自电子科技。 在她看来,克服科研难题主要靠耐心。 她和师徒曹嘉祺一起写某驱动程序时,由于对信息掌握不充分,无法准确理解调用界面,“我们反复联系机器制造商和代理商,没有回应。 我们决定自力更生。 ”

3周时间,两个人就像两个机器人一样,除了吃饭睡觉以外,还反复发送信号、等待反馈、记录应答等尝试3000次,一点一点地逆向尝试基础控制逻辑,实现机器人的远程控制

“此时,设备代理商正积极地找到我们,打算购买我们的驱动器。 我们感到非常自豪。 ”赵路远说。

2023年,团队充满信心地开始了机器人的首次试运行,不料化学设备单独正常运行,但在参与系统调试时无法使用。 大家查到半夜还没有线索。

就在这时,肖恒宇突然意识到化学设备和机械臂使用了红外检测设备,可能会相互干扰。 于是,他转向机械臂,很容易就解决了问题。

“在今后的开发调试中,不同领域的仪器设备、不同系统的代码协议之间出现了类似的‘磨合’难题,但我们通过交叉学科的思考,将它们一一击败。 ”肖恒宇说。

“即使一个方案受挫,大家也不会腐烂,不会应对交叉,而是反复测试,调查哪个环节出了问题。 ”肖恒宇说,科研伙伴有相似的特质——对流程和技术的执着。 执行任务时,团队成员总是比自己想得多一点,不仅想出方案,还想备选方案和一些发泄选项。

在他看来,从开发测试,到改进迭代、升级,一个实验分支都由一个人负责,每个人都会成长为“全能人才”。 肖恒宇说,当全身心地投入科研时,所有知识都有用处。 他一直在自学3D动画。 项目组拍摄科普电影时,他把摄像头和脚本分开写。

肖恒宇在宁夏回族自治区海原县一中支教。 他利用闲置的传感器等仪器,建造了两个小实验室,带着学生学习化学、物理和信息,激发孩子们的科学兴趣。 他一直有一个梦想,希望有更多的年轻人合作开发更高水平、更具科研智慧的实验平台,让中国智能化学闪耀世界。

中青报中青网记者王海涵王磊(来源:中国青年报) () ) ) ) )。

来源:中国青年报

其他教程

剪映专业版视频制作背景虚化教程,会声会影防抖插件使用教程

2022-12-22 8:53:32

其他教程

6个简单步骤中的3D建模景观

2022-12-22 8:55:34

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索