“本源悟空”全球首次运行十亿参数级AI大模型微调任务

11

中新社合肥4月7日电 (记者 张俊)记者7日从安徽省量子计算工程研究中心获悉,中国第三代自主超导量子计算机“本源悟空”近日完成全球首次运行十亿参数级AI大模型微调任务。

本次任务由本源量子计算科技(合肥)股份有限公司(简称“本源量子”)、合肥综合性国家科学中心人工智能研究院等联合攻关完成的。实验结果显示,在参数量减少76%的前提下,AI大模型训练效果反而提升8.4%。这一成果不仅验证了量子计算助力实现大模型轻量化的可行性,更为破解大模型“算力焦虑”开辟了新路径。

大模型微调是指在通用大模型的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。传统低秩微调面临性能瓶颈、泛化能力有限等问题,量子计算凭借其叠加态和纠缠态特性可同时探索海量参数组合,提升大模型微调的效率。

本源量子副总裁窦猛汉介绍,团队创新设计了一种量子加权张量混合参数微调的方法,将模型权重转化为量子神经网络与张量网络混合架构,前者通过量子门操作提取高维非线性特征,张量网络则压缩参数规模。

在“本源悟空”的量子芯片上,AI大模型单批次数据可生成数百个量子任务并行处理。实验数据显示,优化后的模型在心理咨询对话数据集上训练损失降低15%,数学推理任务的严格准确率从68%提升至82%。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀表示,这是量子计算首次“真机实战”AI大模型任务,证明现有硬件已能初步支撑大模型微调。

截至目前,“本源悟空”超导量子计算机全球访问已覆盖139个国家和地区,完成35万个量子运算任务,涵盖流体动力学、金融、生物医药等多个行业领域。(完) 【编辑:胡寒笑】

山东新增本土确诊病例3例、本土无症状感染者77例

柬埔寨疫苗接种工作顺利推进 接种重点从金边转向外省

首届汇流经贸论坛在法国里昂举行

在武汉,12秒能做什么?

海南校园秋招火热:“00后”求职趋向“求稳”

湖北多措并举构建内陆开放新高地

四川省港航投资集团原总工程师曹文被“双开”

被挪用的学生伙食费

南非匹林斯堡国家公园:连续三年没有发生犀牛盗猎事件

“月船3号”再次开启探月任务 印度欲当“登月第四国”

消夏、展览、演出场景焕新 夏日文旅消费热力涌动

履职一年间 | 赓续红色基因 用好红色资源“活教材”

(巴黎残奥会)94金!中国实现残奥会金牌奖牌六连冠

商务部:禁止利用报废机动车“五大总成”拼装机动车

美国安局被指对全球47个国家及地区开展网络攻击 中方:美应立即停止此类活动

文章版权声明:除非注明,否则均为华夏经纬网原创文章,转载或复制请以超链接形式并注明出处。