盘古大模型 :华为云、循环智能和鹏城实验室联合开发的人工智能模型

更新时间:2023-06-27 09:27

盘古大模型是由华为云、循环智能和鹏城实验室联合开发的人工智能模型,包括NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型。于2021年4月正式对外发布。

2024年4月11日,华为宣布,首次将盘古大模型加持的AI功能搭载至MateBook X Pro上,这是PC首次应用华为盘古大模型。6月21日,盘古大模型5.0发布,其在全系列、多模态、强思维三个方面全新升级。

发展历程

2020年3月,曾在德克萨斯大学圣安东尼奥分校计算机系任教17年的田奇加入华为云团队,并开始组建华为云的人工智能模型团队,并进行了其发展方向的梳理。同年9月,在迎来了一系列专家后,团队开始推动盘古大模型项目的立项,以期能够在华为云的基础上,完成适配各大产业AI开发的大模型。11月,该项目在华为云内部正式立项,并完成了与合作伙伴、高校的合作对接。

2021年4月,盘古大模型正式对外发布。包括NLP(自然语言处理)、CV(机器视觉)和科学计算大模型;后续又发布了矿山、药物分子、气象、海浪等行业大模型。

2023年7月7日至9日,华为开发者大会 2023 (Cloud) 大会在东莞举办。华为常务董事、华为云CEO张平安在大会上宣布,华为云盘古大模型3.0正式发布。张平安称,盘古大模型3.0分为L0基础大模型、L1行业大模型、L2场景模型三层架构,将重塑千行百业。同时,盘古大模型首次明确定位,即“为行业而生”;盘古基础大模型的全栈创新和行业大模型的“炼成术”首次对外公布,华为云盘古大模型也做出重大升级。

2023年7月18日,华为联合山东能源集团宣布华为盘古大模型在矿山领域实现首次商用,解决人工智能在矿山领域落地难的问题。9月22日,在华为全联接大会上,华为云全球生态部总裁康宁宣布,华为云计划以昇腾AI云服务为算力底座,以盘古大模型联合创新为基础,以模型社区和全面升级的云学堂为双引擎,携手伙伴、开发者合作共建“百模千态”,让AI重塑千行万业。截至当日,超过21000家华为客户、伙伴申请盘古测试。

2024年4月11日,在华为鸿蒙生态春季沟通会上,全新的华为MateBook X Pro发布,华为常务董事、终端BG CEO余承东表示,这是PC首次应用华为盘古大模型,可生成“AI概要”场景模型。同月28日,2024湖南省先进制造业应用场景对接会上,湖南钢铁集团中国移动湖南分公司华为联合打造的钢铁行业盘古大模型应用进行全球首发。6月21日,在华为开发者大会2024上,华为常务董事、华为云CEO张平安发布盘古大模型5.0,其在全系列、多模态、强思维三个方面全新升级。华为盘古大模型5.0包括十亿级、百亿级、千亿级、万亿级等不同参数规模,提供盘古自然语言大模型、多模态大模型、视觉大模型、预测大模型、科学计算大模型等。

设计原则

一是模型要大,可吸收海量的数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

产品优势

首先,盘古大模型拥有机器视觉模型,回到NLP领域中,在盘古大模型的研发过程中,开发团队考虑到在真实的产业场景中有大量的内容理解需求,比如客服、智能对话等,为盘古大模型设计了兼顾架构,且同时能高度完成理解与生成的任务。

从具体的技术差异来看,盘古大模型提升了复杂场景下的小样本学习能力,使小样本的学习效率提升了一个数量级;在微调能力上,盘古拥有良好的数据吸收及理解能力,可以在真实行业场景中实现模型应用效率的提升;盘古大模型也有较强的行业知识的集成能力,其采用更灵活的模块设计,能够根据业务场景的适配,提升行业知识的吸收效率。

其次,盘古大模型还是一个天然瞄准AI工业化、现实场景的项目。在立项初期,研发团队就与合作伙伴进行了一系列商业化验证,以此来确保盘古大模型走入真实产业场景后的效率及适应能力。这也是盘古大模型的一大差异化特点,它并非为实验室而造,而是将工业化的一面放置在更高的优先级上,是一个以商业价值驱动研发创新的“实干模式”大模型。

与其他预训练大模型的另一个不同点在于,华为团队在研发过程中始终将生态化、协同创新纳入考量。因此,盘古大模型是一个开放、可生长的产业实体,可以在各个环节引入生态合作伙伴、高校科研团队,以及不同领域AI开发者的力量。以此确保了盘古大模型融入产业链条、搭建生态化合作的能力。

主要模型

盘古NLP大模型

盘古NLP大模型可用于内容生成、内容理解等方面,并首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。在下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是最接近人类理解水平(85.61)的预训练模型。

盘古CV大模型

盘古CV大模型可用于分类、分割、检测方面,也是首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力。基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。

盘古气象大模型

盘古气象大模型实现天气预报精度首次超过传统数值方法,速度提升1000倍,提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。

所获荣誉

2022年3月,2021 年度“深圳市人工智能奖”公布,华为云盘古大模型荣获深圳人工智能科技进步奖。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}
友情链接: