钛媒体从华为内部独家获悉,华为公司将发布一款直接对标 ChatGPT 的多模态千亿级大模型产品, 名为“盘古 Chat”。
(资料图片)
据介绍,盘古大模型于 2020 年 11 月在华为云内部立项成功。这款“盘古 Chat ”预计将于今年 7 月 7 日举行的华为云开发者大会 (HDC.Cloud 2023) 上对外发布以及内测, 产品主要面向 To B / G 政企端客户。
根据华为公布的一份论文数据显示,华为盘古 PanGu-Σ 大模型参数最多为 1.085 万亿,基于华为自研的 MindSpore 框架开发。整体来看,PanGu-Σ 大模型在对话方面 可能已接近 GPT-3.5 的水平。
IT之家查询公开资料获悉,华为盘古大模型于 2021 年 4 月正式对外发布,后来又在 2022 年 4 月升级到 2.0 版本。目前,AI 大模型中的 NLP 大模型、CV 大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。
据介绍,这是首个干亿参数中文预训练大模型,CV 大模型则首次达到 30 亿参数。盘古 CV 大模型业界最大 CV 大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东。太初是全球首个图、文、音三模态大模型。
对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
根据华为云高管的演讲 PPT 信息,目前华为“盘古系列 AI 大模型”基础层主要包括 NLP 大模型、CV 大模型、以及科学计算大模型等,上层则是与合作伙伴开发的华为行业大模型。
华为云官网显示,盘古大模型由 NLP 大模型、CV 大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。
具体来看,盘古 NLP 大模型 首次使用 Encoder-Decoder 架构,兼顾 NLP 大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。
下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,这一模型在智能舆论以及智能营销方面都有不错的表现。
盘古 NLP 大模型
盘古 CV 大模型是 首次实现模型按需抽取的业界最大 CV 大模型,首次实现兼顾判别与生成能力,基于模型大小和运行速度需求,自适应抽取不同规模模型,AI 应用开发快速落地。
使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一,这一模型在智能巡检以及智慧物流方面有不错的表现。
盘古 CV 大模型
盘古气象大模型提供秒级天气预报,借助创新的 3DEST 网络结构以及分层时间聚合算法,在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法, 速度相比传统方法提升 1000 倍以上。
同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低 20% 以上的位置误差。
盘古气象大模型
浙商证券此前披露的信息显示,华为在训练千亿参数的盘古大模型时调用了超过 2000 块的昇腾 910 芯片,进行了超 2 个月的数据训练能力。华为内部称,每年大模型训练调用 GPU / TPU 卡超过 4000 片,3 年的大模型算力成本高达 9.6 亿元人民币。
东吴证券梳理的华为盘古大模型产业链研报中指出,华为盘古大模型的优势在于人才储备和算力自主可控,有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展,包括拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。国盛证券则认为,华为盘古为首个多模态千亿级大模型,有望赋能百业。
2023 联想商用产品发布会将于6 月 6 日下午 14:30 召开, IT之家网站 & App 将会同步直播,欢迎观看!
另外,近期还有不少热门内容, 点击下方蓝字即可查看:
【好物】魅族18s Pro手机2459元腰斩清仓,京东PLUS+爱奇艺年卡128元限时购 马斯克,脑机接口,第一刀 支付宝变“黑”了,又没完全黑 Wi-Fi 7将至,实测小米13 Pro速率“碾压”iPhone拭目以待 ↓↓↓
责任编辑:
关键词:
ChatGPT在前,华为盘古Chat在后_今日热文
锡南科技:拟发行2500万股 6月8日初步询价 快播
视讯!赛车基因加持 东风风神奕炫冠军版上市售8.99万起
冰力克薄荷糖_冰力克logo
牧原股份接待中信证券等多家机构调研
资讯:河南桐柏:醉酒失态险酿祸 民警辗转送归家
“神十五”航天员张陆:回家第一餐,想吃常德米粉和汉寿玉臂藕 天天通讯
【世界报资讯】类似全球进化的小说晋江(类似全球进化的小说)
专家支招高考考生科学饮食 全球热议
曾国藩挺经全文及译文下载 曾国藩挺经全文及译文
山东省志愿者服务网登录注册_山东省志愿服务网登记注册-天天微资讯
蜂蜜和蜂巢蜜有什么区别|每日时讯
母亲节的诗句大全_母亲节诗句有哪些 环球要闻
CAD中怎么输入文字?CAD单行文字输入技巧-当前最新
当前通讯!【关注2023高考】甘肃省教育考试院发布高考考生注意事项
世界观点:香皂的做法视频_香皂的做法
藏海花第2部完整版在线阅读_藏海花第二部开始连载了没
【环球时快讯】win10系统补丁可以删除吗_系统补丁可以删除吗
中原泪李白 古诗(中原泪) 天天滚动
【聚看点】explanation音标(explanation)
直落三局击败德国队,中国女排迎来世联赛两连胜
环球实时:多卵巢综合症的症状怎么治疗(多卵巢综合症的症状)
采砂船被莫名拆解 嫌疑人落网竟牵出案中案
精灵世纪主题曲《霞光》电子琴(精灵世纪主题曲)
股票行情快报:湘电股份(600416)6月2日主力资金净卖出919.86万元
新消息丨挂牌督办!14处重点整治区域公布!
湖南高校毕业生基层就业学费补偿申请指南(条件+标准)
当前关注:神十五乘组近日将返回 如何保障航天员穿越“黑障”区?
环球观热点:嘀嗒出行发起“2023高考全民云送考” 来看网友四类吉言
银信科技(300231.SZ)实控人一致行动人纯达蓝宝石6号减持期满 累计减持1%股份
“中国造”再出新成绩 2万吨重载自动驾驶列车试验成功 头条
【世界报资讯】后院三国类似游戏 后院三国游戏
山东枣庄200MW/400MWh共享储能电站实施方案征集!|讯息
可口可乐公司的英文介绍_可口可乐公司的英文简介
上海临港:到2025年算力产业总体规模突破100亿元
太平臻爱金生终身寿险3年的可靠吗?从基本保障内容、收益情况、保险公司发展情况来看
相关新闻