6月05日消息,华为公司计划于7月7日举行的华为云开发者大会(HDC.Cloud 2023)上发布内测版的全新产品,名为”盘古Chat”。这款多模态千亿级大模型产品将直接与ChatGPT进行竞争,并主要针对ToB/G政企端客户。

华为盘古Chat是国内科技巨头继阿里和百度之后参与国产大模型军备竞赛的最新进展。凭借华为的技术能力,盘古Chat有望成为国内技术能力最强的ChatGPT产品之一,同时也将为华为的生态产业链企业带来益处。

据了解,盘古大模型的立项始于2020年11月,华为内部团队为其确定了三项关键的核心设计原则。首先,模型规模庞大,能够吸纳海量数据;其次,网络结构强大,能够充分发挥模型的性能;最后,具备优秀的泛化能力,能够真实应用于各行各业的工作场景。

在与其他厂商的比较中,华为具备完整的产业链和强大的算力调配能力,这可能成为其在盘古Chat上的优势。据浙商证券披露,为了训练千亿参数的盘古大模型,华为团队调用了超过2000块昇腾910芯片,进行了超过两个月的数据训练。据华为内部称,每年训练大模型时,调用的GPU/TPU卡数量超过4000片,3年的大模型算力成本高达9.6亿元人民币。

值得一提的是,盘古大模型的训练成本较高,因为其参数规模非常庞大。然而,它在中文语言处理方面表现出较高的准确度和质量。

综上所述,华为即将发布的盘古Chat多模态千亿级大模型产品有望成为国内技术能力最强的ChatGPT产品之一。华为的完整产业链和强大算力调配能力将为该产品带来竞争优势,并为华为生态产业链企业带来机遇。