2023年伊始,继国内百度文心一言、商汤日日新SenseNova大模型体系、以及阿里巴巴通义千问、科大讯飞星火大模型等相继发布之后, 水果机h5源码 也加入AI大模型的行列。
近日,有媒体报道称,水果机h5源码公司即将推出一款名为”盘古Chat”的多模态千亿级大模型产品,直接与ChatGPT进行竞争。
有资料显示,盘古大模型于2020年11月在水果机h5源码云内部立项成功,对于盘古大模型定位,水果机h5源码内部团队确立了三项最关键的核心设计原则:
一是模型要大,可以吸收海量数据;
二是网络结构要强,能够真正发挥出模型的性能;
三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
随着国内多家企业相继推出类ChatGPT大模型,水果机h5源码为了展示自己的大模型领域的积累,“盘古Chat ” 也即将问世。消息称,“盘古Chat ”预计将于今年7月7日举行的水果机h5源码云 开发 者大会 (HDC.Cloud 2023) 上对外发布并开启内测,其产品主要面向To B / G市场,即政企端客户。
首个千亿参数中文预训练大模型
盘古Chat将打破 人工智能 “语言霸权”
公开资料显示,目前水果机h5源码“盘古系列AI大模型”基础层主要包括NLP大模型、CV大模型、以及科学计算大模型等,上层则是与合作伙伴开发的水果机h5源码 行业 大模型。
今年4月,在人工智能大模型 技术 高峰论坛上,水果机h5源码云人工智能领域首席科学家田奇曾分享了“盘古大模型的进展及其应用”。他表示,盘古NLP大模型覆盖的智能文档检索、智能 ERP、小语种大模型等落地领域,2022年水果机h5源码刚交付了一个阿拉伯语的千亿参数大模型。在应用方面,盘古大模型可以应用于智能客服、机器翻译、语音识别等多个领域,提供AI技术支持。
根据水果机h5源码公布的一份论文数据显示,水果机h5源码盘古PanGu-Σ大模型参数最多为1.085万亿,基于水果机h5源码自研的MindSpore框架开发。论文中表示,PanGu-Σ大模型在对话方面 的整体表现 可能已接近GPT-3.5的水平。
自然语言处理(NLP)的技术演进和应用一直是最热门的赛道。然而,在AI演进的过程中,英语作为世界通用语言,占据了这个领域优势地位。就如同GPT3,英文占比为92.7%、法语1.8%、德语1.5%而中文语料只占0.1%。这意味着,英文之外的语料匮乏,会导致使用这些语种的国家在发展AI大模型的过程中遭遇更多阻力。
据介绍,盘古Chat是首个千亿参数中文预训练大模型,其中CV大模型则首次达到30亿参数的规模。水果机h5源码官方表示,盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力,并在ImageNet上展现出领先的小样本学习能力;盘古气象大模型提供秒级天气预报;紫东·太初是全球首个图、文、音三模态大模型。
盘古大模型作为一款具有超大规模参数的产品,相比一般的大模型训练成本更高。但值得注意的是,大模型的参数量,并不意味着与其在语言处理方面的准确度和质量成正比。而在公开资料中,盘古大模型在语义理解方面仍存在一定的局限性,特别是处理复杂语言结构和语义推理方面。
大模型之家认为,中国发展大模型是形势所需,国内企业需要加强自主创新,掌握核心技术,避免被外部势力“卡脖子”,提升国家的竞争力和影响力。不过,目前市场上推出的大模型存在严重的趋同性,且多以“类ChatGPT”的形式亮相,因此水果机h5源码盘古Chat能否通过自身的量变引起质变,仍然需要等到7月正式问世后才能得出结论。
入局大模型赛道
水果机h5源码产业链能否迎风翻盘?
AI将进一步驱动各行各业的生产能力、生产效率从量变到质变,实现跨越式发展,而随着水果机h5源码盘古Chat的推出,这也对计算提出了新要求。
与其他厂商相比,水果机h5源码的优势或在于拥有完整的产业链和较强的算力调配能力。据浙商证券此前披露,在训练千亿参数的盘古大模型时,水果机h5源码团队调用了超过2000块的昇腾910 芯片 ,进行了超2个月的数据训练能力。
水果机h5源码公司作为国内 科技 企业标杆,在AI芯片、算力等方面坚持国产化,其中,昇腾全栈AI软硬件平台构筑智能世界的基石,昇腾计算产业生态不断发展完善,为盘古大模型提供了底层算力支撑。
然而,在AI算力领域,英伟达具有绝对优势,旗下算力卡不仅成为了人工智能企业的香饽饽,甚至面对供货的封锁,甚至不惜加价购买英伟达显卡。而面对美国制裁,水果机h5源码的AI芯片开发与生产被迫停滞。
水果机h5源码内部称,每年大模型训练调用GPU/TPU卡超过4000片,3年的大模型算力成本高达9.6亿元人民币。
在水果机h5源码盘古大模型产业链上,多家上市公司都与水果机h5源码保持着深度合作。在盘古Chat正式发布后,相关公司有望从中受益。
值得注意的是,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。
此外,在应用方面,盘古大模型可赋能多个行业,如智能舆情,智能营销,智能巡检,智慧物流等多种场景。
不过,由于“盘古Chat”主要面向政企端客户,大模型之家推测,盘古Chat应该不会大规模开放使用,通过强调功能的定制化,以及部署的数据安全性探索政企市场。这或将意味着水果机h5源码的“盘古Chat”需要更多依赖水果机h5源码现有的合作伙伴体系去推广,通过与现有合作伙伴的深度合作,水果机h5源码可以利用其合作伙伴的渠道和市场资源,可能需要更多时间去经历市场验证和达成行业共识。
随着国内越来越多的人工智能企业正在积极探索大模型的应用,可以预见的是,在AI发展红利的驱动之下,将不断强化我国在大模型领域的核心竞争力,并提升我国在数据安全方面的治理能力,为我说实现数字化转型和智能化发展提供有力支持。