大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发金磊发自凹非寺量子位|公众号

金磊发自凹非寺
量子位|公众号QbitAI
1、2、3、4、5、6、7、8、9、10……
谁能想到，在现如今大模型当道的节点上，别家都是一次发布一个或几个。
百度呢？
一口气， 10个！

文章图片
如果把它们归拢归拢，打开方式是这样的，主要涵盖三大类：
基础大模型任务大模型行业大模型值得一提的是， “行业大模型”是属于业界首发的那种。
然后百度还说了， “好马得配好鞍”啊。
于是乎，为了能让开发者使用大模型时用得舒服，顺便推出了一系列开发套件、大模型API、开放平台。
还为了让开发者们基于大模型迸发更多富有想象力的新事物，打造了一个新社区——旸谷大模型创意与探索社区。
而作为支撑大模型的底座，位居中国深度学习平台综合市场份额第一的飞桨，也迎来了六个方面的全新升级。
这就是在每年约定俗成的深度学习开发者盛会——WaveSummit2022中，百度提交的最新“AI大作业” 。
除此之外，纵观整场发布会，百度提及的两个关键词显得格外醒目：
一个是“AI越来越普惠”；另一个是“大模型产业落地关键年” 。

文章图片
△百度首席技术官，王海峰
通俗点来说，可以理解为把AI门槛降下去（降维），让强模型用起来（出击）。

文章图片
那么百度真的让“用AI”这事，变得够easy了吗？
以“难用”著称的大模型，今年要在产业落地的解法又该是什么？

文章图片
△百度集团副总裁，吴甜
我们不妨一同来看一看。
时隔半年，大模型要规模化“上岗”说起搞大模型这事，早在去年12月份，飞桨便有过一次大动作。
当时发布的是全球第一个千亿级知识增强大模型——鹏城-百度·文心大模型（下文简称“文心大模型”），参数量达到了2600亿之多。
而此次时隔仅半年再发的10个大模型，正是基于此。

文章图片
对比着来看， “基础通用大模型”和“任务大模型”有8个新的大模型上线：
例如：
NLP大模型新增了ERNIE3.0Zeus ，它是一个任务知识增强千亿级大模型。
可以使用统一的接口和方式同时处理各类应用任务，包括开放问答、信息抽取、情感分析、语义匹配等。

文章图片
跨模态大模型ERNIE-SAT ，语音-语言跨模态大模型。在预训练过程中将中英双语对应的音素作为输入，让模型学习不同语言间音素的对齐以及语言与语音的对齐，同时对语言和语音做联合掩码学习。
ERNIE-GeoL ，地理-语言跨模态大模型。有了它，像搜索“北京西火车站”这样不规范词语时，可以理想地对应到真实地理坐标上的“北京西站”（已经用在了百度地图）。

文章图片
CV大模型VIMER-UFO2.0 ，参数规模170亿，是业界规模最大的多任务统一视觉大模型。
它的一大特点，是在训练的时候可以把多个任务放到一起来联合学习，例如可以同时完成机动车、非机动车、行人等特征的提取。