大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发

金磊发自凹非寺
量子位|公众号QbitAI
1、2、3、4、5、6、7、8、9、10……
谁能想到 , 在现如今大模型当道的节点上 , 别家都是一次发布一个或几个 。
百度呢?
一口气 , 10个!
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
文章图片
如果把它们归拢归拢 , 打开方式是这样的 , 主要涵盖三大类:
基础大模型任务大模型行业大模型值得一提的是 , “行业大模型”是属于业界首发的那种 。
然后百度还说了 , “好马得配好鞍”啊 。
于是乎 , 为了能让开发者使用大模型时用得舒服 , 顺便推出了一系列开发套件、大模型API、开放平台 。
还为了让开发者们基于大模型迸发更多富有想象力的新事物 , 打造了一个新社区——旸谷大模型创意与探索社区 。
而作为支撑大模型的底座 , 位居中国深度学习平台综合市场份额第一的飞桨 , 也迎来了六个方面的全新升级 。
这就是在每年约定俗成的深度学习开发者盛会——WaveSummit2022中 , 百度提交的最新“AI大作业” 。
除此之外 , 纵观整场发布会 , 百度提及的两个关键词显得格外醒目:
一个是“AI越来越普惠”;另一个是“大模型产业落地关键年” 。
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
文章图片
△百度首席技术官 , 王海峰
通俗点来说 , 可以理解为把AI门槛降下去(降维) , 让强模型用起来(出击) 。
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
文章图片
那么百度真的让“用AI”这事 , 变得够easy了吗?
以“难用”著称的大模型 , 今年要在产业落地的解法又该是什么?
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
文章图片
△百度集团副总裁 , 吴甜
我们不妨一同来看一看 。
时隔半年 , 大模型要规模化“上岗”说起搞大模型这事 , 早在去年12月份 , 飞桨便有过一次大动作 。
当时发布的是全球第一个千亿级知识增强大模型——鹏城-百度·文心大模型(下文简称“文心大模型”) , 参数量达到了2600亿之多 。
而此次时隔仅半年再发的10个大模型 , 正是基于此 。
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
文章图片
对比着来看 , “基础通用大模型”和“任务大模型”有8个新的大模型上线:
例如:
NLP大模型新增了ERNIE3.0Zeus , 它是一个任务知识增强千亿级大模型 。
可以使用统一的接口和方式同时处理各类应用任务 , 包括开放问答、信息抽取、情感分析、语义匹配等 。
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
文章图片
跨模态大模型ERNIE-SAT , 语音-语言跨模态大模型 。 在预训练过程中将中英双语对应的音素作为输入 , 让模型学习不同语言间音素的对齐以及语言与语音的对齐 , 同时对语言和语音做联合掩码学习 。
ERNIE-GeoL , 地理-语言跨模态大模型 。 有了它 , 像搜索“北京西火车站”这样不规范词语时 , 可以理想地对应到真实地理坐标上的“北京西站”(已经用在了百度地图) 。
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
文章图片
CV大模型VIMER-UFO2.0 , 参数规模170亿 , 是业界规模最大的多任务统一视觉大模型 。
它的一大特点 , 是在训练的时候可以把多个任务放到一起来联合学习 , 例如可以同时完成机动车、非机动车、行人等特征的提取 。