“商量2.0”的进化,站在商汤科技的大模型布局当前
我们正在经历一场声势浩大的AI新基建大潮。
(相关资料图)
半年之内,大模型从小范围共识迅速扩散。中信所发布的报告显示,目前已发布的参数模型超过10亿的大模型数量已经接近80个,一半来自企业,一半来自科研机构。
国内大模型生态逐渐形成的过程中,也开始剥离对OpenAI的追随逐渐寻找适合自己的道路。衡量大模型成功与否的标准,也从硬桥硬马的参数竞赛,来到了真刀真枪的解决问题上。
商汤科技在今年4月首次公布了“日日新SenseNova”的大模型体系,发布了包括自研中文大语言模型“商量SenseChat”在内的多个AI大模型及应用。近日在世界人工智能大会上,商汤科技宣布了“日日新SenseNova大模型”体系的第一次重大迭代。大语言模型“商量”升级到2.0版本。
它更强了。在整个商汤科技大模型布局体系中,它的作用也愈发明显。
更强的“商量2.0”
怎么直观体现“商量2.0”的能力提升? 商汤科技董事长兼CEO徐立在现场演示了老子与孔子之间的一场并不存在的对话。
“商量2.0”的回答围绕“道”来进行。孔子向老子问道,老子虽然已经悟道,但无法与孔子言说,只是拂袖而去。这一场演绎出的对话行云流水。“商量2.0”甚至在文中加了一个玩笑:
孔子曰:“吾闻夫子大名,今日得一见,实乃三生有幸!”
老子笑道:“非也,吾与汝同道而行,何来‘三生’?”
并且依据问题,整个对话以文言形式出现。并且为了避免混淆,“商量2.0”也在回答的第一句话写明了“这只是虚构之作,不应被视为历史的真实记录”这样的前提。
“商量1.0”首次推出时,现场的演示已经展现了它优秀的多轮对话以及人机共创能力。三个月后,“商量2.0”在知识信息准确性、逻辑判断能力、上下文理解能力、创作性等方面都有了更多提升。
比如用“商量2.0”来做旅行规划,并且吩咐它做成表格:
或者来考验考验关于“女朋友说的都对”的事:
甚至不只是能读懂女朋友,“商量2.0”还能读出点反讽或者阴阳怪气的语气了:
这三个月“商量2.0”到底经历了什么,其实看看几场考试结果就知道了。在全球范围内的三个权威大语言模型评测基准(MMLU、AGIEval、C-Eval)的测评结果中,“商量2.0”的表现都超过了ChatGPT。
除此之外,可能有一些人在前面老子与孔子对话的演示照片中注意到了“商量2.0”出现了XL和S两个版本的分屏演示,这是“商量2.0”在升级后增加了更多不同参数尺寸的大模型以供客户选择,其中最小参数的模型版本甚至可以跑在手机终端上。
在语言上“商量2.0”新增了阿拉伯语和粤语等新语种。支持简体中文、繁体中文以及英语等多语言之间的交互。并且“商量2.0”对超长文本的支持,也从2k提升到 32k,能够更加充分理解上下文。
对于商汤科技这样核心面向ToB的大模型厂商来说,大模型本身的素质只是起点,企业客户如何以自己的需求给大模型定义出具体轮廓,后者如何实现稳定的迭代流程并一步步逼近真实的痛点,是最终分胜负的地方。
开放知识库融合能力
商汤科技训练出一个具备超强的理解、对话、推理等能力的“商量2.0”后,企业客户还可以用自己沉淀下来的企业知识让大模型变成能够服务好自己企业的“专业人才”。
如何高效解决这些工程问题非常重要。
商汤科技此次推出的“商量2.0”新增了知识库融合接口,让企业可以无需等待基础大模型的迭代升级,快速拥有专业知识和能力。融合了知识库后,可以增强模型对知识更新理解的能力,加强知识的快速理解和获取,同时客户训练模型的成本会大幅降低。
商汤科技联合创始人、首席科学家王晓刚表示:“有了知识库,不需要进入到我们的模型本身,就可以比较简单、方便地将这个领域的相应知识总结在一起”,并且因为信息更加准确,也解决了幻觉的问题。
作为效率工具的数字人
“商量2.0”的全面升级的同时,“日日新SenseNova大模型”体系内AIGC平台能力也在不断突破,并且在融合语言大模型能力后,实现了跨越式提升。
比如前面提到的文生图创作平台“秒画”此次升级到了3.0版本,模型参数提升到了70亿量级,生成图片的细节刻画达到专业摄影级别。而在提示词这个头疼问题上,“商量2.0”为“秒画3.0”提供了提示词的自动扩展能力。这意味着用户只需要少量简单的提示词就可以达到一张细节丰富的图像结果。
而在数字人领域,此次商汤科技的数字人视频生成平台“如影”也升级到了2.0版本,“如影2.0”的语音和口型流畅度的提升超过30%,并且可以实现4K视频效果。发布会上,经济学家任泽平、延参法师以及徐立本人的数字人形象现身,效果足以乱真。
在大模型的落地场景中,数字人是一个非常重要的承载方式,近日十分火热的数字人直播带货就是一个典型场景。而直播带货包括短视频也是“如影2.0”在3个月内测和公测中间,客户最聚焦的场景之一。
商汤科技数字文娱事业部总经理栾青表示,在AIGC这个大框架内,“商量2.0”可以承担短视频直播的文案和剧本创作。而“如影2.0”如何在交流上能够紧跟潮流,也要依靠“商量2.0”的语言大模型能力去学习时新的短视频语料。
短视频和直播场景之外,“如影2.0”正在加速进入各行各业。
比如保险行业,每一个保险专员都有为客户宣传新产品或是其他个性化的服务型内容输出需求,“如影2.0”可以在客户的生日或某个理财产品发布的节点去代替保险专员做个性化的内容和服务;在教育行业,“如影2.0”已经开始协助国内头部职业教育平台的教师制作教育素材,解决内部对视频制作的需求。
“数字人是一个很典型的企业内部的效率工具。”栾青表示。
如影作为一个AIGC创作平台未来会继续在视频生成领域做深,栾青认为这是由于内容创作正在经历一个从文字、图片到视频的维度变化。
迈向多模态
由于图片与视频信息在真实世界中的占比极大,远超语言信息,对于真实世界的理解需求让基础大模型的未来一定会走向多模态,这一点透过“商量2.0”已经初见端倪。
除了文字,“商量2.0”拥有了对图片和视频内容的分析能力。
比如,如上图展示,“商量2.0”可以在一张杂乱的办公桌照片中识别出具体物件之后,结合每个物品的特性来回答“当你感觉热时,你会做什么”这样接近流程设计的开放问题;或者在看到一张菜单照片后,帮助用户在一个限定价格区间内给出点菜方案。
最初从计算机视觉的研究切入AI领域,已经跨过一次AI浪潮的商汤科技更确信这一次大模型拉起的浪潮会是一次真正的机会。
现在的大模型研究都是基于transformer网络架构。“商汤从2019年开始从事大模型研究,那时候做视觉走的就是这条路线”,在商汤科技联合创始人、首席科学家王晓刚看来,今天一些视觉标准和自然语言标准正在逐渐趋向融合,“我们往多模态方向发展的时候,语言、视觉开始有更加深度的融合,就体现出比较强的这方面的积累和能力。”
我们现实生活当中遇到的很多应用场景,如在自动驾驶、机器人等等一系列领域,都要运用到多模态。“但是多模态的数据和一些任务,往往不容易获取,需要有很深的行业积累,这方面也是商汤的优势所在。” 王晓刚介绍到。
在今年世界人工智能大会,首次公开亮相三个月后,商汤“日日新SenseNova大模型”体系以全面升级的姿态对企业级用户开放。同时许多人没有注意到,商汤还联合上海人工智能实验室一起布了书生多模态大模型。未来,商汤是否能率先找到决胜多模态之路的钥匙,很值得期待。
转自品玩
相关推荐
- (2023-07-11)“商量2.0”的进化,站在商汤科技的大模型布局当前
- (2023-07-11)基础化工2023H1业绩前瞻:能源成本快速回落 化工价差逐步企稳 Q2行业盈利底部震荡
- (2023-07-11)九洲集团:共享储能项目分两期建设 预计一期项目在年内实现并网
- (2023-07-11)4至6月工伤预防宣传季成效显著 四川攀枝花工伤预防工作步入佳境
- (2023-07-11)基金收益率怎么算
- (2023-07-11)中国与卡塔尔举行人权磋商
- (2023-07-11)激活乡村数字化人才“引擎”
- (2023-07-11)拜仁斗不过列维,五件球衣的钱都要,摇钱树能拱手相让吗
- (2023-07-11)湖人为什么不着急讨论提前续约戴维斯?
- (2023-07-11)周杰伦晒打网球合照 与余文乐等好友默契搭肩笑容灿烂
- (2023-07-11)沈梦辰晒氛围感街拍照 穿白裙秀美腿青春靓丽
- (2023-07-11)张婧仪分享24岁生日照 白色波点裙捧蛋糕许愿甜美可爱
- (2023-07-11)杨丞琳卡零点给李荣浩庆生 连续九年尽显恩爱甜蜜
- (2023-07-11)10:48 A股复合集流体反复活跃,沃格光电拉升封板
- (2023-07-11)杨洋分享《我的人间烟火》片场照 校服战损妆少年破碎感
- (2023-07-11)午评:三大指数小幅上涨,半导体芯片股全线走强
- (2023-07-11)中国男装产业如何顺势而为?中国男装节及2023男装专委会年会将于本月揭晓答案
- (2023-07-11)2023年养老金上调最新方案公布在即!高龄倾斜能达到100元吗?测算一下
- (2023-07-11)进击的巨人:马加特才是演技派,叛徒不应该被原谅
- (2023-07-11)三峡电站累计发电超16000亿千瓦时 减少二氧化碳排放量约13.2亿多吨
- (2023-07-11)申港证券给予顺鑫农业买入评级,首次覆盖报告:升级带动结构跃迁业务改革持续提速
- (2023-07-11)盟升电子:7月10日融资买入2002.47万元,融资融券余额1.29亿元
- (2023-07-11)10:04 东数西算概念股震荡走高 曙光数创涨8%
- (2023-07-11)10:17 传媒娱乐板块震荡回暖,北京文化涨超9%
- (2023-07-11)城市自动辅助导航驾驶加速落地 智能驾驶元年开启
- (2023-07-11)【星岛热评】良莠不齐,网络语言犹如双刃剑
- (2023-07-11)中央网信办:加强“自媒体”管理 严防假冒仿冒行为
- (2023-07-11)山东掘金“互联网+宠物” 宠物经济掀吸金热潮
- (2023-07-11)陕西安康持续做强生态产业
- (2023-07-11)北京:开创首都文旅高质量发展新格局
每日推荐
- ETF联接基金是什么意思?ETF基金和ETF联
- 货币基金的收益高吗?货币基金一般年收益
- 基金卖出了怎么还有收益显示?基金已经赎
- 投资的基金买了几天可以卖掉?基金入手多
- 基金终于回本了该不该赎回?基金终于回本
- 二月出境复飞航线超40条 节后部分机票价
- 重大事项变更!网易宝获批增加注册资本至
- 信达证券上市首日涨幅44%
- 总投资约486亿元 北京今年首批50个重大
- 新年北京首月二手住宅网签量再探底 价格
- 股价大涨 博云新材股东高创投拟趁机减持
- 2019华人歌曲音乐盛典在澳门举行
- 喜迎十九大•欢度中秋节—传统文化进社区
- 突发!吴敏霞夫妇挑婚戒被曝光!两百万钻
- 《钟山说事》 热点聚焦:胡鹏飞的最美乡
- 湖南御福天益生物公司被指涉嫌传销进行非
- 大同市城投公司刘建婷遭群众举报
- 鲁能集团 “一带一路”履责行动暨“海南
图片新闻
48小时频道点击排行
-
0
1“商量2.0”的进化,站在商汤科技的 -
0
24至6月工伤预防宣传季成效显著 四川 -
0
3激活乡村数字化人才“引擎” -
0
4中国男装产业如何顺势而为?中国男装 -
0
5三峡电站累计发电超16000亿千瓦时 -
0
6城市自动辅助导航驾驶加速落地 智能 -
0
7山东掘金“互联网+宠物” 宠物经济 -
0
8公告速递:信诚增强收益债券(LOF) -
0
9迈步者户外运动俱乐部(问下迈步者SE -
0
10泰福泵业:连续4日融资净偿还累计240 -
0
11天津市气象台发布暴雨黄色预警 -
0
12加勒比海背风群岛发生6.6级地震 -
0
13云南搭建技能培训平台 提供配套创业 -
0
14外媒:每天消耗100万只!蟋蟀面粉制 -
0
15津门虎在中超刚有夺冠希望,王牌指挥 -
0
16私募投资基金首部行政法规出炉 解读 -
0
17聊城最美志愿者谢丽丽——壹点新意工 -
0
18《博德之门3》法师之手戏法用法 -
0
19元道通信:公司股东秉鸿共拓及一致行 -
0
20普利制药: 2022年年度权益分派实施公告