商汤大模型体系技术迭代与应用落地持续加速 盘活“人、物、场”全场景

2023-07-10 07:26:29 来源:每日经济新闻

自4月发布“日日新”大模型以来,商汤围绕大模型体系及相关产品的技术迭代与应用落地持续加快。


(相关资料图)

近日,商汤科技在其举办的名为“大爱无疆·日日新”的人工智能论坛上,再度宣布对“商汤日日新SenseNova”大模型体系进行全方位升级更新。

“大模型的突破掀起了人工智能的新一轮技术革命,随之而来的是产业需求呈现爆炸式增长,全新的应用场景和应用模式正迅速涌现。”商汤科技董事长兼CEO徐立在论坛上表示。

“日日新”大模型再迭代

徐立表示,商汤希望通过“大模型+大装置”持续推动AI基础设施能力的跃进提升,不仅打造通用能力更加强大的基础模型,也进一步高效融合不同垂直领域的专业知识,构建更懂行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛,让大模型的产业价值在千行百业中绽放。

自4月10日发布“日日新SenseNova”大模型以来,商汤大模型体系在其“大模型+大装置”的AGI战略布局下,正进行着高速迭代。

具体而言,作为千亿级参数的自然语言处理模型,商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求,降低部署成本。

此外,作为商汤未来构建“人、物、场”组合拳的如影、琼宇以及格物三大平台,同样再度迭代升级。

商汤如影SenseAvatar 2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,并带来AIGC生成形象及数字人歌唱功能。

基于神经辐射场技术(NeRF)的大场景3D内容生成平台商汤琼宇SenseSpace2.0在空间重建效率上提升20%,渲染性能提升50%,每100平方公里场景的建图仅需38小时即可完成(1200 TFLOPS/秒算力支持),同等工作量由人工建图需要10000人天;渲染效率大幅提升50%,单卡1080p分辨率渲染可实现实时交互,帮助客户构建可感知、可模拟、可运营的动态数字孪生系统应用。

3D内容生成平台商汤格物SenseThings 2.0则实现了对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。

在产品落地层面,自“商汤日日新SenseNova”大模型正式发布以来,已经实现了包括在金融、医疗、电商、移动终端、产业园区等行业生产实践中的落地应用。

盘活“人、活、场”全场景

依托于琼宇+格物+如影,商汤正在试图盘活3D场景下的“人、物、场”的全场景覆盖。

商汤科技灵境空间事业部总监李宇飞认为,当前,从人们对数据的消费趋势来看,从一维文字到二维图片再到三维内容,内容本身越来越重,同时,人们对这些数据消费的信息密度也越来越高,很明显的感觉得出来对这种三维内容的消费是越来越多,这是一个未来的趋势。

那么既然消费的需求正在旺盛增长,生产趋势又会如何变化?“从商汤的角度来说,我们去提供宏观世界上随处可见的人物场的制作能力,降低从复刻到生成门槛是很有必要的,也是一个必须要抢占的赛道。”李宇飞表示。

面向线下场景,商汤在珠宝行业,依托格物2.0为珠宝品牌进行黄金首饰复刻,细致展现商品工艺特点,提升顾客购物体验。

关于格物在线下场景的落地,商汤科技灵境空间事业部总监李宇飞介绍,目前,“格物”支持多种物品品类的复刻,并突破了行业难题——高反光、镜面物体的复刻,比如珠宝首饰,小家电,金属物件等。

据悉,传统的重建技术通常难以解决高反光,镜面物体的采集和复刻。然而,“格物”不仅可以避免伤害和改变物品的情况,还能精确还原物品的外观和特征。除此之外,“格物”包含一键成图和一键成片等再创作服务。通过一键成图功能,用户可以生成商品与场景融合的海报,或者试穿试戴的真人海报,相比其他AI技术只能部分还原商品细节,一键成图可以100%还原商品的各个视角和效果。

而另一方面,则来自日日新大模型所提供的强力技术托底。“它在不断地帮我们去训练神经网络深度学习,来提升我们的效率。”李宇飞表示。

他认为,内容消费正在升级,同时,大模型学习和输出的需求也存在,所以商汤基于日日新大模型体系,对人、物、场的全面构建,将为用户提供更低门槛、更高效的复刻和生成工具,去赋能百业,为各行各业去提供生产力,最终实现商汤赋能百业的愿景。

“大模型+大装置”战略前瞻布局

技术迭代与产品落地持续加速跑背后,商汤更加明确地锚定“大模型+大装置”的AGI战略。

商汤前瞻性打造新型人工智能基础设施——商汤AI大装置SenseCore,打通算力、算法和平台,并在此基础上建立商汤“日日新SenseNova”大模型及研发体系,以低成本解锁通用人工智能任务的能力,推动高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,引领人工智能进入工业化发展阶段。

商汤SenseCore AI大装置在年内持续扩建,已完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力,以AI-as-a Service(AIaaS)的模式面向行业伙伴提供服务。目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。

基于商汤自研的AI大装置,在大模型站上风口之前,商汤对于大模型推理部署、增量训练已经是其常规业务。目前,商汤大模型的推理部署可以将推理的效率提升100%以上;基于大装置,商汤将大模型微调的成本降低至原来的1/10。

目前,国内人工智能技术持续迭代,大模型技术已逐步成熟并开始在办公、游戏、广告营销等领域商业化落地,AI大模型技术正在开启新一轮产业革命,市场空间广阔。

国联证券研报认为,AI大模型正在开启商汤二次增长曲线。商汤科技在研发投入、业务规模等方面处于行业领先地位,也是国内率先布局AI大模型的厂商,叠加在多个应用场景中的应用实践,公司在AI领域积累了丰富的技术和应用经验,有望在AI2.0时代占据领先优势,推动公司业绩进一步增长。 文/鲁鲁

标签: