日日新5.0大模型领先性获市场广泛认同,商汤资本市场大获认可三日股价翻倍

对此市场给热烈反馈,商汤科技股价三连涨实现翻倍,创下上市后单周最高涨幅。

近日,商汤揭晓“日日新 SenseNova 5.0”多模态大模型,模型采用混合专家架构,经过超过 10TB tokens 的训练,覆盖大量合成数据,显著提升模型的推理能力和上下文理解窗口,聚焦知识、数学、推理及代码能力增强,全面对标 GPT-4 Turbo。

产品侧,商汤业内首推“云端边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

对此市场给热烈反馈,商汤科技股价三连涨实现翻倍,创下上市后单周最高涨幅。其中4月24日商汤大涨超过30%;25日持续受到市场热捧,盘中最高涨幅20%;26日,商汤盘中股价一度涨超48%至1.23港元。截止26日收市,商汤股价报收1.19港元,上涨43.37%,成交41.5亿港元。此轮反弹,商汤价值修复势头明显,三天暴涨95%。

市场普遍认为,日日新5.0大模型展现出的技术领先性,以及全面的产品布局,将有效驱动其生成式AI持续高速发展。

日日新5.0大模型领先性获市场广泛认同

据了解,此次日日新 5.0”大模型的能力提升主要基于三个方面:

  1. 1.采用混合专家架构(MoE),激活少量参数就能完成推理,且推理时上下文窗口达到 200K 左右;
  2. 2.基于超过10TB tokens训练、覆盖数千亿量级的逻辑型合成思维链数据;
  3. 3.商汤AI大装置SenseCore算力设施与算法设计的联合调优。

上述提升具体驱动了商汤大模型应用在自然语言能力、文生图能力以及多模态图文感知能力方面的全面提升。日日新5.0打破了传统作文的“八股式”写法,将通用知识、新知识融会贯通,实现更开放式的创作,推理时上下文窗口可以有效到 200K左右;商汤秒画能够在人像生成中表现出很好的皮肤纹理,并把文字完美融入画作中,在这些方面的能力对比Midjourney、Stable Diffution 3、GPT-4V等行业内头部模型毫不逊色。

“日日新5.0”在多模态图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU取得领先成绩。

同时,商汤对于算力的前瞻性布局也获得市场充分认可,其投资并运营国内最大的AI基础设施SenseCore大装置优势明显,并已在基模型研发和生成式AI应用方面取得显著支撑。

商汤2023年业绩显示,目前商汤大装置的总算力达到12000 petaFLOPS,相较2023年初提高一倍,GPU数量达到45000张,并实现了万卡万参的大模型训练能力。在此基础上,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。2023年商汤生成式AI业务增长超预期,收入达12亿元,同比增长200%。

此外,商汤科技还展示了大模型生成视频能力,令人印象深刻。可见,商汤科技在文生视频平台方面也取得了技术突破,未来,通过输入一段文字或一个完整的描述,就可以生成一段视频,而且人物的服饰、发型、场景都可以根据预先设定,保持视频内容的连贯性和一致性。

商汤大模型产品矩阵布局完善,商业化应用实力获市场认可

市场对商汤的热烈反馈,也取决于此次商汤展现出的产品力。商汤在此次技术交流日邀请了金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴嘉宾,共同探讨和交流大模型技术在不同领域的应用及前景。

在办公场景内,基于“日日新”大模型的卓越代码生成及工具调用能力,商汤帮助WPS 365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。

在金融领域,海通证券与商汤科技联合发布金融行业多模态全栈式大模型,推动了智能客服、合规风控、代码辅助、展业办公助手等领域业务落地,并共研智能投顾、舆情监控等行业前沿场景,打通证券行业大模型落地的全栈式能力。

在个人出行场景,商汤大模型技术更是联入小米汽车SU7的智能车舱中,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。

据了解,在过去一年,商汤生成式AI业务超过70%的客户为新客户,这不仅彰显了市场对商汤技术的广泛认可,也为公司业务增长注入了强劲动力。随着各行各业的用户对大模型技术的应用需求大幅度增长,为满足各领域的使用需求,商汤推出日日新·端侧大模型,性能实现同等尺度性能最优,跨级尺度全面领先。

同时,针对金融、代码、医疗、政务等重点行业边缘AI应用需求,商汤正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,降低企业应用大模型的门槛。发布次日,商汤科技与上海投资咨询集团签署合作,并展示了双方合作打造的政务(养老)大模型一体机,能够在更低能耗的条件下拥有更高的性能表现,支持万量级的政策文档管理和检索,准确率超过90%,满足绝大部分政务咨询场景的应用需求。

对此市场分析认为,在此轮生成式AI技术应用落地过程中,商汤已经赋能了金山办公、海通证券、小米、阅文集团等客户迭代升级,并取得广泛认可。得益于成功案例的口碑传播,公司有望率先获得新增客户订单,充分受益市场需求释放带来的增长红利,从而推动业绩快速增长。