对标GPT-4o商汤推出日日新5o实现实时交互
对标GPT-4o,商汤推出日日新5o实现实时交互
·徐立表示,人工智能大模型某种程度上只是“记忆器”,思维能力、实时交互、可控生成才能推动模型落地。今年着重优化模型端侧,用好端、云两部分的计算机资源,实现全自然的交互模式。
商汤科技董事长兼CEO徐立。
和它打个招呼,它便能根据打招呼的人身上佩戴的胸卡带子,判断出对方在世界人工智能大会,并说“在这个地方可以好好学习”。7月5日,在2024世界人工智能大会暨人工智能全球治理高级别会议期间,商汤科技在“大爱无疆·向新力”人工智能论坛上发布“日日新5o”,交互体验对标GPT-4o。
“日日新5o”能够实现实时交互体验,正是源于“日日新5.5”基础模型能力的提升。
“日日新5o”识别图文,实时给出理解总结。
据了解,相较于今年4月发布的“日日新5.0”,“日日新5.5”综合性能平均提升30%,数学推理、英文能力和指令跟随等能力增强。“日日新5.5”采用混合端云协同专家架构,最大限度发挥云边端协同,降低推理成本,训练数据超10TBtokens,包括大量合成的思维链数据,提升推理思维能力。
对于大模型应用落地,7月4日,商汤科技董事长兼CEO徐立在2024世界人工智能大会产业发展主论坛上表示,要推动人工智能超级时刻的到来,大模型需要具备更卓越的思维能力、更自然的交互能力以及更可控的生成能力。同时,只有不断深入垂直行业,大模型才能创造出全新应用格局,最终助力“人工智能+”步入黄金时代。
徐立表示,GPT带来的聊天式应用、Sora带来的视频,都没有到达超级时刻,“因为它没有真正走进到一个行业的垂直应用当中引起广泛的变化。”他认为,人工智能大模型某种程度上只是“记忆器”,“它只是背下了所有知识点,它仅有的一点点智能来自于互联网上数据背后带有的高阶逻辑思维链。大模型在垂直领域的突破,是跟真实世界交互形成执行数据。”
在徐立看来,实时交互能够带来流畅体验,是推动超级时刻到来以及应用变化的核心之一。“端侧是一个重要突破点,我们今年着重推动模型的端侧优化,用好端、云两部分的计算机资源,才能实现全自然的交互模式。”徐立表示,其端侧大模型已支持在智能手机、平板电脑、VR一体机、车载电脑、智能台灯等设备部署应用,每台设备的使用成本降低至每年9.9元。
此外,徐立表示,模型落地要求所有的生成可控,“你需要知道你哪里做得不好、做哪些修改,有了这些边界,才能做到真正的可控和可持续。”
(原标题:商汤推出日日新5o,交互体验对标GPT-4o)