9月12日至16日,以“数字引擎 贸易未来”为主题的上海城市形象展区将亮相2024中国国际服务贸易交易会,集中展示上海在国家战略引领下高起点全面深化改革开放、建设上海经济技术合作区和“丝路电商”合作试验区、努力打造国家服务贸易创新发展示范区、推动服务贸易高质量发展等方面取得的成果和亮点。一起来探秘上海城市形象展区的服务贸易企业吧。
MiniMax副总裁刘华:
让国产大车型走向世界与国内外用户共同创造智能
如何营造随时随地学英语的语言环境?两个月前,90后小花用一款名为“海螺AI”的APP学英语。“比如,你可以让AI在咖啡厅里练习口语,然后你可以和AI对话,还可以让AI纠正自己不恰当的表达。”
其实,这并不是一款专门用来学习外语的APP,而是由于其智能助手的特性,被用户“开发”成各种用途。
据了解,海螺AI来自上海人工智能科技公司MiniMax。自2021年成立以来,MiniMax已获得IDG、高瓴、中国人寿、阿里巴巴、腾讯、米哈游、红杉等多家国内外知名机构超过10亿美元融资。在本届服贸会上,其也将携其最新的大规模模型成果亮相现场,展现人工智能的前沿魅力。
MiniMax副总裁刘华告诉记者,虽然起步较晚,但MiniMax从一开始就立志要走全栈自研大模型的道路,无论是2B还是2C业务,都是为了让自己的自研大模型能够触达更多的用户,希望用人工智能技术让每个人的生活更加便捷,践行“与用户共创智能”的公司宗旨。
除了海螺AI,小花还使用了MiniMax旗下另一款软件“星野”,与定制虚拟伙伴聊天。用户可以在星野APP上设置智能实体的形象、声音、性格,并与其实时交流互动,建立情感连接。
在2B业务端,MiniMax开放平台迄今已服务超过3万家企业客户,是中国公有云最大的模型开放平台。例如,MiniMax为金山办公提供文本生成、重点提要、任务分发、表格及演示生成等能力,助力其打造“WPS AI”产品;MiniMax也是联想指定大模型供应商,共同打造AIPC个人智能体联想小天。
这些成绩的背后,是 MiniMax 自研的模型。作为中国首家研发万亿参数 MoE 大语言模型并成功上线的 AI 公司,MiniMax 在模型算法上不断创新,近期推出了基于 MOE+Linear Attention 的新一代模型技术。通过这种全新的线性模型架构,MiniMax 大模型可以在单位时间内更高效地训练海量数据,大大提升了模型的实用性和响应速度。
“Abab其实就是‘阿爸阿爸’的意思,就像婴儿学说话时的状态,也有点像自嘲,因为那时候OpenAI已经把GPT3做出来了,看上去他们已经比较成熟了。”刘华说,全栈自研是一条非常艰难的路,在技术上,不仅要自己写模型代码、自己找训练数据,还要和算力厂商一起自己搭建训练模型的集群。
还有心理上的压力。研发过程中,团队需要面对一次次糟糕的结果,同时坚持研发方向的正确性。“大家都知道,大模型需要训练到一定数量的参数,才会有智能涌现的展现。我们很长时间没有看到这一点,但还是要坚信走下去是对的。如果中途放弃、改变轨道,就不会有现在的成果。”刘华说。
8月31日,MiniMax音乐模型和视频模型在MiniMax开放平台和海螺AI网页版上线,此外abab 7系列文本模型也将在未来几周内正式发布,并将采用新一代创新技术。
在国内,海螺AI和兴业APP合计月活跃用户数已达千万级。在海外,被称为兴业“海外版”的Talkie同样深受国外用户喜爱,据SensorTower数据显示,Talkie月活跃用户数已达1100万。在2B业务方面,MiniMax正在“一带一路”沿线国家和地区积极拓展。
将国产大机型推向海外,是MiniMax近几年来一直在推进的方向。“希望我们能做一家全球化企业,国内外都做业务。”刘华说,出海不仅可以服务更多国外客户,还可以直接面对海外竞争,有更大的迭代动力。
在他看来,在移动互联网时代,很多中国互联网企业和产品已经成功走出去,并在当地拥有了一定的影响力,“这样的故事,为什么在大模式时代就不能复制呢?”
其实,不仅仅是MiniMax,大模型输出已成趋势。5月23日,阿里云宣布大模型服务平台百联国际版即将上线,提供一站式、全托管的大模型定制及应用服务;科大讯飞在2024世界移动通信大会上宣布,科大讯飞同声传译、讯飞智造等产品将登陆海外市场,登陆沙特、新加坡、马来西亚等市场。
清华大学新闻学院、人工智能学院教授沈阳在接受《环球时报》采访时表示,四大因素正在推动中国人工智能大模型走向国际市场。
第一,为了扩大市场份额,企业需要寻求更大的产业空间;第二,国内人工智能技术发展迅速,而海外很多国家还处于起步阶段,人工智能大模型可以进入这些市场进行产品验证和完善;第三,全球市场特别是东南亚、北非、北美和南美等地区为人工智能技术提供了更为丰富的应用场景;第四,人工智能大模型的海外拓展也有利于深化与友好国家的经贸合作。
不过,大模式虽然风靡全球,但国内外所面临的发展环境并不相同。
刘华举例说,在大洋彼岸,大模型更多是产业界、资本界、学术界的青睐,当地的普通民众还不是很熟悉。但在国内,可以明显感受到全社会对大模型的认可度和接受度很高,大家都愿意尝试大模型产品,这为大模型产业的发展奠定了非常好的基础。
政策层面,2024年政府工作报告首次提出,要深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。具体到上海,人工智能作为上海三大主导产业之一,正积极推动“人工智能+”发展,发挥引领示范作用。
“我觉得对于我们中国现在的大型模型产业来说,既研发技术,又做出产品,提供了非常好的社会条件。”刘华说。
人工智能是新生产力的驱动力,目前MiniMax正在积极研发下一代参数更大的大模型,能够将文本、语音、视觉三种模态更自然地融合到这一下一代模型中,同时也在优化算法,降低模型实现成本。
具体来说,语音模型需要攻克的难点是交互延迟,即用户与智能代理对话时大模型的停顿时间。缩短延迟可以让它更像日常生活中人与人之间的自然交流。值得一提的是,新一代MiniMax语音模型实现了升级,支持粤语、日语、韩语、西班牙语等多种语言。
“可能大家看到的是我们利用大模型来提高个人生产力和工作效率,其实以大模型为代表的这一波人工智能技术,正在引领新一波技术革命。”刘华说,随着模型能力的提升,现在它可以充当大家的语音助手,未来也可以成为科学家的科研助手。
“随着视觉模态模型能力的提升,我们相信大型模型将能够在前线生产制造中发挥更大的作用。这是一个渐进的过程。”
作者:国际服务贸易司
评论(0)