随着人工智能浪潮的兴起,世界正在迎来一场前所未有的技术革命。
人工智能技术自20世纪50年代诞生以来,已四次引起大规模关注。我们现在正处于大型模型的第四个时代。前三个时代是专家系统时代、机器学习时代、深度学习时代。
如果后人想要回顾这个大模型时代,ChatGPT一定是一个绕不开的名字。 2022年,Open AI开发的ChatGPT-3.5问世,其技术令人惊叹。无论是写编码论文、写诗作画,弹、弹、唱都精通。
自从ChatGPT带来科技热潮以来,全国各大科技公司都开始投入资源和人力开发自己的大型模型产品,并在不同场合进行展示和推广。百模大战也开始了,标志着战争的开始。人工智能技术开始进入新时代。
如今,人工智能技术的迭代速度和应用广度达到了前所未有的高度。每一次技术突破都给人类生活带来了翻天覆地的变化。如果回顾中国大模型的发展历史,记者认为起点是2022年底。当时,国内高校率先发布大模型产品,如复旦MOSS、北大ChatExcel beta 、清华大学的“chatglm-6B”大型模型、上海交通大学公司研发的“朝燕”大型模型、东北大学的“TechGPT”……高校的涌入,拉开了这场百模型大战的序幕。
各大高校打响第一枪后,掀起了一股AI创业热潮。一时之间,优秀企业家和各大科技公司纷纷涌入这条赛道,百款之战正式打响。
最先响应的包括百度文心一言、360智能大模型1.0、智浦AI ChatGLM。后续追随者还有商汤日日新、阿里巴巴同易前文、昆仑万维天工、以及科大讯飞Spark认知、百川智能百川-7B……根据当时发布的算法注册,79个参数规模超过10亿参数规模的大型模型已经上线。已发布,国内共有41个算法完成深度合成服务算法注册。
值得一提的是,在此期间,一系列地方政策开始落地,如《北京市推动通用人工智能创新发展的若干举措》、《深圳市加快人工智能高质量发展行动计划》一系列扶持政策的落实,也为这场百款之战火上浇油。
众所周知,竞争促进高质量发展。在这场百款大战中,AI产品更新迭代正驶入快车道。各大厂商不断加大投入,《月之暗面》等新玩家也不断入局。
如今,这场百款大战已经持续了一年多,激进期已转变为稳定发展期。目前,在百款大战中,通用大型车型呈现寡头垄断的竞争格局。 “四龙六虎”以及各大厂商支持的大型车型脱颖而出。
不过,这也意味着冲进决赛的选手之间的战斗将变得更加激烈。
目前,百款之战正在向新的方向转变。此前一直在拼技术的玩家,必须面对商业化的问题。近期,AI圈内不断有传言称,由于融资降温,估值正在持续走高。大模型公司开始陷入困境,部分大模型六虎开始放弃大模型研发,转向应用。浪漫的科技遇到了现实的生存问题,但事实上,根据数据显示,国内外已有不少AI公司宣告破产。其中,有一些研发能力较强,但最终却因为缺乏后续资金的困难而倒下。毕竟,大型模型是一条极其昂贵的赛道。
滚滚长江东流,浪淘英雄。在这个大模型赛道上,每天都有优秀的企业在萌芽,也有企业每天都在失败的边缘挣扎求生。对于规模大的企业来说,变革则生存;变革则生存。如果他们不改变,他们就会死。
百款大战进入新局面。看看今天的竞争对手,谁将成为赢家并取得领先?
百花齐放,百家争鸣
截至目前,国内至少有200多家大型模型厂商推出了自己的产品。
其中包括各大互联网公司,如百度、阿里巴巴、腾讯、华为等;以及人工智能领域的老牌垂直厂商,如商汤科技、旷视科技、云从科技、四小龙为代表的依图科技等;还有一批能力突出的新兴玩家,如刘小虎智谱AI、百川智能、月之暗面、零千事、Minimax、步星等。
互联网巨头:
腾讯混元大模型是腾讯公司开发的大型语言模型,其智能元体平台是腾讯元气。作为腾讯自研的通用大语言模型,其参数规模超过万亿。目前,hunyuan-pro:万亿参数版本、hunyuan-standard:千亿参数版本、hunyuan-lite:千亿参数版本等3个版本。
统一钱文大模型是阿里云自主研发的大型语言模型。知识产权平台包括阿里云、ModelScopeGPT、钉钉AI助手等。同易钱文具有强大的语言理解、生成和推理能力,支持多语言对话和图像文本识别,广泛应用于智能搜索引擎、问答等领域系统、智能对话系统等领域,参数规模从18亿到720亿不等。
字节跳动的Skylark模型是一种基于注意力机制的深度学习语言模型,适合处理自然语言处理任务。它具有良好的并行性和效率,可以在大规模数据集上进行训练。 Skylark大模型的参数规模为1300亿,是国内最大的中文预训练模型之一。云雀大模智能代理平台包括科泽、豆宝、飞书智能合伙人。
知名厂商:
商汤科技:日日新SenseNova大机型是AI四小龙之一的商汤科技推出的一款大机型。这个大模型系统以低成本、高效率连接各种人工智能应用。提供:办公场景的商汤日日新·讨论语言大模型-数据分析版、医疗场景的日日新·讨论语言大模型。模型——医疗版“大医生”……商汤科技“日日新·讨论大语言模型”已应用于金融、手机、医疗、汽车、房地产、能源、传媒、工业制造等多个垂直行业等,已与500多家企业合作,与客户建立深度合作,加速行业企业智能化转型。
旷视科技:“旷视太一”是旷视科技推出的大型生成式人工智能模型,具有深度学习和推理能力。该模型的应用场景包括城市治理、智慧物流、智慧金融等领域。能够提供高效、智能的解决方案,帮助企业和城市实现数字化转型和智能化升级。
云从科技:云从科技推出的融融大模型包括但不限于语言大模型、视觉大模型、语音大模型、代码生成大模型、图像生成大模型等,可以通过实时学习解决问题并同步反馈结果。众多AI应用的痛点有利于个性化应用的快速普及。同时具备情景学习能力,可应用于金融、安防、政务、交通、能源、教育、医疗、娱乐等行业,交互性能更好。
依图科技:“天问”大模型是上海依图网络科技有限公司于2023年底推出的多模态大模型,是视频监控领域首款商用发布的大模型产品,基于先进的Transformer架构具有思考、对话、进化三大特征。
实力新秀:
月之暗面:Kimi是大型模型初创公司Dark Side of the Moon推出的一款智能助理产品。它在自然语言处理、长文本处理、多语言对话支持等方面具有优势。随后,通过社交媒体平台,我们在用户争夺战中占据了领先地位。
百川智能:百小影是百川智能于2024年5月22日推出的首款AI助手,它基于百川智能最新发布的大基数模型百川4,具有多轮搜索和定向搜索、文件读取和数据组织、智能交互、多模态能力、语音交互、网络和移动应用程序等能力。此外,百川智能将医疗AI作为核心业务。近期发布的AI健康顾问,证明公司专注于医疗应用场景,探索大规模医疗增强模型的用户价值和行业价值。
智普AI:被誉为国内最具Open AI气质的大型模型公司。智浦轻言是北京智浦华章科技有限公司推出的生成式AI助手,它基于智浦AI自主研发的中英双语对话模型ChatGLM2。它已经过数万亿字符的文本和代码的预训练,并使用有监督的微调技术。
Minimax:Minimax专注于图像识别和计算机视觉技术。其海螺AI基于MiniMax自主研发的多模态大模型,融合了自然语言处理、知识图谱、语音识别等人工智能技术,赋予海螺AI强大的语义理解和知识推理能力。此外,Minimax还有一款AI伴侣产品“星野”。
零一事:科技行业大亨李开复博士创立的人工智能公司。其大型号产品包括Yi-34B、Yi-Lightning、Yi-Large等,应用场景包括但不限于智能问答、智能文档阅读、文档内容自动分析理解、复杂推理PPT自动生成等和预测。
踏星:以前大模型的布局是四龙五虎,最近变成了四龙六虎。第六只老虎是步星科技(Step Star),由前微软全球副总裁蒋大新于今年6月创立。这家公司是资本市场的新宠。它以20亿美元的一轮融资登上了AI独角兽的宝座,从而确立了第六虎的地位。其推出的“迈步系列”通用大型机型,令业内人士眼前一亮。其Step-2万亿参数MoE语言大模型在国内首次发布。
国外AI主流玩家
近两年,国内外AI大模型领域迎来快速发展和创新。中国,百家争鸣,百花齐放;在美国,OpenAI、Anthropic、Meta、Google等公司都推出了新一代大模型产品。
OpenAI:由Sam Altman等人创立,科技巨头微软为最大投资者,Open AI目前被公认为全球最强的AI公司。其产品包括GPT-3.5、GPT-4、GPT-4o等。其中,GPT-4o作为OpenAI的最新产品,也被业界称为Open AI历史上最好的模型。它支持跨文本、音频和视频的实时推理——能听、能说、能看、零延迟、可打断。和其他功能。
Anthropic:由 OpenAI 前研究副总裁 Dario Amodei 和大型语言模型 GPT-3 论文第一作者 Tom Brown 等人联合创立。前世界首富贝佐斯旗下的亚马逊已向其投资 40 亿美元,并持有少数股权。其产品包括克劳德1、克劳德2、克劳德3和克劳德3.5十四行诗。最新产品Claude 3.5 Sonne于2024年6月发布,该产品在基准测试中超越了GPT-4o,还推出了Artifacts功能,增强了用户与模型的交互,让用户能够真实地基于Claude进行查看、编辑和创作时间。建造。
Meta:美国知名互联网公司,由扎克伯格创立,其AI产品为LLaMA系列,特别适合学术研究和开发者社区。最新产品LLaMA 3.1于2024年7月发布,是目前最大的开源模型之一,支持128K的上下文长度。 LLaMA 3.1在多模态处理、数学推理等方面表现出色,进一步巩固了其在开源社区的领先地位。
谷歌:作为一家顶尖科技公司,谷歌早在2006年就提出了构建人工智能专用基础设施的想法,并成立了Google X实验室人工智能开发团队。是最早进入AI行业的公司之一,目前的产品为Gemini系列。此外,谷歌还推出了针对设备端优化的Gemini Nano版本,可以在Android设备上高效运行,进一步拓展了该模型的应用场景。 2024 年 5 月,谷歌在其开发者大会上展示了即将推出的 Gemini 2 系列。该系列模型采用更强大的TPU v5p芯片进行训练,大大提高了计算速度和能效比。 Gemini 2不仅在多模态任务上表现出色,还进一步扩展了支持的语言和应用场景,表明谷歌在大模型领域的持续发展。
从技术成熟度来看,美国人工智能发展起步较早,拥有深厚的技术积累。以OpenAI的GPT系列模型为例。其在自然语言处理领域的突破引领了全球人工智能技术的发展趋势。相比之下,我国虽然在大型模型领域取得了显着进展,但与国际领先水平仍存在一定差距。尤其是在大型模型的训练、优化和应用方面,国内还需要进一步完善。在应用落地方面,国外AI人工智能应用范围广泛,涉及医疗、金融、教育、办公等多个领域。例如,美国开发的BloombergGPT大模型已在金融领域深入应用,微软的Office 365 Copilot开启了办公生产力的革命。在我国,人工智能的应用主要集中在互联网等少数领域,缺乏具有广泛影响力的商业应用。
到目前为止,中国和美国都诞生了很多表现出色的大型典范独角兽。这些企业在当地市场展现出强大的创新能力和市场活力,成为全球人工智能技术发展的领导者。放眼中美两国,虽然独角兽出现的次数不多,但它们仍然像一颗颗闪亮的珍珠,在各自的地区熠熠生辉。
Mistral AI于2023年4月在法国巴黎成立,由前DeepMind和Meta科学家共同创立。主要关注开源模型和企业级服务。 Mistral AI开源的Mistral系列大型模型受到了业界的广泛好评。 2024 年 4 月,Mistral AI 推出了新的 Mixtral of Experts (MoE) 大型模型 Mixtral8x22B 磁力链接。该模型在文本生成、问答理解等方面表现良好。Mixtral8x22B的具体特点包括支持64K超长上下文、多语言能力,尤其是法语、德语、西班牙语等语言的流畅表现,以及使用Apache2.0开源协议。
据悉,Mistral AI与微软也建立了长期合作伙伴关系,利用Azure AI的超级计算基础设施进行模型训练,共同为客户提供Mistral AI模型服务,成为继OpenAI之后第二家在微软Azure云上提供的公司平台。商业语言模型公司。
欧洲大陆另一个工业强国德国也拥有自己的“开放人工智能”。 Aleph Alpha 是一家成立于 2019 年的人工智能初创公司,将自己定位为欧洲本土人工智能技术的领导者。 2023年,阿莱夫阿尔法在资本市场取得了骄人的成绩。当年6月,Aleph Alpha获得1亿欧元A+轮融资,成为德国AI独角兽。 2023年底,Aleph Alpha宣布完成超5亿美元B轮融资。本轮融资的投资者主要来自德国,由人工智能创新园(Ipai)、博世创投(Bosch Ventures)和施瓦茨集团(SchwarzGroup)等公司领投。
Aleph Alpha重点关注“数据主权”的理念,即存储在某个国家的数据受该国法律的管辖,以确保数据安全。其生成式人工智能解决方案致力于为企业和政府提供突破性的人工智能技术。在技术层面上,Aleph Alpha自主研发的Luminous系列大语言模型与ChatGPT具有类似的功能,提供文本/代码生成、内容摘要、翻译等服务。
除了上述之外,估值50亿美元的加拿大多伦多公司Cohere、印度知名企业家Bhavesh Agarwal创立的Krutrim、以色列AI大型模型公司AI21 Labs……这些都是知名的AI独角兽。企业。
闭源与开源之争
目前数以千万计的大型模型报告中,闭源和开源同时被广泛使用。而这两者究竟是什么?有什么区别?
开源大模型和闭源大模型是大模型的两种主要技术形态,各有其独特的魅力和应用场景。
开源大模型是指由开源社区或组织开发、维护和共享的大型软件模型。它最大的特点是开放性和可扩展性,即代码和模型结构是公开的,任何人都可以访问、修改和使用。
闭源大模型与开源大模型相反。其代码和结构是私有的,仅由特定组织或个人拥有和维护。该模型通常用于保护知识产权、商业秘密和竞争优势,因此其可定制和修改的程度可能会受到一定限制。
乍一看,似乎开源大模型比闭源大模型的优势要大得多。但目前市场的看法是,在AI最难、最重要的商业化领域,闭源大模型更有优势。
市场观点认为,闭源模式是一种商业模式。开源模式效率不高,无法解决算力问题;开源模式的成本较高;开源模式对技术要求更高...
开源模型没有开放训练源代码、预训练和微调数据等影响模型效果的关键信息,因此无法像开源软件一样依靠社区开发者的参与来提高效果和性能。然而,基础模型的训练只能掌握在厂商自己手中。
百度CEO李彦宏是闭源大模式的资深支持者。今年7月的2024人工智能大会上,李彦宏曾表示“开源模型就是智商税”。他认为,在相同参数规模下,开源模型的能力不如闭源模型。 “如果开源模型想要在能力上迎头赶上,Flat闭源模型需要更大的参数大小,这将导致更高的推理成本和更慢的响应时间。”
而这并不是老板第一次发表这样的言论。此前,他提出开源大模型将变得越来越落后的观点。此举立即遭到红衣领军人物、360 CEO周鸿祎的强烈反对。
其实,大佬争论开源还是闭源的例子很多,也有像王小川这样的中立观点“开源和闭源不像手机里的IOS和Android,必须二选一”。或者另一个。”这些一线纠纷的背后,往往是业务线的分歧。
但目前看来,闭源模式的产业化和商业化能力似乎更强一些。大模型与业务的结合需要产品、运维、测试工程师等多个角色的参与。同时,大型模型长期应用所需的计算能力、存储、网络等配套设施也必须跟上。开源社区无法帮助用户“一站式公式”解决这些细节问题。
此外,闭源大模型的整体能力似乎比开源模型更强。 OpenAI的GPT-4、Anthropic的Claude-3和Google的Gemini Ultra都是闭源的。
回顾国内的模型大战,大多走的是开源和闭源的双向发展道路。比如百川智能、灵一万物、阿里巴巴商汤、智普……但也有像百度、月之暗面这样专门做闭源大模型的公司。
百度一直是专注于闭源大模型的玩家。到目前为止,虽然百度文心一言仍然坚持闭源路线,但百度智能云部门在其平台上提供了大量性能强劲的第三方开源大模型。百度通过闭源文心一言和开源大型模型所使用的计算能力、工具和服务来实现商业收益。
与百度相反,阿里云正在大力推动开源。一方面是加快市场份额的争夺;另一方面,作为云计算企业,可以从算力、工具和服务中获取利润。
2023年华为云推出盘古模型3.0时,就表示将采取闭源路线。过去一年,其重点是各行业联合创新,落地大模型,将技术反哺盘古,不断迭代,并没有参与行业内的开源和闭源讨论。华为云上周刚刚正式公布了盘古5.0多模态大模型,发布过程中并未涉及开源问题。
智普作为实力新秀,也是国内第一家开源大型模型的公司。其研究的GLM开源大模型受到了广泛关注,这也让这家2019年才成立的公司在融资和商业化方面受益匪浅。因为智普是由清华大学的技术成果转化而来,2022年开源了其研发的双语百亿型号GLM-130B。 “当时,全国了解大型模型的研究人员总共只有一百人左右。”智浦CEO张鹏表示,开源让大家知道智浦在做什么,同时也让更多的人参与推广大模型。后来,2023年3月,智浦开源了GLM6b,该模型在Hugging Face上的下载量已超过1600万次。
另一个新来者,Dark Side of the Moon,是闭源大型模型的支持者。负责人杨志林坚定表示,将聚焦ToC,打造以长文本输入为核心的基础大模型的差异化竞争力。他认为,这是行业现在最需要解决的问题,也是下一步产品化路上最大的症结所在。
对于开源与闭源,杨志林认为像OpenAI这样的闭源是Super APP(超级应用)的必由之路,而开源只是ToB的获客手段。 “谁想做C端超级APP,谁就闭源。”
从杨之琳的回答中可以得出结论,闭源和开源的选择可能取决于大模型企业下的业务路线主要是To C还是Tp B。
百军争流,先争先者
在数字化浪潮的推动下,百模大战堪称人工智能领域前所未有的盛会。本次大赛汇聚了国内顶尖的人工智能研发团队,他们携带着自己精心打造的模型,准备在这场科技盛宴中大显身手。这些模型就像一百多艘船一样,在算法的海洋上展开激烈角逐,展示了它们在图像识别、自然语言处理、机器学习等多个领域的出色能力。
大车型时代与前三个时代不同。由于大型模型的多功能性,其发展非常有希望实现商业闭环。因此,在这个大车型时代,吸引了众多选手到赛道上一较高下,形成了百花齐放、百家争鸣的现象。
另一方面,大型车型的市场规模也在不断扩大,资本热情不断高涨。 2023年,国内大语言模型市场规模将突破100亿元,并持续上升。市场规模的扩大,为这场百款车型的激烈争夺火上浇油。
目前整个大模型赛道处于高度拥挤的状态,但对大模型至关重要的其他资源如算力等却是有限的。随着市场竞争的日益激烈,算力等资源将出现供需失衡,出现资源配置倾斜。再加上算力成本不断上涨,大型模型厂商必须积极竞争,打造优势,才能获得长期发展和资源支持。
这也是为什么业内有“百款之战,难免一战”的说法。
如今,这场百模大战已经持续了一年多,战争正逐渐升级到新的阶段。
有一个非常明显的迹象,大模融资已经开始慢慢降温。
今年年初,Open AI推出Sora,掀起了国内外大型视频模型的激烈争夺战。那段时间,没过多久,就有大型企业融资的消息传出。但到了六月,一切似乎都变了。体现智能等赛道吸引了资本的关注。大型车型融资数量较去年略有下降,并有降温迹象。
大型模型的开发需要消耗大量的资源和计算能力。在这种逻辑下,金钱就成了唯一的门票。然而,目前大模型技术的进展远远落后于预期。投资者投入巨额资金后,仍不清楚何时才能实现成果,这也引起了大多数投资者的焦虑。无论如何,当前的降温现象似乎是合乎逻辑的。
这种情况也迫使大模们不断思考未来的商业化问题,浪漫的技术研发也逐渐转化为生存的艰辛实现。这引发了一系列新的竞争。
首当其冲的就是大机型之间的价格战。
据融众财经记者不完全查阅,目前已有超过7家大型模型公司参战。包括字节跳动、阿里云、百度、腾讯、智普AI、科大讯飞等。
据记者了解,今年5月11日,大模型独角兽智普AI宣布,旗下入门级模型GLM-3 Turbo API价格下调至1元/百万代币。 5月15日,字节发布公告称,其通用模型豆宝Pro-128K版本模型推理输入价格已降至行业价格低95.8%,豆宝Pro-32K模型推理输入价格已降至行业价格低99.3%。行业价格。 5月21日,阿里云宣布旗下9款大型机型全面降价,降价幅度高达97%。两个开源模型甚至可以免费 7 天。几个小时后,百度直接宣布免费提供ERNIE Speed和ERNIE Lite两款轻量级机型。随后,另外两个玩家进入了比赛。首先,Iflytek宣布其轻质型号API将永久自由和开放。后来,Tencent Cloud宣布,Hunyuan-Lite将从现在开始,其他车型下降了87.5%。
一个基本现实是,目前,中国没有真正的杀手大型模型应用。就整体能力差异而言,国内领先的大规模模型参与者之间可能没有绝对的领先优势。他们都处于相同的位置,有些人只有自己的特征并专注于能力。
在这个现实下,如果其他大型模型制造商不跟进阿里巴巴,百度,字节和腾讯之间的这一价格战争,那么最终结果可能是从市场上消除的。毕竟,在当前现实中,已经很难维持原始价格,更不用说这些主要模型制造商已经开始让用户味道便宜甚至免费产品。当您走进这个快乐的地方时,您会后悔所有的梦想和想法,脸上所有不同的妆容,没有人会记住您的样子。
此外,在新时代,大型模型正在从参数到卷。
百度的“ Wen Xin Yi Yan”专注于内容创建和教育服务,为媒体和广告行业提供有效的文案支持,并成为教育领域学生的智能学习合作伙伴。 Iflytek的“ Spark”大型模型在教育和医疗领域展示了其独特的价值,为学生提供定制的学习计划,并协助医生做出准确的医疗决策。 Kunlun Wanwei的“ Tiangong”大型模型侧重于游戏行业,并可以自动生成游戏内容并进行智能操作。 Zhipu AI构建了与AI开放的模型产品,但通过提供API和云服务私有化部署等解决方案,在科学研究领域为研究人员提供了文献检索和分析服务;并与金融机构合作进行风险评估。和投资决策分析。此外,Zhipu AI还探索了国际科学研究机构和企业的大型模型的应用。 Minimax已通过为消费者和企业的策略推出了各种类型的应用程序。在消费者方面,它推出了一个聪明的聊天助理。在企业方面,它与企业合作开发了智能的客户服务系统和办公室自动化软件。
随着大型模型技术变得越来越成熟,其在实际应用中的实施已成为衡量技术价值和商业化技术价值的关键。目前,大型模型行业的重点已经从模型开发转变为应用程序的实际实施。无论是一家具有强大背景的大型模型公司还是新兴的初创企业,他们都在努力促进应用程序的开发,目的是创建具有广泛影响的应用程序。
不同的制造商采用了不同的策略。一些制造商使用大量广告来吸引用户并利用流量。有些人继续迭代并优化产品以改善产品性能和用户体验;有些人对消费者和企业都采用策略来扩大市场份额。
实施是商业化任何技术的必要方法,因为它可以将直接的经济回报带给企业。这就是为什么当前数百个模型的战役逐渐从以前的参数战役转变为音量应用程序的原因。
在最终分析中,无论今天的数百场模型战争是价格战还是涉及应用程序层,这些都是公司追求盈利能力的手段。任何浪漫的技术都需要先生存,并在追求理想的乌托邦之前有足够的饮食。
在这样的道路上,大型模型公司如何找到成功的方法?我们只能努力前进并探索降落更多大型模型的可能性。俗话说,当数百名军队争夺胜利时,首先努力的人将是第一个。
评论(0)