人工智能应用想跳出包围圈

没想到,人工12月过半,应用各大模特厂商都在冲刺KPI,想跳好消息接踵而至。出包
前脚大模型六虎之一的围圈智谱刚刚完成了新一轮30亿元的融资;后脚字节跳动发布豆袋视觉理解模型,快手可灵1.6正式上线。人工
假如说2023年是应用大模型的第一年,那么2024年就是想跳AI的应用年。
从深度推理到主流,出包AI Agent已经成为一个新的围圈风口,多模式模型竞相出现,人工人工智能产品迭代速度如此之快,应用以至于我们经常忽略国内人工智能领域的想跳发展还不到2年。
人工智能一年,出包人间十年。围圈
但这种被视为互联网变革级别的产品,至今还没有迎来爆发的时刻。

计算能力不是护城河
直到今年上半年,当国内市场谈到大型模型的发展时,核心决策因素和重点仍在计算能力。在百模大战如火如荼的那一年,通过卷参数快速占领市场份额是几个大模型的来时之路。
但从今年开始,关于国内外大模型的声音越来越大,特别是自今年下半年以来,我们很少听到哪家大工厂推出了什么大模型,这并不意味着百模型战争即将结束,但大工厂清楚地意识到,随着整个行业的快速迭代,单靠计算能力和参数规模的提高很难真正超越同行。
此外,大型模型的培训和运营需要大量的计算能力和资本投资,需要持续进行,这显然是现阶段难以通过商业模式的大型模型制造商面临的巨大挑战。

以字节为例,据《证券时报》报道,仅2024年,字节在人工智能上的投资就达到了800亿元,几乎达到了BAT三项资本支出的总和。最新消息显示,2025年,资本支出将达到惊人的1600亿元,其中约900亿元将用于人工智能计算能力的采购。
就连ChatGPT也一直受到计算能力不足的困扰。据澎湃新闻报道,微软为ChatGPT和新版本提供了更好的计算能力,使用数亿美元和数万个英伟达A100芯片来构建超级计算平台。不仅如此,微软还在Azure的60多个数据中心部署了数十万个GPU,用于ChatGPT推理。

事实上,从长远来看,计算能力并不能构成真正的护城河,它更多地体现在硬件层面的核心竞争力上。众所周知,谁的计算能力更强,训练语料更丰富,谁的模型性能更好。计算能力取决于GPU性能和数据中心建设,训练语料取决于公共数据集。但归根结底,这两者都取决于经济实力。
早在去年,谷歌就讨论了如何应对它 “我们没有护城河,”ChatGPT时,一位工程师说OpenAI 也没有。”他认为,即使谷歌全力以赴,也有可能赢不了这场比赛。 AI 比赛。不仅谷歌赢不了,OpenAI 也赢不了。

来源:SemiAnalysis,世界著名的半导体行业研究咨询机构
他指出,随着开源人工智能模型的快速发展,很难形成强大的技术障碍。即使其大型模型的数据质量在现阶段仍略有优势,差距也在迅速缩小。特别是开源社区的创新和快速迭代能力使谷歌和Open人工智能难以保持技术优势。
目前,人工智能行业极难获得领先优势和垄断利润。
这也是国内大型模型的现状。各公司的模型强弱,但核心功能普遍同质化,替代品多。目前,模型之间的差异似乎不是决定性的。
其他制造商可能很快就会赶上某个制造商推出的新功能。虽然Kimi最初没有内部数据,依靠调整他人的搜索结果,但它也成功地进入了国内人工智能模型的第一梯队,但长文本已经成为大多数人工智能搜索产品的基本能力。
值得注意的是,训练材料很容易来到同一个游泳池,每个人都可以使用。文小燕运行百度数据,Kimi也可以获得。这将削弱个别大型模型在计算能力和训练语料方面的竞争优势。
《大模型落地及前沿趋势研究报告》直接表示,在互联网时代,建设护城河的关键因素有很多,包括数据飞轮、网络效应、迁移成本、规模效应、用户思维等,但不再适用于大型商业模式。
到目前为止,大型商业模式还没有明确的护城河。
人工智能应用想跳出包围圈
从下半年开始,AI领域的关键词开始从“模型层”落到“应用层”。
华尔街明星基金经理Cathie Wood曾经说过,在基础设施建设阶段,硬件制造商往往表现出更大的增长空间,但一旦这个阶段完成,市场的焦点将转向软件和应用程序。
在过去的一年里,国内大型模型制造商在一般场景中的模型能力实际上缺乏识别。虽然有许多细分技术方向,如Kimi早期的长文本、人工智能搜索产品的深度推理、最近开始流行的多模式,包括最近流行的大型视觉模型。
但严重的同质化早已是达摩克里斯之剑,人工智能产品头顶高悬。

12月18日,豆袋视觉理解模型正式发布,主要集中在图片内容识别能力、理解和推理能力、视觉描述和创作能力上,但实际上就在两天前,Kimi Kimi刚刚发布 视觉思维版针对的是基础科学领域的图片理解和推理能力。
如上所述,既然技术上没有护城河,如果从应用场景的角度进攻,能否找到破圈点?
大型模型总是一个基础。如果你想真正看到爆发点,你想让人工智能真正与普通人有很强的相关性。此前,业内人士指出,未来是否会有杀手级别的应用程序将是每个家庭决定胜负的关键。
正如李彦宏多次强调的那样,“没有(AI)应用,基本模型一文不值。”
杀手应用的出现将推动技术在更多领域的应用和扩展,形成新的应用场景和商业模式。例如,在3G网络的发展中,iPhone作为杀手应用,不仅促进了智能手机的普及,而且催生了移动互联网的各种应用和服务。
人工智能应用能否催生下一个iPhone时代,至少在2024年,我们看不到火花。

到目前为止,网上还有很多关于聊天、文生图片和图形视频中不同人工智能应用程序的评估。你几乎很难在第一时间告诉别人哪个是同类型人工智能产品中最好的。
即使作为一个普通用户真的会觉得人工智能搜索产品的兴起对原来的搜索系统有很强的影响,但目前还没有一家公司在市场感知和搜索量方面表现出压倒性的优势,形成了“不懂百度”或“遇到小红皮书”等强大的心理占据。
尽管AIGC技术在某些领域取得了进展,但快手最近与贾樟柯、李少红等国内知名电影和电视工作者合作,与AIGC创作者合作制作短片;AIGC也被广泛应用于独立游戏领域,一些大型游戏公司正在逐步推广工业AIGC艺术流程。

但总体而言,AIGC仍处于发展阶段,生成内容的质量、稳定性和可控性仍然不足。此外,AIGC的应用场景相对有限,大多是辅助工具,未能形成独立、广泛的应用场景,难以满足大规模用户的需求。
而且即使落到硬件端,以手机大模型为例,也难免会出现同质化。
目前,人工智能手机在实际人工智能体验中的主要变化是语音交互、图像处理和通话增强。
为了实现所谓的人工智能手机,几乎所有的主要手机制造商都在升级语音交互,声称将以前的语音助手变成更智能的人工智能 Agent,除了智能对话,信息检索、文本创作和文生图片已经成为人工智能助手的基本操作功能,如豆袋和Kimi,也成为人工智能手机的噱头之一。
但正如创新工场和首席执行官王华所说,现在整个工场 AI 才出来一年半,大家都指望了 AI 探索产品形式,再快,也快不到这一点。从明年初开始,真正的应用才有最基本的基础。
急于商业化
事实上,人工智能应用如此受到重视的一个重要原因是,市场迫切需要看到人工智能技术可以转化为可实施的商业模式。
随着大量资金涌入人工智能领域,投资者对人工智能项目的回报要求越来越高。他们希望人工智能企业能够尽快实现技术的商业应用,以实现投资增值。
今年9月,红杉资本合伙人Pat Grady指出,红杉资本在人工智能领域的投资重点正倾向于应用程序开发。他说,红杉资本预计,未来数十亿美元的大多数人工智能公司将来都将来自应用层,而不是传统的基本模型建设。这一变化表明,未来我们将看到更多技术创新与实际应用相结合的人工智能应用程序。

值得注意的是,据智能独家新闻报道,一些知情人士透露,虽然过去几个月豆袋的用户规模有所增长,但与行业中所有人工智能对话形式的产品一样,其使用时间、开放频率和商业潜力仍不理想。
文章指出,字节管理层判断人工智能对话产品可能只是人工智能产品的“中间状态”。长期以来,更理想的产品形式需要更视觉的用户体验和更低的用户使用阈值。因此,字节提高了即时梦想的产品优先级,并试图在人工智能时代创建一个“抖音”。
这一消息尚未得到字节回应。
众所周知,字节在人工智能产品的开发和应用上没有先发优势。2023年8月,豆包正式推出,距离百度3月发布文心近半年。
然而,豆包APP依靠真正的钞票能力 11月的月活已达近6000万,保持不变 10% 上述增长速度。目前在国内AI本土应用(APP)豆包早就是遥遥领先的第一名,其次是1299万月活的文小言,1282万月活的Kimi。(数据来源:AI产品列表)

截至今年10月,国内AI本土应用(APP)豆包以1.08亿的累计下载量排名第一,第二名是累计下载量为2260万次的文小言。
今年2月,豆包的访问量只有173万。短短三个季度,MAU就翻了近35倍,作为目前国内用户最多的ToC 在人工智能产品中,豆包的用户增长空间应该更大,而不是不理想。
如果只从盈利模式的角度来看,人工智能搜索产品可以触及的模式无非是付费订阅和广告。前者的市场在中国一直很有名,很难通过。强制增加adload显然会对用户体验造成很大影响。通过对话人工智能产品赚钱确实有一定的压力。
文章指出,豆包的关键指标,如对话轮次和持续时间,仍然不理想。但事实上,无论是人工智能搜索还是其更高形式的人工智能 Agent,对于大众消费市场来说,这种工具提效产品并不是刚需。
从某种意义上说,人工智能搜索产品作为C端登陆后最受欢迎的生成大型模型产品,更大的作用是样本收集场景,而不是赚钱场景。
对于字节来说,只有在对话产品中加强自己的语料和文生图训练能力,形成生态链,以更系统的方式为字节的AI生态开辟更大的商业空间,才能更有活力。

只要有活跃的用户和可持续的使用价值,人工智能对话产品的重要性仍然存在。事实上,纵观其他对话产品,字节的朋友和商人并不急于将对话人工智能视为商业化的重要组成部分。
此前,百度副总裁、移动生态商业系统负责人陈一凡在谈到生成人工智能的商业场景时表示:“我们并不急于在一段时间内释放所有流量。我们希望真正满足用户的需求,因此我们的机制也将升级。我们将重点关注整个问答的内容质量和整个智能对话的质量。只有首先满足用户的需求,我们才能更好地满足业务需求。”。
从2008年APP回顾上一代移动互联网层面的创新 Store的推出为移动应用提供了一个平台。直到2012年手机操作系统生态系统全面发展,智能手机的大规模应用才真正爆发。
移动互联网已经走了五年,现在人工智能技术 不到两年,我们就看到了质的飞跃。也许在2025年,我们可以看到下一个iPhone时代拐点的到来。
参考资料:
量子位智库《大模型着陆与前沿趋势研究报告》
《AI 科技爱好者周刊没有护城河
对话王华:目前的模型仍然无法支持。人工智能产品列表中的大量免费商业模式
豆包视觉理解模型正式发布,价格暴跌 85%的新Newinin