4月6日,一则“中国AI大模型调用量连续五周超美国”的消息在中文互联网疯传。
每日经济新闻报道,根据OpenRouter最新数据,今年2月中国AI大模型Token调用量首次超过美国后,已经连续五周领先,而且双方差距越来越大,1月初美国的Token调用量还是中国的3.6倍,现在变成中国Token调用量是美国的4.2倍了。
啥是Token呢?Token是大模型的最小信息单元,国内将Token译为词元,咱普通人就记一个结论,Token调用量越高,代表模型被用得越多。

中国网友还没来得及开心,就有人“辟谣”,说OpenRouter数据不完整,《联合早报》还酸溜溜地说“Token调用量不反映创新能力”。
奇怪,跪舔美国大模型的时候Token调用量还是核心依据,怎么中国反超就变得不重要了?第一名需要不断“说服”别人相信自己是第一名,这件事本身不就很可疑?
客观来说,OpenRouter的统计数据来自自身转发的API请求日志,不包括厂商直调、C端App、私有化部署等场景数据,确实有一定局限性,但数据本身是真实的,它反映了中国AI大模型暴涨的客观趋势。
即便采用摩根大通的最新估算,全球周均Token调用量2400-2600万亿,中国占比40%-45%,美国占比30%-35%,仍然是中国领先。
实际上,在过去的两年里,中美AI大模型已经在视频生成领域,发生过一场腥风血雨的交锋,并且在这个过程中,“永远领先一代”的美国AI大模型已经开始掉队。
这次交锋的源头,还得从清华大学2022年的一篇论文说起。
一
2022年9月,清华大学的研究团队发表了一篇题为《All Are Worth Words: A ViT Backbone for Diffusion Models》论文,首次把扩散模型的卷积U-Net换成Transformer。
就是这个新脑洞,一下子打通了AI视频生成的任督二脉。
在此之前,人类对计算机生成视觉图像的探索,已走过了半个多世纪,产生了Transformer、扩散模型等技术路线。
那个叫Transformer的哥们,是一个逻辑性很强但手很笨的编剧,它能写出完美的剧本,但当它打算把这个剧本变成视频时,只能生成一张张图片再强行拼起来,所以画面会卡顿。
那个叫扩散模型的哥们,是一个脑子不大好但手很巧的画师,它能画出一只栩栩如生的卢胖子,但如果你下的指令是卢胖子吃蛋烘糕,它可能画出来的蛋烘糕长在卢胖子的肚子上,甚至直接把卢胖子变成蛋烘糕。
过去,这两位哥们一直是各玩各的,井水不犯河水,直到清华大学的理论创新,将它俩撮合到了一起。就在三个月后,Facebook的研发团队也发布了一篇论文,和清华大学的点子如出一辙。
中美两国不但几乎同时实现理论突破,也同时开始推动应用突破。
2023年4月,字节跳动的AI技术老将王长虎,在北京创立了爱诗科技,打算进军AI视频生成赛道。
王长虎是纯技术出身,博士毕业于中国科学技术大学,主要研究方向正是计算机视觉。
博士毕业后,王长虎先是在微软当研究员,后跳槽到字节跳动任AI Lab总监,完整参与了抖音和TikTok从0到1的建设,2021年从字节离职后,开始折腾自己的事业。
王长虎的野心,是面向全球C端用户做出一款较为先进,又能让大家用得起的AI视频生成软件,这款软件就叫PixVerse。
但是对中国公司来说,做AI视频生成实在过于超前。
因为AI视频生成所需的模型技术,和ChatGPT这种语言模型完全不是一码事。
语言模型的局限性,在于它会忽略掉真实世界的大部分信息,比如当我们输入“卢胖子狂炫工作室的小饼干”这行字时,文本模型“看不到”卢胖子的表情、饼干的质感、工作室的光照等等。
如果换成多模态模型来干这事儿,效果就完全不一样,它会“看到”卢胖子嚼第一口时瞪大的眼睛,饼干碎屑掉在衣服上的轨迹,还能听到嘎嘣脆的嚼饼干声,甚至助理小姐姐那声“差不多得了”的叹气。
虽然听起来很爽,但多模态大模型比以烧钱著称的语言模型,还要烧钱十倍不止。
王长虎拉融资的时候,投资人一个个把头摆成了拨浪鼓,咱们连ChatGPT都还没赶上,怎么敢做多模态的?这种烧钱又不产生生产力的事情,让美国去做就行,我们中国人还是老老实实做应用端。
当时金沙江创投合伙人朱啸虎就直接给王长虎浇了一盆冷水,说你们还是回去上班吧,这个事情可能在中国没有什么机会。
王长虎不死心,一定要在多模态上杀出一条血路。
因为融不到太多钱,PixVerse不得不在缺钱少芯的情况下,勒紧裤腰带研发。可能是为了避开和字节正面竞争,PixVerse早期主要是发展海外市场。
2024年初,PixVerse开发至第二代架构时,突然杀出来一个BUG级选手,Sora。
Sora是OpenAI的多模态大模型,如果按时间倒推,Sora和PixVerse可能是在差不多同一时间立项,只是OpenAI此前并未公布任何消息。
2024年2月,Sora发布了一段预览片,片中的流体、光影、人物表情和动作极其逼真,被业界公认为是多模态大模型的顶级水准。
昂撒精神领袖欣喜若狂,宣布中国公司已彻底输掉AI竞赛,你看!人家美国还是碾压我们!好像美国碾压我们,能给他们涨工资似的。
当时国内财经媒体最喜欢写的一句话是:中美的差距不但没缩小,反而越来越大。
有个专家接受媒体采访时说:Sora发布后国内没有跟进,因为我们跟进不了,我们没有人才储备,没有架构准备,未来两三年都没法拿出像样的产品……
社交平台流传一张梗图,巨大的Sora神像跟话事人一样坐在王座上,下面跪着Runway、Pika、SVD、PixVerse等软件,“跪”在第一排的PixVerse,还是唯一一家中国公司。
王长虎看到这张图时,心情十分复杂。他有些遗憾,更有些不服气,甚至有些质疑。
当时媒体采访他时,他说:“如果我们过去一年有更多的投资和算力资源,有可能最先做出Sora的不是美国人,有可能是我们。”
王长虎还委婉地表示,他很想知道,Sora的正式版本到底好到什么程度。但是Sora有OpenAI背书,所以他宁愿相信Sora是真的这么强,并打算在3-6个月之内追平Sora。
除了PixVerse,阿里、字节跳动、快手、Minimax等一众中国公司,在短短数月内推出AI视频生成工具,引爆了多模态模型混战。
为了追赶Sora,中国公司在紧迫而逼仄的氛围中卷生卷死。
早在2024年底,可灵就能生成接近2分钟的视频,并且在人体骨骼一致性、物理拟真等方面超越了Sora。
虽然中国公司干得热火朝天,但当时专家和大V的普遍情绪,就是别自取其辱了,快投降吧,追平?能追平吗?你以为Sora会站在原地等你?
呃,事实证明会,甚至……还倒退了好几步。
被传得神乎其神的Sora,整整一年半都没拿出成品,直到2025年9月才迟迟上线。
爱诗科技联合创始人谢旭璋看到成品后,淡淡地评价,这和预览片差距非常大,“前后差了十个PixVerse”。
有种网恋奔现大型翻车现场的感觉,有种遇到了诈骗犯只想报警的感觉!
国内媒体发文称,用户吐槽Sora如同人工智障,但狂热的Sora信徒淹没了评论区,清一色都在讽刺“愚蠢的人不去追赶,却在别人的成果里挑小毛病”。
你质疑的对象可是OpenAI啊,How dare you?
结果Sora又辜负了它的信徒。2026年3月26日,Open AI宣布将正式关停Sora。
这个“只有一点小毛病”的Sora,以一周留存率2%,月留存跌破1%,75%用户生成一次后永久卸载的负分战绩,只活了半年,就彻底退出AI视频生成赛道。
Sora溃不成军时,中国AI视频军团正以惊人的速度狂飙。
全球AI视频生成赛道,现在几乎被字节跳动即梦(Seedance2.0)、快手可灵和爱诗科技PixVerse等几家中国公司瓜分,其中PixVerse的全球用户规模突破1亿,可灵用户突破6000万,今年2月Seedance2.0出圈后,下游应用一夜爆发,中国AI模型拉爆了Token调用量。
Sora被中国AI视频军团击溃的原因很简单,死贵还不好用。
一位影视动画行业技术人员告诉我,AI视频还没出现时,团队是用一款叫Midjourney的国外软件来生成图片,现在都换成了可灵和即梦,“Sora用来玩玩还行,但抽卡太贵了”。
所谓抽卡,就是当前的视频生成技术,都很难一次生成目标效果,得像抽卡一样多抽几次,运气好几块钱搞定一个视频,运气差要几十上百块,如果制作需求量大,就得开会员才比较划算。
但Sora的定价,比国内软件高太多了。
Sora最高版本折合人民币每月约1400元、最低版本约每月140元,即梦最高版本每月499元、最低版本每月69元,可灵最高版本每月1314元、最低版本每月58元。
我问过几位从业者,可灵最高版本也挺贵的,为什么用户那么多?
他们回答,可灵偏B端,在画质清晰度上优势明显,能制作高质量商业片,即梦偏C端,适合生产对画质要求不那么高的AI漫剧,二者的定位非常清晰,就是Sora,找不出任何长板,一副不知道自己要干嘛的样子。
这种完败,对于Open AI来说是奇耻大辱——你可以死于便宜但难用,也可以死于好用但太贵,但你居然死于又贵又难用!
而且真正的问题在于,当房间里出现一只蟑螂,就不可能只有一只蟑螂。
在Sora神话崩塌的前一年,F119发动机也发生了类似的翻车“事故”。
2025年2月,马斯克应特朗普指示,去查美国国防部的账,随后公布了一份震惊世界的资料,显示美国五代机F22使用的F119发动机疑似数据造假。
这份资料显示,F119的推重比并不是此前宣称的10.5,而是7,整整缩水了50%。F135发动机更夸张,宣称的推重比是11.47,实际推重比只有6.7,缩水了71.2%!
对中国航空人来说,F119也曾是BUG般的存在。
中国从1997年就开始苦苦追赶F119,花了近30年,才将涡扇发动机的推重比从3.82提高到10。
曾有中国技术人员曾指出F119的数据不对劲,还有人指出美国没有把散热器之类的器件重量计算在内,但我们一是没有铁证,二是我们认为,即便美国虚标数据,也不是我们故步自封的借口,美国指不定藏着掖着什么吊炸天的技术,咱们要料敌从宽,当成真的来追赶。
马厂公曝出真实数据时,中国看着手中的涡扇发动机陷入了沉思:那我造的是个啥玩意儿?
F119和Sora的翻车绝非偶然,它揭示了中美科技竞争的本质区别。那么,美国造神、中国灭神的规律,是否将在未来中美AI竞争中再次应验?
二
首先,我们需要回答一个问题,不缺钱、不缺芯片、不缺技术人才的Sora,为啥把一手好牌打稀烂?
Open AI作为一家全球知名的公司,故意吹牛打自己脸的可能性不大,实际上,Sora死在它无法解决工程化难题。
什么叫工程化难题呢?
我们在《固态电池全球大战》中,写过一家叫QuantumScape的美国初创公司,这家公司2020年发布了一份震惊全球的测试数据,说它研发的固态电池性能逆天,仅凭这份样品,这家公司就在没有半个产品、半毛钱收入的情况下,拥有近500亿美元市值,但后来这家公司长期未公布车规级关键数据,样品越做越差,市值较最高点蒸发了95%。
QuantumScape,就是死于工程化难题。
一家公司从画PPT到真正实现量产,中间还有个实验室阶段,公司需要披露阶段性样品,不然资本故事就讲不下去了,公司也拿不到融资了。
以美国在基础科研方面的优势,搞出一个完美的实验室样品,并不太难,难就难在,实验室样品不需要考虑成本,但商业化量产必须兼顾性能、成本、供应链等种种因素。
(不建议在百度app和苹果自带浏览器上进行购买和阅览,百度app不支持汉风网相关功能。请在手机自带浏览器上进行阅览。)
联系客服办法请点击网站地址:http://hanfeng1918.com/baijia/92855.html
建议老友们升级会员,升级会员后,可以全部阅览。如果不会操作升级会员,请加汉风网客服微信,我们后台给您添加。
请老友们一定点击“立即购买 或 升级vip”按钮进行购买,因服务器反应慢点击购买后大概需要8秒左右,(如果等待8秒没有反应,可以再次点击一下)会跳转到支付页面。购买成功后才可以查看到剩余内容,购买成功后如果遇到服务器没有反应则请等待一会刷新(如果还是看不了,请再次刷新一下),或重新打开本篇文章,因技术原因请老友们尽量在半个小时内阅读完,超过时限会需要重新购买


