汉唐归来
惟有中华

纯科学:如何以DeepSeek为契机实现信息技术全面超美?|2025-02-01

如果认真读完本文(90%以上普通读者都可以理解清楚),您不仅是对人工智能,而且对整个信息技术的认知就达到这个领域全球一切博士生导师,甚至院士的层次。
DeepSeek冲击波意味着的是全球信息技术即将实现的基本架构革命,这场革命有两大特征:
  • 硬件体系从算力依赖型转向存储依赖型。
  • 整体架构从硬件依赖型转向编程依赖型。
一、DeepSeek冲击波
一个月前,整个美国军事圈在密集地讨论中国六代机。
半个月前,整个媒体圈在讨论小红书上中美大对账。
现在,整个全球科技圈又在密集地讨论DeepSeek。
顺便提一下,DeepSeek V3的发布日期也是在2024年12月26日,教员的诞辰纪念日。在DeepSeek V3发布后短短的一个月左右,又连续两个大动作。2025年1月20日发布了DeepSeek R1,这是真正引爆全球的版本,其达到与OpenAI o1版本性能基本相同的程度,但训练成本仅为不到560万美元,只是o1的3%-5%。
请注意,并不是说DeepSeek R1的技术性能远超过了OpenAI o1,而是在性能基本相同或略好的情况下,其训练成本、训练时间却呈现数量级的下降,这两者带来的结果都是颠覆性的。原因在于:
训练成本极低的主要因素是对算力需求数量级的下降,这样一来,英伟达人工智能算力卡市场需求就会受到极大的冲击。
训练时间从过去6个月下降到只有6天,这会使人工智能软件的迭代速度发生质的变化。6个月的训练时间,简直就是农业领域种子大田实验的周期长度了,一粒水稻种子从发芽、插秧、抽穗、收割的时间也不过如此。早熟型的水稻全部生长周期甚至也就3个月。任何软件都是需要不断迭代演进的,如果你的软件需要6个月才能完整地运行一次,而我的只要6天,那么你的软件做一次升级后要进行一下测试就得至少等6个月时间,而我的只要6天,那么即使我的软件一开始比你的差很多,要不了几个回合我已经迭代10次了,你一次都还没迭代完,那你还怎么玩?就算你有天大的编程本事也没法和我竞争了。而且DeepSeek还完全开源,这么一搞,全世界所有公司的大模型软件都不得不追随这个技术路线,尤其是技术理念,否则就是农业文明与工业文明相竞争了。
DeepSeek在美国的苹果应用商店上下载量瞬间排名第一。
2025年1月27日,Deepseek引发了美国纳斯达克震动,尤其受冲击最大的英伟达股价下跌16.97%,上一个交易日下跌3.12%。1月28日除夕,在美股重挫之后,DeepSeek又发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。
图片

图片

英伟达两天内蒸发7000多亿美元,跌去了约五分之一的市值,27日一天跌去了约5900亿美元,创下美国历史上单日下跌幅度的历史记录。也带动纳斯达克指数当日跳空暴跌3.07%。当然,这种短期的波动不一定完全具有长期意义,1月28日英伟达反弹了8.93%,29日再次下跌4.10%。但是,一个中国刚成立一年多、仅140人的小公司发布的产品,居然对整个美国纳斯达克科技股板块产生如此巨大的影响力,这是历史上的第一次。
因为整个美国科技界产生的恐慌,来自美国的一些特定的IP地址针对DeepSeek服务器发起了空前的恶意攻击。这种恶意攻击一直持续到现在还在继续并且不断升级。
特朗普也在个人账号上发出哀叹:
请注意特朗普个人账号发这个信息的合集分别是#美国优先#中国正杀死美国#AI#MAGA!!!

做出DeepSeek的幻方量化创始人梁文锋在总理召集的座谈会上发言。

中国出现如此震撼性的科技进展,也令整个中国社会沸腾。很多网友留言希望我谈一下这个问题,很多媒体也向我约稿谈相关问题。对于如此专业的技术领域,一般媒体人,甚至一些专业人士都可能很难抓住要害。
人们可能非常疑惑的一个问题是:为什么DeepSeek居然能在美国看起来如此领先的AI领域做出让人炫目的巨大改进?或者换个说法:为什么在看似美国领先的AI领域居然会存在如此巨大的改进空间?如果没有这种改进空间存在,即使你有天大的本事也无济于事。
其实,这种巨大的改进潜力不仅不是什么奇怪的事情,而且是整个信息技术领域存在的极为普遍的情况,只不过是DeepSeek把这层窗户纸在全社会层面捅穿了而已。要清楚理解DeepSeek为什么能做到这一点,如果是专业的网友,可以直接去看以下这篇DeepSeek R1的论文,甚至直接去看开源的源代码。
图片

图片

但对于绝大多数普通网友来说,如果完全陷到这些AI专业技术细节中去的话,肯定会头大,即使想尽办法进行科普,可能也还是很难理解。并且,即使专业的网友去直接看DeepSeek的论文,或者分析清楚DeepSeek的所有算法,也未必能完全理解为什么他可能做出这么大的改进。
所以,本文将尽可能采用90%以上的网友都能听得懂的语言或科普知识,来让人们理解为什么美国式的信息技术会存在如此巨大的提升空间,并且是幻方量化的创始人梁文峰的团队成功做到了。事实上,这种潜在改进空间的存在是我穷其一生系统研究过,一直努力去进行改进,并且获得过不少成果的。所以,本文不仅是要让普通网友听明白,而且希望成为一篇信息技术领域的“讨美檄文”,借此机会号召所有专业的网友、政府机构相关人员和投资人看明白之后,从效率最优化角度发起一场系统的中国式信息技术革命,彻底颠覆美国式的信息架构和体系。我会在本文中枚举出大量可以做出巨大改进的重多技术细节,但整个信息技术领域事实上可以改进的地方太多了,本文最后会给出初步的总体建议。
二、认识世界的两种路径
为了理解本文,我们不是像一般人那样一上来就先钻到技术细节中去,而是脱离出来,先站在尽可能最高层面的、科学认识世界的两种基本路径的简要比较上。一个是经验的方法,另一个是理论的方法。这两种方法大家都是比较熟悉的。
经验的方法是什么呢?汉风网网站提示:
(不建议在百度app和苹果自带浏览器上进行购买和阅览,百度app不支持汉风网相关功能。请在手机自带浏览器上进行阅览。)
请您放心购买,如果您支付打不开的话,请联系我们微信客服,(微信号:hanfengkefu007 免验证),五分钟内发您全文。
联系客服办法请点击网站地址:http://hanfeng1918.com/baijia/92855.html
建议老友们升级会员,升级会员后,可以全部阅览。如果不会操作升级会员,请加汉风网客服微信,我们后台给您添加。
请老友们一定点击“立即购买 或 升级vip”按钮进行购买,因服务器反应慢点击购买后大概需要8秒左右,(如果等待8秒没有反应,可以再次点击一下)会跳转到支付页面。购买成功后才可以查看到剩余内容,购买成功后如果遇到服务器没有反应则请等待一会刷新(如果还是看不了,请再次刷新一下),或重新打开本篇文章,因技术原因请老友们尽量在半个小时内阅读完,超过时限会需要重新购买

赞(8)
请您分享转发:汉风1918-汉唐归来-惟有中华 » 纯科学:如何以DeepSeek为契机实现信息技术全面超美?|2025-02-01
分享到