因此从这个月开始,以腾讯混元大模型、华为盘古大模型等为代表的新一代应用,宁愿慢一些,稳一些,也要做到“全链路自研”。
过去大半年,无论中美,宣传学习大模型的时候,重点强调学习时间与效率,以及抓取学习的数据库范围。
可如果用的是美国底层技术框架,美国算力芯片,那么美国按下“封锁按钮”的一刻,这些“亮眼的技术参数”都是浮云。
让人有些惊喜的是,过去大家印象中注重效率与市场,主抓软件与应用的腾讯,这次在大模型战略里,首要强调的却是“全链路自研”。
混元大模型宁愿晚发布半年到一年,也要从底层框架,逻辑算法,网络服务器全部“自主研发,自主生产”,损失了“先声夺人”,但是做到了“自力更生”。
所谓“全链路”,就是从模型算法到机器学习框架,再到AI基础设施全部走“自主路线”。
自主的好处,除了避免美国“掐脖子”,另一个好处是“更懂中国人与中国话”。
过去半年多,无论是美国GPT,还是国内各个大模型应用,都逃不开被“陷阱问题”打脸的窘迫场景。
因此网上一直有现阶段大模型不是人工智能,而是“人工弱智”的调侃。
美国大模型的基础算法与学习框架早已确定,当然不可能为“中文环境量身定做”。
相反,以腾讯为代表的“国产大模型”,因为学习框架自主,就可以针对“中文上下文”,可以将错误率降低30%~50%,也可以针对中文“陷阱问题”与“长篇上下文理解”展开针对性学习演练,这次9月7号的混元大模型现场演练,以及过去两天的“试用”,最鲜明的感受就是“混元不好忽悠了”。
过去半年多,大家经常用各个大模型的“陷阱问答”来玩梗,以至于忽略了“大模型准确性”的重要性。
实际上,大模型的“准确性”,是能否赋能各行各业的“生命线”。
如今市面上的大模型,都只能应用在容错率高,任务简单的休闲领域。
这些休闲领域答错一两个历史问题,或者前言不搭后语,都可以一笑置之,但是在工业领域或者安全领域,那就“谢绝使用”了。
可以想象,一个零件尺寸理解错误,或者材料加工参数不对,有可能造成重大工程装备“性能不足”。
在安全领域,一个“理解错误”,可能是无数人遭遇生命危险。
准确率无法提高,就注定大模型只能用来“玩”,可见适合中国语境的“提高准确率”自主学习模型多么重要。
过去半年多,大模型引发科技界沸腾,但是老百姓却很淡漠的第二个原因,是“落地场景严重不足”。
过去十几个月,从全网因为GPT的更新迭代陷入狂欢,到如今的新模型发布上不了热搜,是因为大家越来越有一个共识:大模型很有趣,很先进,但没啥用!
过去半年多,包括百度在内的科技公司,发布的多款大模型产品,最大的短板,就是没有“应用落地”的端口。
直到这个月,腾讯大模型的发布,大家才直观地感到,原来大模型应用还有这么多落地场景。
过去几年,相信许多人和我一样,已经习惯将微信作为支付,出行,外卖,网购,休闲阅读,游戏的入口。
这样的生活习惯,就让腾讯拥有与生俱来的,连接各行各业消费场景的能力。
比如在前天的发布会上,腾讯展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入混元大模型后的实际应用情况。