6. DeepSeek彻底解决推理问题了吗?是否意味着AGI不需要新范式?
DeepSeek在V3模型上的创新都是工程上的,其突破的更大意义在于改变大模型的既有商业模式以及美国对华的芯片制裁——V3的大量创新都与为克服使用H800而不是H100所带来的内存带宽不足有关。为此,DeepSeek甚至绕过了英伟达的编程工具CUDA,对每块H800芯片上132个处理单元中的20个进行了重新编程,以专门用于管理跨芯片通信。
相较而言,R1在纯强化学习上的探索至少达到了与OpenAI o1相当的水平,o1背后的技术是否与R1相同的问题目前未知,OpenAI没有公开过其o1模型的强化学习方案。不同大模型公司在强化学习中设置奖励函数的方式从来都千差万别。
不过,还不能说R1彻底解决了推理问题,至少只要基于o1的代操作AI——Operator还不能像人一样自如操作各种电子设备,就不能说这种水平的AI就是通用人工智能了。目前,Operator理论上可以根据用户要求执行鼠标和键盘允许的所有操作:只要用户口头交代一下,它就可以帮用户订外卖或查找旅游路线;遇到问题或者操作出错时,它能利用强化学习带来的推理能力自我纠错;实在无法解决问题时,它会将控制权交还给用户——就像自动驾驶一样,AI遇到无法决策的困境时会将方向盘交还给人类司机。也和自动驾驶一样,这种「接管率」将是观察基于强化学习的AI是否在进步的指标之一。
7. DeepSeek的成果会如何影响AI产业的未来?
美国科技股1月27日的表现已经初步表明了DeepSeek接连发布的几个模型对市场的影响力大小和范围。
DeepSeek的低成本模型发布之际,美国总统特朗普刚刚宣布一个总额达5000亿美元的AI基础设施项目,OpenAI、软银等都已承诺参与其中。稍早前,微软已经表示2025年将在AI基础设施上投入800亿美元,Meta的扎克伯格则计划在2025年为其人工智能战略投资600亿至650亿美元。DeepSeek的低成本模型使人们开始怀疑这些规模惊人的投资是否是种浪费,如果只用数百万美元,而不是数亿元,就能训练一个4o等级的模型,那大模型对于GPU芯片的需求可能只是当下的1/10甚至1/100。
英伟达的股价因此跌得最厉害,不过长远看,受冲击最大的不一定是英伟达,而会是其他自研大模型并根据模型调用建立商业模式的公司,OpenAI、Anthropic、月之暗面、字节跳动等都属于这一范围。推理成本上,OpenAI o1每百万输入和百万输出token分别收取15美元和60美元,而DeepSeek R1同样输入与输出的价格分别只要0.55美元和2.19美元,差不多只是前者的3%。此前,OpenAI向使用其最先进模型o1的用户收取每月200美元的订阅费,而且仍然处于亏损状态并打算提价,DeepSeek R1的出现可能令ChatGPT的提价计划泡汤。
此外,一大批中国大模型公司比如字节跳动和月之暗面2024年花在用户增长上的广告费可能会打水漂。数据监测公司Sensor Tower的数据显示,自今年1月11日上线以来,DeepSeek App的累计下载量已超过300万次,其中,80%的下载量集中在1月20日至1月26日的一周内。如果保持这种增速,DeepSeek不久就会进入有千万用户的AI应用阵营。
股价大跌近17%后,英伟达在一份声明中称,DeepSeek的成果证明了市场对英伟达芯片的需求会更多(而不是更少)。这一说法有一定道理,因为当模型训练和推理都变得更便宜、只需要消耗更少算力,人工智能的商业化可以进展更快,比如,R1的小型版本能够在普通家庭电脑上运行,这将有助于推动AI应用的普及与民主化——像苹果这样为大模型提供终端设备的公司会是赢家。1月27日的美国科技股大跌中,苹果也是仅有的两家没有下跌的技术公司,另一家是拥有云计算业务的亚马逊,它同样在自研大模型上落后,但拥有无论什么模型都需要的云计算生意。
相较于训练环节,进入商业化后的推理环节会消耗更多倍的算力。而且,更有效的使用计算的方法并不意味着更多的算力没有用。不过短期内,向英伟达大手笔下单的技术公司们会变得更谨慎。
当然,最大的赢家还是消费者。
8. 为什么幻方——一家量化投资公司——要大力投资人工智能?
DeepSeek由梁文峰于2023年12月创立,在此之前,他于2015年成立了名为「幻方量化」(High-Flyer)的量化对冲基金,该基金通过AI分析金融数据从而作出交易决策。2019 年,幻方量化成为国内首个募资超过1000亿元的的量化对冲基金。
虽然一直有声音认为金融市场就像变幻莫测的天气一样无法预测,这些人可能正确,但1980年代以来,不断有数学家和计算机科学家希望为价格建模,并据此赚到钱。1988年至2018年的30年间,美国量化投资巨头文艺复兴科技创造了39.1%的年化复合收益率,远超过巴菲特、索罗斯等传统靠人来决定何时下注的投资大师。
这些量化基金并不追求预测金融市场下一刻的价格,而是专注于寻找发现市场中存在特定的价格模式。比如「24小时效应」模式:周一的价格变化常常是周五趋势的延续,而这个趋势到了周二就会反转(24小时效应);「周末效应」:如果市场在周五展现出清晰的上升趋势,那么周五收盘前买入再到下周一一早卖出,也大概率会赚钱;再比如有的资产一旦第一天升值了,它第二天大概率会继续升值,反之亦然。这些有预测能力的金融信号就此成为量化基金们用以指导投资的交易因子(indicators),虽然潜在盈利空间没那么大,只要交易频率够高(与价值投资倡导的刚好相反),量化基金们就能吃到市场的肥尾。
大模型擅长从大规模数据中寻找模式,这种能力正对热衷从金融数据中寻找交易因子的量化基金的胃口。幻方量化也不例外。DeepSeek目前尚未推出相应的金融投资大模型,不过这只是时间问题。
(艺术与设计 吴洋洋)

微信扫一扫 