图片第四色播播 作家:李广密 av收藏裁剪:penny,Siqi 图片 从 24Q3 运行咱们就一直在讲 AI 的下半场,天然 OpenAI o1 提议了 RL 叙事,但因为各式原因莫得破圈,DeepSeek R1 解了 RL 的谜题,推动统共行业进入了新范式,实在进入智能下半场。 市集上对于 DeepSeek 是什么、为什么的相干如故好多了,接下来更有价值相干是 AI race 要何如 play ?把已往半个月的念念考讲究了一下,但愿成为探索下半场的 road map,每隔一段时候来复盘。也列出了几个最佳奇的问题,接待填写问卷通盘交换方针,咱们会围绕下一个智能突破的 Aha moment 组织一场小范围相干会: · 下一个智能突破的 Aha moment 会从哪出现? · 要是你有充裕的探索资源,你会把探索资源插足在什么方进取? · 比如下一代 Transformer 架构、合成数据的突破、Online Learning 更高效力的学习形式,你会有哪些 Bet? Insight 01 DeepSeek 越过 OpenAI 了吗? DeepSeek 越过了 Meta Llama 毫无疑问,但比较 OpenAI、Anthropic 和 Google 这些第一梯队 players 还有距离,比如 Gemini 2.0 Flash 资本比 DeepSeek 更低,智商也很强,且全模态,外界低估了 Gemini 2.0 为代表的第一梯队的智商,仅仅莫得开源而得到这样炸裂震撼性的效果。 DeepSeek 很让东谈主抖擞,但还不成称作范式级改进,更准确的表述是将之前 OpenAI o1 半遮半掩的范式开源,将统共生态推向很高渗入率。 从第一性旨趣角度,在 Transformer 这一代架构下越过第一梯队模子厂商是有难度的,雷同旅途下很难完了弯谈超车可能,今天更期待有东谈主能探索出下一代的智能架构和范式。 图片 DeepSeek 用一年时候 追上了 OpenAI 和 Anthropic Insight 02 DeepSeek 开启新范式了吗? 就像前边说的,严格兴味上说,DeepSeek 莫得发明新范式。 但 DeepSeek 的迫切兴味在于匡助 RL 和 test time compute 这个新范式实在出圈。要是说 OpenAI 最初发布的 o1 是给行业出了一个私语,DeepSeek 便是第一个公开解谜的东谈主。 DeepSeek 发布 R1 和 R1-zero 之前,行业只消少部分东谈主在扩充 RL 和 reasoning model,但 DeepSeek 给专家指明了阶梯图,让行业信赖这样作念竟然能晋升智能,这对晋升信心,诱骗更多 AI researcher 转向新范式的讨论有浩大的匡助。 有东谈主才进入,才有算法改进,有开源紧追才有更多诡计资源插足。在 DeepSeek 之后,底本揣度打算不再发新模子的 OpenAI 接连发出 o3mini,并揣度打算不息发布 o3,还辩论开源模子。Anthropic 和 Google 也会加速 RL 的讨论。行业对新范式的推动因为 DeepSeek 加速,中小团队也不错在不同的 domain 上尝试 RL。 另外,reasoning model 的晋升会进一步匡助 agent 落地,AI researcher 当今都因此对 agent 的讨论和探索更有信心,因此也不错说 DeepSeek 开源 reasoning model 推动了行业向 Agent 的进一步探索。 是以 DeepSeek 天然莫得发明新范式,但推动统共行业进入了新范式。 Insight 03 Anthropic 的时间阶梯和 R1 有什么不同? 从 Dario的访谈不错看出,Anthropic对R-1/reasoning model的办法,与O系列有些不合,Dario以为 base model 与 reasoning model应该是个流通光谱,而非 OpenAI 这种寂然的模子系列。要是只作念 O 系列会很快遭逢天花板。 我一直想为什么 Sonnet 3.5的coding、reasoning 和 agentic智商一下子晋升这样强,但 4o 一直没追上? 他们在 pre training base model 阶段就作念了多数 RL 责任,中枢如故把 base model 提上去,否则只靠 RL 晋升 reasoning model 可能很容易把收益吃光。 Insight 04 DeepSeek 的震撼有势必,也有巧合 两位早期 OpenAI 讨论员写的《为什么伟大不成被揣度打算》描画 DeepSeek 也很符合。 时间角度上,DeepSeek 有底下几个亮点: · 开源:开源这点很迫切,OpenAI 从 GPT-3 运行转为闭源公司后,第一梯队三巨头就不再公开时间细节,拱手让出了一个空缺的开源生态位,但 Meta 和 Mistral 并莫得接稳这个位置,DeepSeek 此次号称奇袭,在开源这块大赛谈一马幽谷。 要是把震撼性打 100 分,智能晋升孝敬 30 分,开源孝敬 70 分,之前 LLaMA 也开源但莫得这样震撼的效果,证明 LLaMa 智能水平不够。 · 低廉:“Your margin is my opportunity” 这句话的含金量还在高涨。 · 联网+公开 CoT:对于用户这两个点永诀都能带来很好的用户体验,DeepSeek 把两张牌同期出了,不错说是王炸,给到 C 端用户的体验和其他 Chatbot 完全不一样。尤其是 CoT 透明,把模子念念考历程公开了,透明能让用户对 AI 更信任,促进了破圈。不外,按理说 Perplexity 亦然冲击很大的,但 DeepSeek 办事端不厚实,Perplexity 团队快速反映上线了 R-1 反而相连了很大 DeepSeek R-1 溢出的用户。 · RL 泛化:天然 RL 是 OpenAI o1 开头提议来的,但因为各式运营一直半遮半掩,渗入率并不高,DeepSeek R-1 很大兴味推动了 reasoning model 范式的程度,生态收受度大幅晋升。 DeepSeek 在时间上的探索插足是被这个智能后果值得更多东谈主关心、相干的详情味身分,但 DeepSeek R1 推出的 timing 又让这场震撼带有偶发性: · 已往好意思国一直讲我方在基础时间讨论上大幅最初,但 DeepSeek 原生于中国国内,这本人亦然一个亮点,这个历程中,又有好多好意思国科技大佬运行去宣扬 DeepSeek 挑战了好意思国科技霸主的地位的论调,DeepSeek 属于被迫卷进公论争; · DeepSeek R1 发布之前,OpenAI Stargate $500B 事件刚刚运行发酵,这种巨量插足和 DeepSeek 团队智能产出效力对比太显然了,很难不激励关心、相干; · DeepSeek 让英伟达股价大跌又进一步让公论发酵,他们确信也想不到我方成为了 2025 开年好意思股第一只黑天鹅; · 春节是居品的练兵场,出动互联网期间好多超等 App 都是在春节大爆发的,AI 期间也不例外。DeepSeek R1 适值在春节前发布,专家惊喜的是它的笔墨创作智商,而不是考验时候强调的 coding 和数学智商,文创更容易被专家用户有体感,也更容易 go viral。 Insight 05 谁受伤?谁受益? 不错把这个赛场上的 players 分 3 类:ToC、To Developer 以及 To Enterprise( to Government): 1. ToC:Chatbot 确信受冲击最大,心智和品牌关心度被 DeepSeek 抢走了,ChatGPT 也不例外; 2. 在设置者关节的影响很有限,咱们看到有效户用完之后说驳倒 r1 不好用不如 sonnet,Cursor 官方也说 Sonnet 如故 outperform,用户 surprisingly 高比例都采取 Sonnet,并莫得大幅迁徙; 3. 第三个维度,To Enterprise 和 To Government 的生意在于信任和需求办法,大型组织作念决议的利益辩论很复杂,不会像 C 端用户那么容易迁徙。 再换个角度,从闭源、开源和算力的视角想这个问题: 短期专家会以为闭源的 OpenAI/Anthropic/Google 更受冲击: · 时间秘要感被开源了,AI hype 内部最迫切的秘要感的溢价被冲突; · 更践诺的身分,市集认为这几家闭源公司的潜在客户和市集限制被抢走了一些,GPU 插足的回本周期变长; · 手脚领头羊的 OpenAI 在其中属于最“赔本”的阿谁,之前想捂着时间不开源,半遮半掩,但愿多赚时间溢价的好意思梦无法完了了。 但中永久看,GPU 资源充裕的公司如故受益的,一方面是第二梯队的 Meta 不错快速跟进新递次,Capex 愈加 efficient,Meta 可能是很大受益者,另一方面是智能晋升还需要更多探索,DeepSeek 开源把专家水平拉皆,进入全新探索又需要 10 倍以致更多数级的 GPU 插足。 从第一性旨趣来想,对于 AI 智能产业来说,无论是发展智能如故哄骗智能,从物理骨子上就势必要破费海量算力,这是基础定律决定的,不是时间优化能完全隐私的。 是以,无论是探索智能,如故哄骗智能,即便短期有质疑,中永久的算力需求也会爆炸,这也解说了为什么马斯克从第一性旨趣开赴,xAI 坚捏扩建集群,xAI 和 Stargate 背后的深层逻辑也许是一样的。Amazon 等云厂商都晓谕了要加多 Capex 教育。 咱们就假定全球的 AI research 东谈主才水柔顺证实都拉皆,有更多 GPU 就不错作念更多实验探索?临了可能如故回到 compute 的竞争。 DeepSeek 赤脚不怕穿鞋,莫得生意化诉求,专注 AGI 智能时间探索,开源这个动作对推动 AGI 程度推动兴味很大,加重了竞争,推动了敞开性,颇有鲶鱼效应。 Insight 06 蒸馏能越过 SOTA 吗? 有个细节点不祥情,要是 DeepSeek 从 pre train 阶段就多数使用蒸馏的 CoT 数据,那作念到今天效果不算惊艳,如故在第一梯队巨头的肩膀上得到的基础智能,然后再开源出来;但要是 pre train 阶段莫得多数用蒸馏数据,DeepSeek 从 0 作念 pre train 作念到今天的效果,那就号称惊艳了。 另外,蒸馏能否在 base model 越过 SOTA,应该是不太可能的。但 DeepSeek R-1 十分强,猜度是 Reward model 作念的十分好,要是 R-1 Zero 这条旅途靠谱,是有契机越过 SOTA。 Insight 07 No Moat ! Google 之前对 OpenAI 的一个评价:No Moat!这句话放在这里也很应景。 图片 DeepSeek 这一波 Chatbot 用户又出现了多数迁徙时局,给了市集一个很迫切的启发:智能时间跳动十分笔陡,阶段性居品很难造成皆备壁垒。 不管是 ChatGPT/Sonnet/Perplexity 刚造成了心智和口碑,如故 Cursor、Windsurf 这类设置者器具,一朝有了更智能的居品,用户对“上一代”智能的居品毫无忠心度,今天不管是模子层如故哄骗层都很难构建护城河。 DeepSeek 此次也考据了一件事:模子即哄骗,DeepSeek 在居品形式上没任何改进,中枢便是智能+开源,我也不禁念念考:在 AI 期间,任何居品和生意模式的改进都比不上智能的改进吗? Insight 08 DeepSeek 应该相连 这波 Chatbot 流量并作念大吗? 从 Chatbot 爆火到今天,通过 DeepSeek 团队的反映不错彰着嗅觉出来,DeepSeek 还没想好何如用这波流量。 而要不要接住、并积极运营这批流量这个问题的骨子是,伟大的生意公司和伟大的 research lab 能共存在一个组织吗? 这件事十分考验元气心灵和资源分拨、组织智商和计谋采取,要是是字节、Meta 这类大公司,他们的第一反映应该都要接下来,也有一定组织基础不错接下来,但 DeepSeek 手脚一个 research lab 组织,相连这波巨量流量的压力势必很大。 但同期也要想这一波 Chatbot 会是阶段性流量吗?Chatbot 是不是在畴昔智能探索的干线下?似乎嗅觉每个智能阶段都有对应的居品形态,而 Chatbot 仅仅解锁的其中一个早期形态。 对于 DeepSeek 来说,从畴昔 3-5 年视角看,要是今天不去相连 Chatbot 流量,会不会是一种 miss?万一哪天跑出限制效应?要是 AGI 最终完了了,又会是什么载体来相连? Insight 09 下一个智能突破的 Aha moment 从哪来? 一方面,第一梯队的下一代模子很转折,但今天咱们又处在 Transformer 的极限领域上,第一梯队能否拿出代际晋升的模子也不祥情。OpenAI、Anthropic 和 Google 手脚薪金发出来好 30-50%的模子可能都不够搭救局面,因为他们资源多了 10-30 倍。 另一方面, Agent 落地比较转折,因为 Agent 需要作念长距离多要领推理,要是模子好 5-10%,最初的效果就会被放大好多倍,是以 OpenAI、Anthropic 和 Google 一方面要作念 Agent 居品落地,full stack 集成模子+Agent 居品,就像 Windows+Office,二是也要 show 出来更苍劲的模子,比如 O3 竣工版、Sonnet 4/3.5 opus 为代表的下一代模子。 在时间不祥情味下,最可贵的是天才 AI researchers,任何想要探索 AGI 的组织都要插足资源更激进的 bet on next paradigm,尤其是在今天 pre training 阶段如故被拉皆的配景下,要有好的东谈主才+充裕资源,探索下一个智能泄露的 Aha moment。 Insight 10 DeepSeek 这一波让我对 中国 AI 东谈主才更有信心,十分饱读动 临了,但愿时间无国界。 图片 排版:杨乐乐第四色播播 本站仅提供存储办事,通盘内容均由用户发布,如发现存害或侵权内容,请点击举报。 |