不給呼蘭“留活路”的DeepSeek，如何重塑技術信仰？｜牛白丁_華創資本 | China Growth Capital

郵箱 :news@@cgcvc.com

不給呼蘭“留活路”的DeepSeek，如何重塑技術信仰？｜牛白丁

文章來源：發布日期：2025-02-21

不久前，火星電波創始人、CEO橘子用 DeepSeek寫了一段模仿呼蘭風格的脫口秀，呼蘭本人看過後直呼：“哎呀，不給我們人類留活路啊！”這次 DeepSeek帶來的驚喜創作體驗，讓橘子意識到未來的內容可能不再由創作者來決定形式，而是由消費者來決定。

除了能寫段子外，DeepSeek在文學創作、吵架罵人，甚至算命等方麵展現出的能力，使其口碑在普通用戶之間持續發酵，成為春節期間最為“破圈”的事件。

而在此期間，華創派企業矽基流動也承接住了DeepSeek的第一波流量。近期，矽基流動的大模型雲服務平台 SiliconCloud首發上線基於華為雲昇騰雲的滿血版 DeepSeek-R1 & V3，率先走通在國產芯片部署 DeepSeek 模型的路徑，大幅提升了基於國產芯片的大模型推理速度及實際算力利用率，顯著降低模型推理時間與成本，獲得持平全球高端 GPU 部署模型的效果。

DeepSeek引發的這一係列連鎖反應，讓不少AI從業者相信2025年將會是“AGI（通用人工智能）元年”。自稱“降臨派”的橘子，在公眾號連續發布了多篇對於DeepSeek的觀察分析，近日他做客「牛白丁」，和華創資本投資人候曉雯一起探討了DeepSeek在創投圈、用戶中，甚至是海外的火爆現象和原因。在“技術依然是最大變量”的時代，身處其中的創業者要如何應對？又能抓住哪些機遇？

DeepSeek開年的這一“國運級”事件，讓我們更加相信，開源推理模型的活躍，未來勢必會推動 AI Agent 的落地，並催生更多 AI-Native 應用誕生的機會，也歡迎持續關注「牛白丁」AGI係列節目。

您將在本期節目聽到以下內容：

01:20 AI從業者對於 DeepSeek 的使用體驗
05:54 DeepSeek 五點就下班，薪資高到字節都挖不到人
13:49 DeepSeek破圈：本質還是技術解鎖了更多場景
23:10 呼蘭看到DeepSeek寫的段子：不給人類留活路了！
28:12 AI帶來的改變：內容不再由創作者來決定形式，而是由消費者來決定
34:10 不少AI圈的人信心滿滿：2025年就是“AGI元年”
40:58 矽基流動第一波承接住了DeepSeek的流量

嘉賓介紹：

橘子，火星電波創始人、CEO，「橘子汽水鋪」主理人

本期主播：

候曉雯，華創資本投資人

候曉雯：大家好，這裏是華創資本的播客節目「牛白丁」，我是 Vivienne 曉雯。好久不見的 AGI 係列來填坑了，這一期我們請到了好朋友橘子，聊聊最近爆火的被稱之為“東方神秘力量”的DeepSeek。

橘子：大家好，我是橘子，火星電波的創始人、CEO，我們公司主要做 AI 應用的消費和創作輔助。我自己有一個自媒體叫「橘子汽水鋪」，我也是主理人。我從2022年開始就做 AI 的產品經理，對AI行業比較熟悉。

候曉雯：橘子春節完全沒有休息，公眾號幾乎是日更的頻率，社群也非常活躍。很多 AI 從業者也幾乎都沒有放假，沉浸在DeepSeek 引起的狂歡之中。你當時使用 DeepSeek 的使用體驗怎麼樣呢？

橘子：我在春節前就開始用了，當時完全不卡。它是第一個做了思維鏈加搜索的功能，特別好用，我在自媒體上瘋狂安利大家使用。最早是看到和菜頭寫了七天的DeepSeek，大家開始關注它的寫作，發現DeepSeek不僅能吵架還能寫詩。

候曉雯：確實 DeepSeek 在中文寫作能力方麵非常出眾，我在小紅書看到大家也誇這一點。

橘子：因為它的模型之前是o1，xiezuonenglibingmeiyounamehao，danluojinenglihenqiang，xieyansuwenzhangdeshihouxiaoguobucuo，erqietajiagehengui，suoyidabufenrenhaimeiyouganshoudao，yebuhuiquchangshi。而DeepSeek 讓所有人第一次看到寫東西可以這麼好。

候曉雯：相信這也是DeepSeek春節期間破圈的一個原因。過去兩年，我們在使用 ChatGPT 時，需要特別注意如何prompt，比如你要去聲明你的身份、目的，需要把過程明確出來，比如你希望 AI 幫你做什麼、怎麼做。但是在DeepSeek 使用過程中，prompt 可以很簡單，這是讓我非常驚喜的一個使用體驗。

橘子：以前我們要構建一個場景，讓 AI 進入，然後它去思考才能輸出高質量內容。但現在DeepSeek是自己打開了一個世界，它開始要照顧用戶的情緒，要理解是什麼意思，理解用戶說的朋友是不是指他自己。

候曉雯：把思維鏈的過程呈現出來，太自然了，自然到我以為本身一個產品就是這樣子的，直到最近跟朋友討論，才知道說 ChatGPT 之前不是這樣的。我覺得這是一個非常好的產品設計。這對你在思考AI 產品設計上麵有什麼啟發嗎？

橘子：最大的啟發就是DeepSeek的思考過程和寫出來的內容都太優美了，年前我就發了一條內容，說 AI 寫作已經超過我了。雖然我當時是基於 Google 的 Gemini 2.0 Flash Thinking ，它的思考能力、寫作能力已經很強很強，但DeepSeek的中文能力更強，很可怕。

候曉雯：我看了一下你的公眾號，一月二十四號發的第一篇關於DeepSeek R1 的文章《自學成才之路，DeepSeek R1 論文解讀》其實是用Gemini寫的。因為我是文科生，所以我看非 DeepSeek 的 AI 寫出來的文章老覺得非常像理工科的論文。但 DeepSeek就像文科生一樣，寫出來的內容字字都非常講究，所以這也是讓大家印象最深刻的。你是什麼時候開始關注 DeepSeek 呢？

橘子：最早關注它是2024年1月。後來 DeepSeek那篇論文《 DeepSeek-Coder-V2:Breaking the Barrier of Closed-Source Models in Code Intelligence》發了，大家看到DeepSeek開源，效果還更好，都驚呆了，說怎麼可以這麼厲害？好像那時候正好是李廠長（百度CEO李彥宏）在說閉源會超過開源。

那時候我就發現 DeepSeek很不一樣。去年四月我從 MiniMax 離開後，五六月去了一趟DeepSeek，和他們的人聊了一下戰略，他們堅定做數學和邏輯，目標就是AGI，也不怎麼做產品，就專心把模型訓好，我就覺得這個團隊好純粹。而且他們還不加班，5 點就下班了，公司當時隻有 50 多個人。

候曉雯：這還挺神奇的，怎麼做到的？是因為他們戰略很清楚？知道自己該做什麼、不做什麼，使得資源非常集中，以及沒有內卷，也沒有無效的投入？

橘子：他們戰略很清楚，而且招人時都是找那種發過paper的，比如一作是誰，二作是誰，他們挨個找。招年輕的、做過研究且有成果的。

候曉雯：我看他們招人的標準是應屆生或者是畢業1 ~ 2 年、基礎好、有潛力，但不需要證明你成功過。

橘子：我就好奇他們為什麼 MoE 能做得好？他說 MoE 那篇論文的三個作者，一個在DeepSeek、一個在階躍星辰、一個好像在美國，他們真的能把人招過來。而且去年上半年聽說字節想去搶 DeepSeek 的人，但搶不到，因為大家都覺得 DeepSeek 給的錢很多，比字節還多，DeepSeek還更理想主義一些。不像字節，就是賽馬。

候曉雯：你能明顯感受到DeepSeek 人的精神麵貌會更純粹一些嗎？

橘子：我沒有跟研究員聊，但公司整個交流下來是這樣的感受。我說你們現在完全沒有用戶，就沒有數據飛輪，不擔心嗎？他們說不擔心，也不是不做產品，是等 ready 或者看到有機會的時候再做。不會為了競爭，靠投放去獲取百萬用戶。

候曉雯：那你怎麼看待 DeepSeek 在春節帶來的認知變化呢？開源、閉源肯定是一個巨大的認知變化。大家不再去討論或者不再需要去證明開源模型是否具有能力的短板，或者比閉源模型更弱，反而看到了生態的價值和流量。

橘子：最重要的一個認知就是技術仍然是一個最大的變量。ChatGPT 已經領跑兩年，現在5000 萬日活很高了，但 DeepSeek 用了不到一個月就 4000 多萬日活了，很快就可以超過 ChatGPT。這個世界就是這樣，技術好還是最關鍵的。

另外就是R1和R1-Zero這個範式我覺得非常重要，R1-Zero相當於大模型的 AlphaGo時刻，它是一個純的沒有做 SFT 的(de)強(qiang)化(hua)學(xue)習(xi)模(mo)型(xing)，如(ru)果(guo)它(ta)本(ben)身(shen)的(de)能(neng)力(li)就(jiu)可(ke)以(yi)很(hen)強(qiang)，那(na)未(wei)來(lai)給(gei)我(wo)們(men)帶(dai)來(lai)的(de)想(xiang)象(xiang)空(kong)間(jian)會(hui)非(fei)常(chang)大(da)。第(di)一(yi)次(ci)讓(rang)我(wo)們(men)覺(jiao)得(de)大(da)模(mo)型(xing)從(cong)人(ren)類(lei)教(jiao)它(ta)變(bian)成(cheng)了(le)它(ta)可(ke)以(yi)超(chao)過(guo)我(wo)們(men)，通(tong)過(guo)自(zi)己(ji)的(de)思(si)考(kao)來(lai)超(chao)越(yue)我(wo)們(men)人(ren)類(lei)，這(zhe)個(ge)意(yi)義(yi)非(fei)常(chang)大(da)。

候曉雯：ChatGPT 出來兩年了，在這兩年過程中，大家在想象 AI-Native 產品應該長什麼樣子，發現其實對話這種方式還是一個核心的產品形態。這種產品形態是不是需要更新，需要迭代？比如做硬件的嚐試，或者做多模態語音輸入的嚐試。

我發現，DeepSeek 出來之後，對 prompt 的改變非常大。比如在 AI 來之前，我們使用高級數據庫的方式是通過提問，比如穀歌、百度；而在過去兩年，prompt 可能從一句話變成了一段話，從一段話甚至變成了一篇文章的長度。

但是在 DeepSeek 之後，這種 AI 的交互又能變成一句話、一段話，當然原因可能是因為DeepSeek 隻是一個語言模型，它還沒有做更多模態的，比如沒有圖片、沒有音頻。但“六小虎”（AI六小虎通常指智譜、階躍星辰、MiniMax、Kimi、零一萬物和百川智能）已經在做多模態模型的探索，這是我的一個想法。

你的文章發出來之後，包括你在各個平台衝浪，有看到一些什麼有趣的討論或者觀點嗎？

橘子：討論非常深入，非常多麵。剛剛你說 prompt 一開始變得越來越長， DeepSeek之後好像也不用那麼長，簡單一點就可以。從原理上來說，你給它更多的上下文和思考時間，它就會提高能力。之前，通過我們寫 prompt ，給它寫很多上下文，它思考的過程本質上就會成為它的上下文，所以就提升了能力，這也是原來範式的一種延伸。說到大家的討論，有一個爭議點，就是R1 到底是複現了一個OpenAI o1，還是一個全新的模型？

我覺得沒有定論，我個人相信R1-Zero其實是一個範式改變，因為大家用 R1的時候也能感受到明顯是沒有做很多安全對齊的，它會很奔放，能說出一些超出普通模型安全邊界的話，對於 OpenAI 來說是不可能接受這種情況的。

候曉雯：是否是因為商業模型？因為開源和閉源相比，本身對於模型安全要求不同，他們在這方麵工作做得不同。wojidezhiqianhechuangyezhejiaoliu，youchuangyezheshicongbiyuanmoxingqiedaokaiyuanmoxing，tamentidaolehendadeyigegulv，jiushixiwangyougengduomoxinganquangongsichulai，yinweifaxiankaiyuanmoxingqueshishigengbushouyueshude。

橘子：是這樣的，隻要提供商業服務，就要加一層安全過濾。

候曉雯：所以對齊的工作是不是做得不一樣？

橘子：模型層麵，比如 OpenAI 、Claude 和國內的模型相比，安全程度可能確實是不一樣的，好像 Claude 是最嚴格的。DeepSeek 這塊放得最鬆，這和開源、閉源倒是沒有那麼大關係。

候曉雯：我印象特別深刻，在 2022 年 11 月底出來 ChatGPT 的時候，大家就討論過，ChatGPT 是否是一個範式？那時候一部分人會說它不過就是個對話框，另一部分人說它在使用方麵是一個範式的變化，它使得普通人可以通過 prompt 這種方式接觸到智能。在技術層麵，GPT 3.5 的分支做了一些工程優化，所以認為是一種技術範式。

DeepSeek 現在也有這樣的討論，它在技術層麵，比如架構還是 Transformer 的延續；工程上，比如 RL 可能引起了大多數人的重視，發現真的有用，還有蒸餾等偏技術方麵的討論。

其實我更關心的，還是 DeepSeek 現象級破圈這個事，因為它使得 AI 進一步走進了大眾。雖然之前豆包用流量和硬件推得很厲害，但還是沒有出圈，而現在甚至老家的親戚春節時也在討論DeepSeek，你怎麼看呢？

橘子：本質上就是因為技術更厲害了，解鎖了更多的場景，或者讓更多的場景從六十分提升到了八九十分，甚至是滿分，這樣自然就會擴大到更多人群，而且口口相傳一直很有效，因為用錢買口碑很難，買的隻是一個曝光而已。

候曉雯：豆包、Kimi 一係列的 AI 產品，是從零構建出來的，理論上應該給大家的驚喜程度不小。但 DeepSeek 在春節呈現出來的破圈效益顯著高了很多個量級。

橘子：我們之前做海螺AI，觀察到一個現象：大部分人對於AI第一個提問的回答非常care，如果你第一個問題回答得很好，他會覺得這是一個智能。而DeepSeek可能每一個問題都能回答得很好，它的思考很驚豔，就讓人覺得智商超過了我們。

候曉雯：首先它非常真實，它的思考過程就像另一個人腦子裏的東西被你讀出來一樣。其次非常聰明。你怎麼看待它在海外引起的破圈，甚至是恐慌？

橘子：一開始DeepSeek還沒有那麼誇張，在排行榜是二十多名。當時海外的好多KOL用了之後說這個模型很不一樣，包括Midjourney 的 CEO David Holz，他跟DeepSeek聊的是中國古代的哲學和文化，他說它這方麵特別強，而且他們用英文聊的，說明這個模型很厲害。那時候大家還沒有太關注成本，隻是覺得效果好。V3 其實一個月前就發了，當時那個論文沒有人討論，後來發現 R1 是基於 DeepSeek-V3-Base 訓練的，一對比發現可能跟美國的成本差了有兩個數量級，然後逐漸發酵，英偉達還因為這個事情股價跌了。

候曉雯：如果我們稱之為一次事件，英偉達股價下跌是這個事件的巔峰，可能會引發對英偉達估值敘事邏輯進行重新審視。

橘子：我覺得沒有改變，但是影響了至少可能 5%～10% 的認知信仰。

候曉雯：最近我在跟一些中美的同行交流，他們也提到一個可能令人擔憂的點，就是在DeepSeek之前，美國對中國 AI 的重視程度是不夠的。但是現在被DeepSeek 震撼到了，他們非常擔心中國彎道超車。

橘子：因為股價其實是一個放大器，把DeepSeek從技術圈直接放到了金融圈，甚至政界。

候曉雯：這可能會影響到中國的創業者在海外做市場探索，隻是現在還沒有明確的事件。

分享到：