郵箱 :news@@cgcvc.com

不給呼蘭“留活路”的DeepSeek,如何重塑技術信仰?|牛白丁

文章來源:   發布日期:2025-02-21

不久前,火星電波創始人、CEO橘子用 DeepSeek寫了一段模仿呼蘭風格的脫口秀,呼蘭本人看過後直呼:“哎呀,不給我們人類留活路啊!”這次 DeepSeek帶來的驚喜創作體驗,讓橘子意識到未來的內容可能不再由創作者來決定形式,而是由消費者來決定。
除了能寫段子外,DeepSeek在文學創作、吵架罵人,甚至算命等方麵展現出的能力,使其口碑在普通用戶之間持續發酵,成為春節期間最為“破圈”的事件。
而在此期間,華創派企業矽基流動也承接住了DeepSeek的第一波流量。近期,矽基流動的大模型雲服務平台 SiliconCloud首發上線基於華為雲昇騰雲的滿血版 DeepSeek-R1 & V3,率先走通在國產芯片部署 DeepSeek 模型的路徑,大幅提升了基於國產芯片的大模型推理速度及實際算力利用率,顯著降低模型推理時間與成本,獲得持平全球高端 GPU 部署模型的效果。
DeepSeek引發的這一係列連鎖反應,讓不少AI從業者相信2025年將會是“AGI(通用人工智能)元年”。自稱“降臨派”的橘子,在公眾號連續發布了多篇對於DeepSeek的觀察分析,近日他做客「牛白丁」,和華創資本投資人候曉雯一起探討了DeepSeek在創投圈、用戶中,甚至是海外的火爆現象和原因。在“技術依然是最大變量”的時代,身處其中的創業者要如何應對?又能抓住哪些機遇?
DeepSeek開年的這一“國運級”事件,讓我們更加相信,開源推理模型的活躍,未來勢必會推動 AI Agent 的落地,並催生更多 AI-Native 應用誕生的機會,也歡迎持續關注「牛白丁」AGI係列節目。      
您將在本期節目聽到以下內容:

  • 01:20   AI從業者對於 DeepSeek 的使用體驗


  • 05:54  DeepSeek 五點就下班,薪資高到字節都挖不到人


  • 13:49  DeepSeek破圈:本質還是技術解鎖了更多場景


  • 23:10  呼蘭看到DeepSeek寫的段子:不給人類留活路了!


  • 28:12  AI帶來的改變:內容不再由創作者來決定形式,而是由消費者來決定


  • 34:10  不少AI圈的人信心滿滿:2025年就是“AGI元年”


  • 40:58  矽基流動第一波承接住了DeepSeek的流量


   嘉賓介紹:
橘子,火星電波創始人、CEO,「橘子汽水鋪」主理人
本期主播:

候曉雯,華創資本投資人


候曉雯:大家好,這裏是華創資本的播客節目「牛白丁」,我是 Vivienne 曉雯。好久不見的 AGI 係列來填坑了,這一期我們請到了好朋友橘子,聊聊最近爆火的被稱之為“東方神秘力量”的DeepSeek。


橘子:大家好,我是橘子,火星電波的創始人、CEO,我們公司主要做 AI 應用的消費和創作輔助。我自己有一個自媒體叫「橘子汽水鋪」,我也是主理人。我從2022年開始就做 AI 的產品經理,對AI行業比較熟悉。
候曉雯:橘子春節完全沒有休息,公眾號幾乎是日更的頻率,社群也非常活躍。很多 AI 從業者也幾乎都沒有放假,沉浸在DeepSeek 引起的狂歡之中。你當時使用 DeepSeek 的使用體驗怎麼樣呢?
橘子:我在春節前就開始用了,當時完全不卡。它是第一個做了思維鏈加搜索的功能,特別好用,我在自媒體上瘋狂安利大家使用。最早是看到和菜頭寫了七天的DeepSeek,大家開始關注它的寫作,發現DeepSeek不僅能吵架還能寫詩。
候曉雯:確實 DeepSeek 在中文寫作能力方麵非常出眾,我在小紅書看到大家也誇這一點。
橘子:因為它的模型之前是o1,xiezuonenglibingmeiyounamehao,danluojinenglihenqiang,xieyansuwenzhangdeshihouxiaoguobucuo,erqietajiagehengui,suoyidabufenrenhaimeiyouganshoudao,yebuhuiquchangshi。而DeepSeek 讓所有人第一次看到寫東西可以這麼好。
候曉雯:相信這也是DeepSeek春節期間破圈的一個原因。過去兩年,我們在使用 ChatGPT 時,需要特別注意如何prompt,比如你要去聲明你的身份、目的,需要把過程明確出來,比如你希望 AI 幫你做什麼、怎麼做。但是在DeepSeek 使用過程中,prompt 可以很簡單,這是讓我非常驚喜的一個使用體驗。
橘子:以前我們要構建一個場景,讓 AI 進入,然後它去思考才能輸出高質量內容。但現在DeepSeek是自己打開了一個世界,它開始要照顧用戶的情緒,要理解是什麼意思,理解用戶說的朋友是不是指他自己。
候曉雯:把思維鏈的過程呈現出來,太自然了,自然到我以為本身一個產品就是這樣子的,直到最近跟朋友討論,才知道說 ChatGPT 之前不是這樣的。我覺得這是一個非常好的產品設計。這對你在思考AI 產品設計上麵有什麼啟發嗎?
子:最大的啟發就是DeepSeek的思考過程和寫出來的內容都太優美了,年前我就發了一條內容,說 AI 寫作已經超過我了。雖然我當時是基於 Google 的 Gemini 2.0 Flash Thinking ,它的思考能力、寫作能力已經很強很強,但DeepSeek的中文能力更強,很可怕。
候曉雯:我看了一下你的公眾號,一月二十四號發的第一篇關於DeepSeek R1 的文章《自學成才之路,DeepSeek R1 論文解讀》其實是用Gemini寫的。因為我是文科生,所以我看非 DeepSeek 的 AI 寫出來的文章老覺得非常像理工科的論文。但 DeepSeek就像文科生一樣,寫出來的內容字字都非常講究,所以這也是讓大家印象最深刻的。你是什麼時候開始關注 DeepSeek 呢?
橘子:最早關注它是2024年1月。後來 DeepSeek那篇論文《 DeepSeek-Coder-V2:Breaking the Barrier of Closed-Source Models in Code Intelligence》發了,大家看到DeepSeek開源,效果還更好,都驚呆了,說怎麼可以這麼厲害?好像那時候正好是李廠長(百度CEO李彥宏)在說閉源會超過開源。
那時候我就發現 DeepSeek很不一樣。去年四月我從 MiniMax 離開後,五六月去了一趟DeepSeek,和他們的人聊了一下戰略,他們堅定做數學和邏輯,目標就是AGI,也不怎麼做產品,就專心把模型訓好,我就覺得這個團隊好純粹。而且他們還不加班,5 點就下班了,公司當時隻有 50 多個人。
候曉雯:這還挺神奇的,怎麼做到的?是因為他們戰略很清楚?知道自己該做什麼、不做什麼,使得資源非常集中,以及沒有內卷,也沒有無效的投入?
橘子:他們戰略很清楚,而且招人時都是找那種發過paper的,比如一作是誰,二作是誰,他們挨個找。招年輕的、做過研究且有成果的。
候曉雯:我看他們招人的標準是應屆生或者是畢業1 ~ 2 年、基礎好、有潛力,但不需要證明你成功過。
子:我就好奇他們為什麼 MoE 能做得好?他說 MoE 那篇論文的三個作者,一個在DeepSeek、一個在階躍星辰、一個好像在美國,他們真的能把人招過來。而且去年上半年聽說字節想去搶 DeepSeek 的人,但搶不到,因為大家都覺得 DeepSeek 給的錢很多,比字節還多,DeepSeek還更理想主義一些。不像字節,就是賽馬。
候曉雯:你能明顯感受到DeepSeek 人的精神麵貌會更純粹一些嗎?
橘子:我沒有跟研究員聊,但公司整個交流下來是這樣的感受。我說你們現在完全沒有用戶,就沒有數據飛輪,不擔心嗎?他們說不擔心,也不是不做產品,是等 ready 或者看到有機會的時候再做。不會為了競爭,靠投放去獲取百萬用戶。
候曉雯:那你怎麼看待 DeepSeek 在春節帶來的認知變化呢?開源、閉源肯定是一個巨大的認知變化。大家不再去討論或者不再需要去證明開源模型是否具有能力的短板,或者比閉源模型更弱,反而看到了生態的價值和流量。
橘子:最重要的一個認知就是技術仍然是一個最大的變量。ChatGPT 已經領跑兩年,現在5000 萬日活很高了,但 DeepSeek 用了不到一個月就 4000 多萬日活了,很快就可以超過 ChatGPT。這個世界就是這樣,技術好還是最關鍵的。
另外就是R1和R1-Zero這個範式我覺得非常重要,R1-Zero相當於大模型的 AlphaGo時刻,它是一個純的沒有做 SFT 的(de)強(qiang)化(hua)學(xue)習(xi)模(mo)型(xing),如(ru)果(guo)它(ta)本(ben)身(shen)的(de)能(neng)力(li)就(jiu)可(ke)以(yi)很(hen)強(qiang),那(na)未(wei)來(lai)給(gei)我(wo)們(men)帶(dai)來(lai)的(de)想(xiang)象(xiang)空(kong)間(jian)會(hui)非(fei)常(chang)大(da)。第(di)一(yi)次(ci)讓(rang)我(wo)們(men)覺(jiao)得(de)大(da)模(mo)型(xing)從(cong)人(ren)類(lei)教(jiao)它(ta)變(bian)成(cheng)了(le)它(ta)可(ke)以(yi)超(chao)過(guo)我(wo)們(men),通(tong)過(guo)自(zi)己(ji)的(de)思(si)考(kao)來(lai)超(chao)越(yue)我(wo)們(men)人(ren)類(lei),這(zhe)個(ge)意(yi)義(yi)非(fei)常(chang)大(da)。
候曉雯:ChatGPT 出來兩年了,在這兩年過程中,大家在想象 AI-Native 產品應該長什麼樣子,發現其實對話這種方式還是一個核心的產品形態。這種產品形態是不是需要更新,需要迭代?比如做硬件的嚐試,或者做多模態語音輸入的嚐試。
我發現,DeepSeek 出來之後,對 prompt 的改變非常大。比如在 AI 來之前,我們使用高級數據庫的方式是通過提問,比如穀歌、百度;而在過去兩年,prompt 可能從一句話變成了一段話,從一段話甚至變成了一篇文章的長度。
但是在 DeepSeek 之後,這種 AI 的交互又能變成一句話、一段話,當然原因可能是因為DeepSeek 隻是一個語言模型,它還沒有做更多模態的,比如沒有圖片、沒有音頻。但“六小虎”(AI六小虎通常指智譜、階躍星辰、MiniMax、Kimi、零一萬物和百川智能)已經在做多模態模型的探索,這是我的一個想法。
你的文章發出來之後,包括你在各個平台衝浪,有看到一些什麼有趣的討論或者觀點嗎?
橘子:討論非常深入,非常多麵。剛剛你說 prompt 一開始變得越來越長, DeepSeek之後好像也不用那麼長,簡單一點就可以。從原理上來說,你給它更多的上下文和思考時間,它就會提高能力。之前,通過我們寫 prompt ,給它寫很多上下文,它思考的過程本質上就會成為它的上下文,所以就提升了能力,這也是原來範式的一種延伸。說到大家的討論,有一個爭議點,就是R1 到底是複現了一個OpenAI o1,還是一個全新的模型?
我覺得沒有定論,我個人相信R1-Zero其實是一個範式改變,因為大家用 R1的時候也能感受到明顯是沒有做很多安全對齊的,它會很奔放,能說出一些超出普通模型安全邊界的話,對於 OpenAI 來說是不可能接受這種情況的。
候曉雯:是否是因為商業模型?因為開源和閉源相比,本身對於模型安全要求不同,他們在這方麵工作做得不同。wojidezhiqianhechuangyezhejiaoliu,youchuangyezheshicongbiyuanmoxingqiedaokaiyuanmoxing,tamentidaolehendadeyigegulv,jiushixiwangyougengduomoxinganquangongsichulai,yinweifaxiankaiyuanmoxingqueshishigengbushouyueshude。
橘子:是這樣的,隻要提供商業服務,就要加一層安全過濾。
候曉雯:所以對齊的工作是不是做得不一樣?
橘子:模型層麵,比如 OpenAI 、Claude 和國內的模型相比,安全程度可能確實是不一樣的,好像 Claude 是最嚴格的。DeepSeek 這塊放得最鬆,這和開源、閉源倒是沒有那麼大關係。
候曉雯:我印象特別深刻,在 2022 年 11 月底出來 ChatGPT 的時候,大家就討論過,ChatGPT 是否是一個範式?那時候一部分人會說它不過就是個對話框,另一部分人說它在使用方麵是一個範式的變化,它使得普通人可以通過 prompt 這種方式接觸到智能。在技術層麵,GPT 3.5 的分支做了一些工程優化,所以認為是一種技術範式。
DeepSeek 現在也有這樣的討論,它在技術層麵,比如架構還是 Transformer 的延續;工程上,比如 RL 可能引起了大多數人的重視,發現真的有用,還有蒸餾等偏技術方麵的討論。
其實我更關心的,還是 DeepSeek 現象級破圈這個事,因為它使得 AI 進一步走進了大眾。雖然之前豆包用流量和硬件推得很厲害,但還是沒有出圈,而現在甚至老家的親戚春節時也在討論DeepSeek,你怎麼看呢?
橘子:本質上就是因為技術更厲害了,解鎖了更多的場景,或者讓更多的場景從六十分提升到了八九十分,甚至是滿分,這樣自然就會擴大到更多人群,而且口口相傳一直很有效,因為用錢買口碑很難,買的隻是一個曝光而已。
候曉雯:豆包、Kimi 一係列的 AI 產品,是從零構建出來的,理論上應該給大家的驚喜程度不小。但 DeepSeek 在春節呈現出來的破圈效益顯著高了很多個量級。
橘子:我們之前做海螺AI,觀察到一個現象:大部分人對於AI第一個提問的回答非常care,如果你第一個問題回答得很好,他會覺得這是一個智能。而DeepSeek可能每一個問題都能回答得很好,它的思考很驚豔,就讓人覺得智商超過了我們。
候曉雯:首先它非常真實,它的思考過程就像另一個人腦子裏的東西被你讀出來一樣。其次非常聰明。你怎麼看待它在海外引起的破圈,甚至是恐慌?
橘子:一開始DeepSeek還沒有那麼誇張,在排行榜是二十多名。當時海外的好多KOL用了之後說這個模型很不一樣,包括Midjourney 的 CEO David Holz,他跟DeepSeek聊的是中國古代的哲學和文化,他說它這方麵特別強,而且他們用英文聊的,說明這個模型很厲害。那時候大家還沒有太關注成本,隻是覺得效果好。V3 其實一個月前就發了,當時那個論文沒有人討論,後來發現 R1 是基於 DeepSeek-V3-Base 訓練的,一對比發現可能跟美國的成本差了有兩個數量級,然後逐漸發酵,英偉達還因為這個事情股價跌了。
候曉雯:如果我們稱之為一次事件,英偉達股價下跌是這個事件的巔峰,可能會引發對英偉達估值敘事邏輯進行重新審視。
橘子:我覺得沒有改變,但是影響了至少可能 5%~10% 的認知信仰。
候曉雯:最近我在跟一些中美的同行交流,他們也提到一個可能令人擔憂的點,就是在DeepSeek之前,美國對中國 AI 的重視程度是不夠的。但是現在被DeepSeek 震撼到了,他們非常擔心中國彎道超車。
橘子:因為股價其實是一個放大器,把DeepSeek從技術圈直接放到了金融圈,甚至政界。
候曉雯:這可能會影響到中國的創業者在海外做市場探索,隻是現在還沒有明確的事件。
分享到: