證券日報微信

證券日報微博

您所在的位置: 網站首頁 > TMT頻道 > TMT行業(yè) > 正文

服務器崩了,一夜出圈!來自中國的AI“神器”刷屏硅谷

2025-01-26 19:40  來源:證券日報網 

    本報記者 金婉霞

    每一次,關于AI大模型的迭代進展都能牽動市場神經;這一次,是中國企業(yè)“技驚四座”。

    1月26日,有網友表示,DeepSeek崩了,提示服務器繁忙。隨后,DeepSeek回應稱,確實出現(xiàn)了局部服務波動,但問題在數(shù)分鐘內得到解決;DeepSeek同時表示,此次事件可能與新模型發(fā)布后的訪問量激增有關。另據(jù)記者觀察,截至1月16日16時30分,DeepSeek在蘋果應用商店免費榜排行的下載排名已至第四位,僅次于字節(jié)跳動旗下的AI助手豆包。

    怎么回事?一夜之間,“名不見經傳”的DeepSeek就“霸屏”了?

    這與一款大模型有關。

    公開資料顯示,DeepSeek的開發(fā)者為杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索”),該公司成立于2023年7月份。企業(yè)官方微信公眾號信息顯示,今年1月20日,深度求索正式發(fā)布DeepSeek-R1大模型,并同步開源模型權重。“DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。”深度求索在發(fā)布信息中表示。

    DeepSeek-R1發(fā)布后,首先點燃了海外市場熱情。

    在美國硅谷,多位人工智能行業(yè)意見領袖對DeepSeek-R1表達由衷贊美。微軟CEO薩蒂亞?納德拉公開表示:“他們切實有效地開發(fā)出了一款開源模型,在推理計算方面表現(xiàn)出色,且超級計算效率極高。”曾投資過OpenAI的投資人馬克·安德里森在社交平臺表示,DeepSeek-R1是我見過的最令人驚嘆,最令人印象深刻的突破之一,并且是開源的,是對全世界的大禮。

    在歐洲,DeepSeek-R1也是好評不斷。英國人工智能咨詢公司DAIR.AI的聯(lián)合創(chuàng)始人兼人工智能研究員埃爾維斯·薩拉維亞在社交平臺評價DeepSeek-R1表示,“這太瘋狂了,完全出乎意料”。德國埃爾蘭根馬克斯普朗克光科學研究所人工智能科學家實驗室負責人馬里奧·克倫表示:“DeepSeek-R1的開放性非常了不起。”

    從各類觀點來看,DeepSeek-R1“出圈”的核心秘笈在于技術實力。

    2024年12月底,DeepSeek曾推出了一個免費的開源大型語言模型,據(jù)稱,該模型的開發(fā)僅用了兩個月的時間,花費不到600萬美元就構建完成,且僅使用了英偉達的低性能芯片H800s——而眼下,大多數(shù)大模型的迭代依賴于先進算力,成本巨大。此次,新推出的DeepSeek-R1在性能上更比肩OpenAI o1正式版,在第三方大模型測評中,DeepSeek-R1在風格控制類模型這一評價指標上與OpenAI o1的并列第一。

    一位Meta的工程師在行業(yè)社區(qū)論壇中這樣寫道,“Meta的生成式AI部門正處于恐慌中。這一切始于DeepSeek:那個不知名的中國公司,僅有550萬美元的訓練預算。工程師們正在瘋狂地剖析DeepSeek,并試圖從中復制一切可能的東西。”

    深度求索在官方微信號中這樣介紹自己:投身于探索AGI(記者注:通用人工智能)的本質,不做中庸的事,帶著好奇心,用最長期的眼光去回答最大的問題。

(編輯 才山丹)

-證券日報網
  • 24小時排行 一周排行

版權所有證券日報網

互聯(lián)網新聞信息服務許可證 10120180014增值電信業(yè)務經營許可證B2-20181903

京公網安備 11010202007567號京ICP備17054264號

證券日報網所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網站電話:010-83251800

網站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關注

官方微博

掃一掃,加關注