證券日報微信

證券日報微博

您所在的位置: 網(wǎng)站首頁 > TMT頻道 > TMT行業(yè) > 正文

中國2家AI公司連發(fā)新模型追趕OpenAI 邁入自主創(chuàng)新新階段

2025-01-23 20:59  來源:證券日報網(wǎng) 

    本報訊 (記者袁傳璽)1月20日,國內(nèi)兩家備受關注的人工智能大模型創(chuàng)業(yè)公司北京月之暗面科技有限公司(以下簡稱“月之暗面”)(Kimi)和杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索”)(DeepSeek)均發(fā)布了最新模型。

    在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,多模態(tài)思考模型實現(xiàn)了SOTA級別多模態(tài)推理和通用推理能力。在short-CoT模式下,Kimik1.5的數(shù)學、代碼、視覺多模態(tài)和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet。在long-CoT模式下,Kimi k1.5的數(shù)學、代碼、多模態(tài)推理能力達到了OpenAI o1正式版的水平。月之暗面表示,這應該是全球范圍內(nèi),首次有OpenAI之外的公司實現(xiàn)o1正式版的多模態(tài)推理性能。

    深度求索發(fā)布的DeepSeek-R1在后訓練階段大規(guī)模使用強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼和自然語言推理等任務上,R1的性能也可以比肩o1正式版。同時根據(jù)DeepSeek公布的測試數(shù)據(jù),R1在美國AIME 2024、MATH-500和SWE-bench Verified測試中的比分均高于OpenAI o1。

    與OpenAI不同,這兩家公司都公開了原理及技術報告:Kimik1.5發(fā)布原創(chuàng)技術long2short,高效思維鏈+原生多模,DeepSeek-R1則繼續(xù)主打高性價比。

    中央民族大學教授郭全中表示:“中國AI公司之前基本都在摸著OpenAI的石頭過河,但從K1.5等國產(chǎn)大模型開始,以硅谷為中心的格局已悄然發(fā)生變動。國產(chǎn)大模型的突破不僅在于技術指標的提升,也展示了中國AI技術正在走向自主創(chuàng)新的新階段。期待看到更多中國企業(yè)在全球AI舞臺上展現(xiàn)實力,推動人工智能技術向著更高水平邁進。”

(編輯 張鈺鵬)

-證券日報網(wǎng)
  • 24小時排行 一周排行

版權所有證券日報網(wǎng)

互聯(lián)網(wǎng)新聞信息服務許可證 10120180014增值電信業(yè)務經(jīng)營許可證B2-20181903

京公網(wǎng)安備 11010202007567號京ICP備17054264號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關注

官方微博

掃一掃,加關注