頂[0] 分享評(píng)論[0] 編輯

DeepSeek

DeepSeek，全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司，中文簡稱為深度求索，是一家專注于先進(jìn)大語言模型（LLM）及相關(guān)技術(shù)研發(fā)的試驗(yàn)與發(fā)展型企業(yè)。該公司由量化資管領(lǐng)域的知名巨頭幻方量化于2023年7月17日創(chuàng)立，注冊(cè)地位于浙江省杭州市拱墅區(qū)環(huán)城北路169號(hào)匯金國際大廈西1幢1201室，法定代表人為裴湉。

2024年1月5日，DeepSeek正式推出了其首個(gè)大型模型——DeepSeek LLM。同年5月，該公司宣布開源第二代MoE大模型DeepSeek-V2，憑借其卓越的性能與親民的價(jià)格，DeepSeek贏得了“AI界拼多多”的綽號(hào)。12月26日，DeepSeek宣布DeepSeek-V3模型的首個(gè)版本正式上線并同步開源。

進(jìn)入2025年，DeepSeek于1月20日正式發(fā)布了DeepSeek-R1模型，該模型在性能上與OpenAI的GPT-1正式版不相上下。1月31日，DeepSeek R1 671b作為英偉達(dá)NIM微服務(wù)的預(yù)覽版在build.nvidia.com平臺(tái)上發(fā)布。2月，DeepSeek-R1、V3、Coder等系列模型相繼上線國家超算互聯(lián)網(wǎng)平臺(tái)。同時(shí)，DeepSeek的日活躍用戶數(shù)于2月1日突破3000萬大關(guān)，創(chuàng)下了達(dá)成這一里程碑的最快記錄。

截至2025年2月2日，DeepSeek已攀升至140個(gè)國家蘋果App Store下載排行榜的首位，并在美國的Android Play Store中也位居榜首。截至2月9日，DeepSeek App的累計(jì)下載量已超過1.1億次，周活躍用戶規(guī)模最高接近9700萬。2月21日，DeepSeek宣布將陸續(xù)開源5個(gè)代碼庫。2月26日，該公司開源了DeepGEMM。次日，DeepSeek發(fā)布了其“開源周”第四日的內(nèi)容，即優(yōu)化的并行策略。據(jù)IndiaTimes于3月31日?qǐng)?bào)道，DeepSeek在2月錄得了5.247億次新的網(wǎng)站訪問量，超越了ChatGPT，在整體規(guī)模上仍位列第三。4月30日，DeepSeek在AI開源社區(qū)Hugging Face上發(fā)布了一個(gè)名為DeepSeek-Prover-V2-671B的模型。然而，7月根據(jù)國際半導(dǎo)體研究機(jī)構(gòu)Semianalysis的最新報(bào)告，DeepSeek的全球用戶使用率從2025年1月的50%急劇下降至7月的3%，官網(wǎng)訪問量在2月至5月期間也下滑了63%。

發(fā)展歷程編輯本段

早期發(fā)展階段

于2023年4月，幻方量化正式發(fā)布公告，宣告其全面進(jìn)軍人工智能技術(shù)領(lǐng)域，并宣布成立獨(dú)立的科研實(shí)體——深度求索公司。同年7月17日，DeepSeek在杭州市拱墅區(qū)市場監(jiān)督管理局順利完成注冊(cè)登記。8月2日，公司注冊(cè)資本調(diào)整至1000萬元，并完成章程備案手續(xù)，同時(shí)投資人變更為寧波程恩企業(yè)管理咨詢合伙企業(yè)（有限合伙），企業(yè)類型變更為其他有限責(zé)任公司。2023年10月，DeepSeek成功完成由幻方量化主導(dǎo)的Pre-A輪融資，所獲資金主要用于大型語言模型的研發(fā)及團(tuán)隊(duì)規(guī)模的擴(kuò)張。

進(jìn)入2024年，DeepSeek于1月5日正式推出首個(gè)大型語言模型DeepSeek LLM，該模型擁有670億參數(shù)，基于一個(gè)包含2萬億token的中英文數(shù)據(jù)集進(jìn)行訓(xùn)練。同年5月，DeepSeek宣布開源第二代基于混合專家（Mixture of Experts, MoE）架構(gòu)的大型語言模型DeepSeek-V2。該模型在性能上與GPT-4Turbo相當(dāng)，但成本僅為GPT-4的百分之一，因此被業(yè)界譽(yù)為“AI界的拼多多”。

2024年9月5日，DeepSeek官方更新了API支持文檔，并宣布將DeepSeek Coder V2與DeepSeek V2 Chat兩個(gè)模型合并，升級(jí)為全新的DeepSeek V2.5模型。API用戶可通過deepseek-coder或deepseek-chat接口訪問新模型，該模型在寫作任務(wù)及指令遵循等方面進(jìn)行了顯著優(yōu)化。11月20日，DeepSeek宣布推理模型DeepSeek-R1-Lite預(yù)覽版正式上線。同年12月26日，DeepSeek宣布DeepSeek-V3首個(gè)版本正式上線，并同步開放源代碼。

模型熱度飆升

2025年1月11日，DeepSeek官方App正式面世，并同步登陸iOS與安卓應(yīng)用市場。緊接著，1月20日，DeepSeek隆重推出DeepSeek-R1模型，該模型在數(shù)學(xué)運(yùn)算、代碼生成及自然語言推理等任務(wù)上的表現(xiàn)，已媲美OpenAI o1正式版。1月24日，據(jù)國外大模型排名Arena顯示，DeepSeek-R1在基準(zhǔn)測試中躍升至全類別大模型第三位，尤其在風(fēng)格控制類模型（StyleCtrl）分類中，與OpenAI o1并列榜首，其競技場得分高達(dá)1357分，略勝一籌于OpenAI o1的1352分。

至1月27日，DeepSeek應(yīng)用在蘋果應(yīng)用商店免費(fèi)APP下載排行榜上，成功登頂15個(gè)國家和地區(qū)。同時(shí)，在美國區(qū)域，DeepSeek從1月26日的第六位躍居至首位，超越了ChatGPT、Meta旗下的社交媒體Threads，以及Google Gemini、Microsoft Copilot等美國科技巨頭的生成式AI產(chǎn)品，實(shí)現(xiàn)了中國應(yīng)用在中國及美國蘋果App Store同時(shí)占據(jù)榜首的歷史性突破。

1月31日，DeepSeek R1 671b版本作為英偉達(dá)NIM微服務(wù)預(yù)覽版，在build.nvidia.com平臺(tái)發(fā)布。該微服務(wù)在單個(gè)英偉達(dá)HGX H200系統(tǒng)上，每秒最高可處理3872個(gè)token。開發(fā)人員得以對(duì)API進(jìn)行測試與實(shí)驗(yàn)，預(yù)計(jì)該API將很快作為英偉達(dá)AI Enterprise軟件平臺(tái)的一部分，以可下載的NIM微服務(wù)形式正式推出。

進(jìn)入2月，DeepSeek-R1、V3、Coder等系列模型，陸續(xù)上線國家超算互聯(lián)網(wǎng)平臺(tái)。截至2月2日，DeepSeek應(yīng)用迅速占據(jù)140個(gè)國家蘋果App Store下載排行榜首位，并在美國Android Play Store同樣奪得榜首。然而，2月6日，因服務(wù)器資源緊張，DeepSeek暫停了API服務(wù)充值，直至同月25日方重新開放。

4月4日，DeepSeek攜手清華大學(xué)研究團(tuán)隊(duì)，聯(lián)合發(fā)布了題為《獎(jiǎng)勵(lì)模型的推理時(shí)Scaling方法及其在大規(guī)模語言模型中的應(yīng)用》的學(xué)術(shù)論文，提出了自我原則點(diǎn)評(píng)調(diào)優(yōu)（SPCT）與元獎(jiǎng)勵(lì)模型（Meta Reward Model）兩項(xiàng)核心技術(shù)，為提升大語言模型（LLM）推理能力提供了創(chuàng)新性的方法論。該論文已在arXiv平臺(tái)公開（https://arxiv.org/abs/2504.02495 ），相關(guān)代碼與部分模型權(quán)重正逐步開源。

開源代碼庫

2025年2月21日，DeepSeek正式對(duì)外宣布，將分階段公開其五個(gè)核心代碼庫。緊接著，在2月24日，該公司啟動(dòng)了備受矚目的“開源周”活動(dòng)，并率先推出了針對(duì)Hopper GPU特別優(yōu)化的FlashMLA代碼庫。該解碼內(nèi)核以高效MLA架構(gòu)為核心，專為處理復(fù)雜多變長度的序列數(shù)據(jù)而設(shè)計(jì)。

DeepSeek

2月26日，Deepseek繼續(xù)其開源步伐，正式公布了DeepGEMM代碼庫。隨后，在2月27日上午10點(diǎn)05分，DeepSeek發(fā)布了“開源周”第四日的重大進(jìn)展：一系列優(yōu)化的并行策略，涵蓋DualPipe這一創(chuàng)新的雙向管道并行算法，該算法旨在V3/R1訓(xùn)練中實(shí)現(xiàn)計(jì)算與通信的高效重疊。同時(shí)，還推出了EPLB，一種專為V3/R1設(shè)計(jì)的專家并行負(fù)載均衡解決方案。此外，DeepSeek還慷慨地分享了其訓(xùn)練和推理框架的性能分析數(shù)據(jù)，旨在為開源社區(qū)提供深入了解通信與計(jì)算重疊策略及其底層實(shí)現(xiàn)細(xì)節(jié)的寶貴資源。

2月28日，作為“開源周”的壓軸之日，DeepSeek宣布開源其全數(shù)據(jù)訪問加速引擎——3FS（Fire-Flyer文件系統(tǒng)）。3FS作為一款高性能的并行文件系統(tǒng)，全面支持V3/R1版本中的訓(xùn)練數(shù)據(jù)預(yù)處理、數(shù)據(jù)集高效加載、檢查點(diǎn)的保存與重載，以及推理階段的向量嵌入搜索和KVCache快速查找功能。

進(jìn)入4月30日，DeepSeek在AI開源社區(qū)的標(biāo)桿平臺(tái)Hugging Face上，發(fā)布了一款名為DeepSeek-Prover-V2-671B的先進(jìn)模型。該模型采用了更為高效的safetensors文件格式，并支持多元化的計(jì)算精度，從而極大提升了模型訓(xùn)練與部署的速度和資源利用率。其參數(shù)規(guī)模高達(dá)6710億，或可視為2024年發(fā)布的Prover-V1.5數(shù)學(xué)模型的重大升級(jí)版。同日，Deepseek還推出了DeepSeek-Prover-V2-7B（增強(qiáng)版）模型，以及配套的DeepSeek-ProverBench數(shù)據(jù)集。DeepSeek-Prover-V2-671B在MiniF2F-test數(shù)據(jù)集上展現(xiàn)了卓越的性能，通過率高達(dá)88.9%，專注于形式化定理證明領(lǐng)域。結(jié)合DeepSeek-Prover-V2-7B模型在子目標(biāo)搜索方面的優(yōu)化，以及ProverBench基準(zhǔn)數(shù)據(jù)集的發(fā)布，DeepSeek正有力推動(dòng)數(shù)學(xué)AI領(lǐng)域的蓬勃發(fā)展。

業(yè)務(wù)拓展編輯本段

2025年3月，杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司正式提交了多枚DeepSeek Chat商標(biāo)的注冊(cè)申請(qǐng)，其國際分類涵蓋了教育娛樂、廣告銷售等多個(gè)領(lǐng)域。截至3月17日，相關(guān)商標(biāo)的注冊(cè)申請(qǐng)狀態(tài)仍處于審核階段。同年4月1日，該公司，作為DeepSeek的關(guān)聯(lián)企業(yè)，所申請(qǐng)的“一種廣度數(shù)據(jù)采集的方法及其系統(tǒng)”專利獲得公布。

業(yè)務(wù)數(shù)據(jù)

據(jù)某權(quán)威AI產(chǎn)品榜單統(tǒng)計(jì)，DeepSeek應(yīng)用在上線后的短短20天內(nèi)，日活躍用戶數(shù)（DAU）迅速攀升至2215萬。2025年2月8日，根據(jù)QuestMobile的數(shù)據(jù)，DeepSeek在1月28日的日活躍用戶數(shù)首次超越豆包，并在2月1日成功突破3000萬大關(guān)，創(chuàng)造了應(yīng)用史上達(dá)成此里程碑的最快記錄。截至2月9日，DeepSeek App的累計(jì)下載量已超過1.1億次，周活躍用戶規(guī)模最高接近9700萬。其中，1月20日至1月26日期間，該應(yīng)用的周下載量達(dá)到226萬次，而次周的下載量更是飆升至6300萬次，環(huán)比增長超過2700%。3月31日，IndiaTimes報(bào)道指出，DeepSeek在2月期間錄得了5.247億次新的網(wǎng)站訪問量，超越了ChatGPT，盡管在整體規(guī)模上仍位列第三。然而，7月時(shí)，根據(jù)國際半導(dǎo)體研究機(jī)構(gòu)Semianalysis的最新報(bào)告，DeepSeek的全球用戶使用率已從2025年1月的50%顯著下降至7月的3%，官網(wǎng)訪問量在2月至5月期間也下滑了63%。另一家AI模型集成平臺(tái)Poe的統(tǒng)計(jì)數(shù)據(jù)顯示，其核心模型R1的使用率在2月至4月間減半，從7%跌至3%。進(jìn)入2025年二季度，DeepSeek的月均下載量從第一季度的8111.3萬大幅下降至2258.9萬，降幅高達(dá)72.2%。

定價(jià)收益模式

DeepSeek API的定價(jià)策略為：每百萬輸入Tokens收費(fèi)1元，每百萬輸出Tokens收費(fèi)2元。該優(yōu)惠期截至北京時(shí)間2025年2月8日24:00。優(yōu)惠結(jié)束后，價(jià)格調(diào)整為每百萬輸入Tokens 2元，每百萬輸出Tokens 8元。而deepseek-reasoner模型自上線起即采用每百萬輸入Tokens 4元，每百萬輸出Tokens 16元的計(jì)費(fèi)標(biāo)準(zhǔn)。2月26日，DeepSeek API開放平臺(tái)宣布實(shí)施錯(cuò)峰優(yōu)惠定價(jià)策略，每日優(yōu)惠時(shí)段為北京時(shí)間00:30至08:30，其余時(shí)間則按標(biāo)準(zhǔn)價(jià)格計(jì)費(fèi)。在優(yōu)惠時(shí)段內(nèi)，API調(diào)用價(jià)格大幅下調(diào)：DeepSeek-V3降至原價(jià)的50%，DeepSeek-R1更是降至25%。

合作機(jī)構(gòu)概覽

2025年3月，上海消防與DeepSeek攜手，針對(duì)三類特定場景展開了深入應(yīng)用。在日常辦公類政務(wù)應(yīng)用場景中，DeepSeek憑借其快速文本分析能力，精準(zhǔn)識(shí)別警情關(guān)鍵信息，為科學(xué)高效的決策提供了有力支撐。在數(shù)據(jù)治理專項(xiàng)工作應(yīng)用場景中，DeepSeek的深度學(xué)習(xí)和數(shù)據(jù)分析算法在數(shù)據(jù)分類標(biāo)注、清洗去重、關(guān)聯(lián)整合等三大主攻方向上發(fā)揮了強(qiáng)大作用，有效融合了分散在不同系統(tǒng)和部門的數(shù)據(jù)，為消防業(yè)務(wù)提供了全面且準(zhǔn)確的數(shù)據(jù)支持。在網(wǎng)絡(luò)安全AI智能體應(yīng)用場景中，DeepSeek的數(shù)據(jù)分析和模式識(shí)別能力被應(yīng)用于訓(xùn)練“網(wǎng)絡(luò)安全智能體”，使其能夠及時(shí)識(shí)別異常行為和潛在的入侵威脅，有效防范網(wǎng)絡(luò)攻擊對(duì)消防業(yè)務(wù)造成的影響。

獲得榮譽(yù) 編輯本段

2025年5月11日，DeepSeek入選2025福布斯中國人工智能科技企業(yè)TOP50。

詞條內(nèi)容僅供參考，如果您需要解決具體問題
（尤其在法律、醫(yī)學(xué)等領(lǐng)域），建議您咨詢相關(guān)領(lǐng)域?qū)I(yè)人士。

如果您認(rèn)為本詞條還有待完善，請(qǐng) 編輯

上一篇紅果短劇下一篇小米汽車業(yè)務(wù)爆發(fā)式增長：二季度收入突破206億元

深夜福利网-深夜福利网站大全,国产一区二区三区久久精品,99re6热在线精品视频播放,日韩中文字幕视频免费,影院一区二区小说性鲍视频

DeepSeek

發(fā)展歷程編輯本段

早期發(fā)展階段

模型熱度飆升

開源代碼庫

業(yè)務(wù)拓展編輯本段

業(yè)務(wù)數(shù)據(jù)

定價(jià)收益模式

合作機(jī)構(gòu)概覽

獲得榮譽(yù) 編輯本段

附件列表

標(biāo)簽

同義詞

深夜福利网-深夜福利网站大全,国产一区二区三区久久精品,99re6热在线精品视频播放,日韩中文字幕视频免费,影院一区二区小说性鲍视频

DeepSeek

發(fā)展歷程 編輯本段

早期發(fā)展階段

模型熱度飆升

開源代碼庫

業(yè)務(wù)拓展 編輯本段

業(yè)務(wù)數(shù)據(jù)

定價(jià)收益模式

合作機(jī)構(gòu)概覽

獲得榮譽(yù) 編輯本段

附件列表

標(biāo)簽

同義詞

發(fā)展歷程編輯本段

業(yè)務(wù)拓展編輯本段