深夜福利网-深夜福利网站大全,国产一区二区三区久久精品,99re6热在线精品视频播放,日韩中文字幕视频免费,影院一区二区小说性鲍视频

知名百科  > 所屬分類  >  商業(yè)百科   

DeepSeek

DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,中文簡稱為深度求索,是一家專注于先進(jìn)大語言模型(LLM)及相關(guān)技術(shù)研發(fā)的試驗(yàn)與發(fā)展型企業(yè)。該公司由量化資管領(lǐng)域的知名巨頭幻方量化于2023年7月17日創(chuàng)立,注冊(cè)地位于浙江省杭州市拱墅區(qū)環(huán)城北路169號(hào)匯金國際大廈西1幢1201室,法定代表人為裴湉。

2024年1月5日,DeepSeek正式推出了其首個(gè)大型模型——DeepSeek LLM。同年5月,該公司宣布開源第二代MoE大模型DeepSeek-V2,憑借其卓越的性能與親民的價(jià)格,DeepSeek贏得了“AI界拼多多”的綽號(hào)。12月26日,DeepSeek宣布DeepSeek-V3模型的首個(gè)版本正式上線并同步開源。

進(jìn)入2025年,DeepSeek于1月20日正式發(fā)布了DeepSeek-R1模型,該模型在性能上與OpenAI的GPT-1正式版不相上下。1月31日,DeepSeek R1 671b作為英偉達(dá)NIM微服務(wù)的預(yù)覽版在build.nvidia.com平臺(tái)上發(fā)布。2月,DeepSeek-R1、V3、Coder等系列模型相繼上線國家超算互聯(lián)網(wǎng)平臺(tái)。同時(shí),DeepSeek的日活躍用戶數(shù)于2月1日突破3000萬大關(guān),創(chuàng)下了達(dá)成這一里程碑的最快記錄。

截至2025年2月2日,DeepSeek已攀升至140個(gè)國家蘋果App Store下載排行榜的首位,并在美國的Android Play Store中也位居榜首。截至2月9日,DeepSeek App的累計(jì)下載量已超過1.1億次,周活躍用戶規(guī)模最高接近9700萬。2月21日,DeepSeek宣布將陸續(xù)開源5個(gè)代碼庫。2月26日,該公司開源了DeepGEMM。次日,DeepSeek發(fā)布了其“開源周”第四日的內(nèi)容,即優(yōu)化的并行策略。據(jù)IndiaTimes于3月31日?qǐng)?bào)道,DeepSeek在2月錄得了5.247億次新的網(wǎng)站訪問量,超越了ChatGPT,在整體規(guī)模上仍位列第三。4月30日,DeepSeek在AI開源社區(qū)Hugging Face上發(fā)布了一個(gè)名為DeepSeek-Prover-V2-671B的模型。然而,7月根據(jù)國際半導(dǎo)體研究機(jī)構(gòu)Semianalysis的最新報(bào)告,DeepSeek的全球用戶使用率從2025年1月的50%急劇下降至7月的3%,官網(wǎng)訪問量在2月至5月期間也下滑了63%。

目錄

發(fā)展歷程 編輯本段

早期發(fā)展階段

于2023年4月,幻方量化正式發(fā)布公告,宣告其全面進(jìn)軍人工智能技術(shù)領(lǐng)域,并宣布成立獨(dú)立的科研實(shí)體——深度求索公司。同年7月17日,DeepSeek在杭州市拱墅區(qū)市場(chǎng)監(jiān)督管理局順利完成注冊(cè)登記。8月2日,公司注冊(cè)資本調(diào)整至1000萬元,并完成章程備案手續(xù),同時(shí)投資人變更為寧波程恩企業(yè)管理咨詢合伙企業(yè)(有限合伙),企業(yè)類型變更為其他有限責(zé)任公司。2023年10月,DeepSeek成功完成由幻方量化主導(dǎo)的Pre-A輪融資,所獲資金主要用于大型語言模型的研發(fā)及團(tuán)隊(duì)規(guī)模的擴(kuò)張。

進(jìn)入2024年,DeepSeek于1月5日正式推出首個(gè)大型語言模型DeepSeek LLM,該模型擁有670億參數(shù),基于一個(gè)包含2萬億token的中英文數(shù)據(jù)集進(jìn)行訓(xùn)練。同年5月,DeepSeek宣布開源第二代基于混合專家(Mixture of Experts, MoE)架構(gòu)的大型語言模型DeepSeek-V2。該模型在性能上與GPT-4Turbo相當(dāng),但成本僅為GPT-4的百分之一,因此被業(yè)界譽(yù)為“AI界的拼多多”。

2024年9月5日,DeepSeek官方更新了API支持文檔,并宣布將DeepSeek Coder V2與DeepSeek V2 Chat兩個(gè)模型合并,升級(jí)為全新的DeepSeek V2.5模型。API用戶可通過deepseek-coder或deepseek-chat接口訪問新模型,該模型在寫作任務(wù)及指令遵循等方面進(jìn)行了顯著優(yōu)化。11月20日,DeepSeek宣布推理模型DeepSeek-R1-Lite預(yù)覽版正式上線。同年12月26日,DeepSeek宣布DeepSeek-V3首個(gè)版本正式上線,并同步開放源代碼。

模型熱度飆升

2025年1月11日,DeepSeek官方App正式面世,并同步登陸iOS與安卓應(yīng)用市場(chǎng)。緊接著,1月20日,DeepSeek隆重推出DeepSeek-R1模型,該模型在數(shù)學(xué)運(yùn)算、代碼生成及自然語言推理等任務(wù)上的表現(xiàn),已媲美OpenAI o1正式版。1月24日,據(jù)國外大模型排名Arena顯示,DeepSeek-R1在基準(zhǔn)測(cè)試中躍升至全類別大模型第三位,尤其在風(fēng)格控制類模型(StyleCtrl)分類中,與OpenAI o1并列榜首,其競(jìng)技場(chǎng)得分高達(dá)1357分,略勝一籌于OpenAI o1的1352分。

至1月27日,DeepSeek應(yīng)用在蘋果應(yīng)用商店免費(fèi)APP下載排行榜上,成功登頂15個(gè)國家和地區(qū)。同時(shí),在美國區(qū)域,DeepSeek從1月26日的第六位躍居至首位,超越了ChatGPT、Meta旗下的社交媒體Threads,以及Google Gemini、Microsoft Copilot等美國科技巨頭的生成式AI產(chǎn)品,實(shí)現(xiàn)了中國應(yīng)用在中國及美國蘋果App Store同時(shí)占據(jù)榜首的歷史性突破。

1月31日,DeepSeek R1 671b版本作為英偉達(dá)NIM微服務(wù)預(yù)覽版,在build.nvidia.com平臺(tái)發(fā)布。該微服務(wù)在單個(gè)英偉達(dá)HGX H200系統(tǒng)上,每秒最高可處理3872個(gè)token。開發(fā)人員得以對(duì)API進(jìn)行測(cè)試與實(shí)驗(yàn),預(yù)計(jì)該API將很快作為英偉達(dá)AI Enterprise軟件平臺(tái)的一部分,以可下載的NIM微服務(wù)形式正式推出。

進(jìn)入2月,DeepSeek-R1、V3、Coder等系列模型,陸續(xù)上線國家超算互聯(lián)網(wǎng)平臺(tái)。截至2月2日,DeepSeek應(yīng)用迅速占據(jù)140個(gè)國家蘋果App Store下載排行榜首位,并在美國Android Play Store同樣奪得榜首。然而,2月6日,因服務(wù)器資源緊張,DeepSeek暫停了API服務(wù)充值,直至同月25日方重新開放。

4月4日,DeepSeek攜手清華大學(xué)研究團(tuán)隊(duì),聯(lián)合發(fā)布了題為《獎(jiǎng)勵(lì)模型的推理時(shí)Scaling方法及其在大規(guī)模語言模型中的應(yīng)用》的學(xué)術(shù)論文,提出了自我原則點(diǎn)評(píng)調(diào)優(yōu)(SPCT)與元獎(jiǎng)勵(lì)模型(Meta Reward Model)兩項(xiàng)核心技術(shù),為提升大語言模型(LLM)推理能力提供了創(chuàng)新性的方法論。該論文已在arXiv平臺(tái)公開(https://arxiv.org/abs/2504.02495 ),相關(guān)代碼與部分模型權(quán)重正逐步開源。

開源代碼庫

2025年2月21日,DeepSeek正式對(duì)外宣布,將分階段公開其五個(gè)核心代碼庫。緊接著,在2月24日,該公司啟動(dòng)了備受矚目的“開源周”活動(dòng),并率先推出了針對(duì)Hopper GPU特別優(yōu)化的FlashMLA代碼庫。該解碼內(nèi)核以高效MLA架構(gòu)為核心,專為處理復(fù)雜多變長度的序列數(shù)據(jù)而設(shè)計(jì)。

DeepSeekDeepSeek

2月26日,Deepseek繼續(xù)其開源步伐,正式公布了DeepGEMM代碼庫。隨后,在2月27日上午10點(diǎn)05分,DeepSeek發(fā)布了“開源周”第四日的重大進(jìn)展:一系列優(yōu)化的并行策略,涵蓋DualPipe這一創(chuàng)新的雙向管道并行算法,該算法旨在V3/R1訓(xùn)練中實(shí)現(xiàn)計(jì)算與通信的高效重疊。同時(shí),還推出了EPLB,一種專為V3/R1設(shè)計(jì)的專家并行負(fù)載均衡解決方案。此外,DeepSeek還慷慨地分享了其訓(xùn)練和推理框架的性能分析數(shù)據(jù),旨在為開源社區(qū)提供深入了解通信與計(jì)算重疊策略及其底層實(shí)現(xiàn)細(xì)節(jié)的寶貴資源。

2月28日,作為“開源周”的壓軸之日,DeepSeek宣布開源其全數(shù)據(jù)訪問加速引擎——3FS(Fire-Flyer文件系統(tǒng))。3FS作為一款高性能的并行文件系統(tǒng),全面支持V3/R1版本中的訓(xùn)練數(shù)據(jù)預(yù)處理、數(shù)據(jù)集高效加載、檢查點(diǎn)的保存與重載,以及推理階段的向量嵌入搜索和KVCache快速查找功能。

進(jìn)入4月30日,DeepSeek在AI開源社區(qū)的標(biāo)桿平臺(tái)Hugging Face上,發(fā)布了一款名為DeepSeek-Prover-V2-671B的先進(jìn)模型。該模型采用了更為高效的safetensors文件格式,并支持多元化的計(jì)算精度,從而極大提升了模型訓(xùn)練與部署的速度和資源利用率。其參數(shù)規(guī)模高達(dá)6710億,或可視為2024年發(fā)布的Prover-V1.5數(shù)學(xué)模型的重大升級(jí)版。同日,Deepseek還推出了DeepSeek-Prover-V2-7B(增強(qiáng)版)模型,以及配套的DeepSeek-ProverBench數(shù)據(jù)集。DeepSeek-Prover-V2-671B在MiniF2F-test數(shù)據(jù)集上展現(xiàn)了卓越的性能,通過率高達(dá)88.9%,專注于形式化定理證明領(lǐng)域。結(jié)合DeepSeek-Prover-V2-7B模型在子目標(biāo)搜索方面的優(yōu)化,以及ProverBench基準(zhǔn)數(shù)據(jù)集的發(fā)布,DeepSeek正有力推動(dòng)數(shù)學(xué)AI領(lǐng)域的蓬勃發(fā)展。

業(yè)務(wù)拓展 編輯本段

2025年3月,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司正式提交了多枚DeepSeek Chat商標(biāo)的注冊(cè)申請(qǐng),其國際分類涵蓋了教育娛樂、廣告銷售等多個(gè)領(lǐng)域。截至3月17日,相關(guān)商標(biāo)的注冊(cè)申請(qǐng)狀態(tài)仍處于審核階段。同年4月1日,該公司,作為DeepSeek的關(guān)聯(lián)企業(yè),所申請(qǐng)的“一種廣度數(shù)據(jù)采集的方法及其系統(tǒng)”專利獲得公布。

業(yè)務(wù)數(shù)據(jù)

據(jù)某權(quán)威AI產(chǎn)品榜單統(tǒng)計(jì),DeepSeek應(yīng)用在上線后的短短20天內(nèi),日活躍用戶數(shù)(DAU)迅速攀升至2215萬。2025年2月8日,根據(jù)QuestMobile的數(shù)據(jù),DeepSeek在1月28日的日活躍用戶數(shù)首次超越豆包,并在2月1日成功突破3000萬大關(guān),創(chuàng)造了應(yīng)用史上達(dá)成此里程碑的最快記錄。截至2月9日,DeepSeek App的累計(jì)下載量已超過1.1億次,周活躍用戶規(guī)模最高接近9700萬。其中,1月20日至1月26日期間,該應(yīng)用的周下載量達(dá)到226萬次,而次周的下載量更是飆升至6300萬次,環(huán)比增長超過2700%。3月31日,IndiaTimes報(bào)道指出,DeepSeek在2月期間錄得了5.247億次新的網(wǎng)站訪問量,超越了ChatGPT,盡管在整體規(guī)模上仍位列第三。然而,7月時(shí),根據(jù)國際半導(dǎo)體研究機(jī)構(gòu)Semianalysis的最新報(bào)告,DeepSeek的全球用戶使用率已從2025年1月的50%顯著下降至7月的3%,官網(wǎng)訪問量在2月至5月期間也下滑了63%。另一家AI模型集成平臺(tái)Poe的統(tǒng)計(jì)數(shù)據(jù)顯示,其核心模型R1的使用率在2月至4月間減半,從7%跌至3%。進(jìn)入2025年二季度,DeepSeek的月均下載量從第一季度的8111.3萬大幅下降至2258.9萬,降幅高達(dá)72.2%。

定價(jià)收益模式

DeepSeek API的定價(jià)策略為:每百萬輸入Tokens收費(fèi)1元,每百萬輸出Tokens收費(fèi)2元。該優(yōu)惠期截至北京時(shí)間2025年2月8日24:00。優(yōu)惠結(jié)束后,價(jià)格調(diào)整為每百萬輸入Tokens 2元,每百萬輸出Tokens 8元。而deepseek-reasoner模型自上線起即采用每百萬輸入Tokens 4元,每百萬輸出Tokens 16元的計(jì)費(fèi)標(biāo)準(zhǔn)。2月26日,DeepSeek API開放平臺(tái)宣布實(shí)施錯(cuò)峰優(yōu)惠定價(jià)策略,每日優(yōu)惠時(shí)段為北京時(shí)間00:30至08:30,其余時(shí)間則按標(biāo)準(zhǔn)價(jià)格計(jì)費(fèi)。在優(yōu)惠時(shí)段內(nèi),API調(diào)用價(jià)格大幅下調(diào):DeepSeek-V3降至原價(jià)的50%,DeepSeek-R1更是降至25%。

合作機(jī)構(gòu)概覽

2025年3月,上海消防與DeepSeek攜手,針對(duì)三類特定場(chǎng)景展開了深入應(yīng)用。在日常辦公類政務(wù)應(yīng)用場(chǎng)景中,DeepSeek憑借其快速文本分析能力,精準(zhǔn)識(shí)別警情關(guān)鍵信息,為科學(xué)高效的決策提供了有力支撐。在數(shù)據(jù)治理專項(xiàng)工作應(yīng)用場(chǎng)景中,DeepSeek的深度學(xué)習(xí)和數(shù)據(jù)分析算法在數(shù)據(jù)分類標(biāo)注、清洗去重、關(guān)聯(lián)整合等三大主攻方向上發(fā)揮了強(qiáng)大作用,有效融合了分散在不同系統(tǒng)和部門的數(shù)據(jù),為消防業(yè)務(wù)提供了全面且準(zhǔn)確的數(shù)據(jù)支持。在網(wǎng)絡(luò)安全AI智能體應(yīng)用場(chǎng)景中,DeepSeek的數(shù)據(jù)分析和模式識(shí)別能力被應(yīng)用于訓(xùn)練“網(wǎng)絡(luò)安全智能體”,使其能夠及時(shí)識(shí)別異常行為和潛在的入侵威脅,有效防范網(wǎng)絡(luò)攻擊對(duì)消防業(yè)務(wù)造成的影響。

獲得榮譽(yù) 編輯本段

2025年5月11日,DeepSeek入選2025福布斯中國人工智能科技企業(yè)TOP50。

附件列表


0

詞條內(nèi)容僅供參考,如果您需要解決具體問題
(尤其在法律、醫(yī)學(xué)等領(lǐng)域),建議您咨詢相關(guān)領(lǐng)域?qū)I(yè)人士。

如果您認(rèn)為本詞條還有待完善,請(qǐng) 編輯

上一篇 紅果短劇    下一篇 小米汽車業(yè)務(wù)爆發(fā)式增長:二季度收入突破206億元

標(biāo)簽

同義詞

暫無同義詞