DeepSeek 由杭州深度求索人工智能基礎技術研究有限公司開發(fā),這家公司在量化對沖基金幻方量化的支持下于 2023 年 7 月 17 日在杭州市拱墅區(qū)登記成立。公司核心團隊匯聚了人工智能等領域的專業(yè)精英,他們在學術研究和產(chǎn)業(yè)實踐方面都有著深厚的積累,為 DeepSeek 的發(fā)展奠定了堅實基礎。
自成立以來,DeepSeek 發(fā)布了多款極具影響力的語言模型:
- DeepSeek Coder:2023 年 11 月 2 日發(fā)布,由一系列代碼語言模型構成,在 2 萬億 token 上完成訓練,其中代碼數(shù)據(jù)占比 87%,擁有從 1B - 33B 不同版本。它支持項目級的代碼補全與填充,在多種編程語言和基準測試中展現(xiàn)出開源代碼模型的先進性能,是開發(fā)者在代碼編寫過程中的得力助手。
- DeepSeek LLM:2024 年 1 月 5 日發(fā)布,包含 670 億參數(shù),在 2 萬億 token 數(shù)據(jù)集上訓練,涵蓋中英文。該模型在推理、編碼、數(shù)學以及中文理解等方面能力出色,在匈牙利國家高中考試中取得 65 分成績,尤其在中文表現(xiàn)上超越了 GPT - 3.5,展現(xiàn)出強大的語言處理能力。
- DeepSeek Math:2024 年 2 月 5 日發(fā)布,以 DeepSeek - Coder - v1.5 7B 為基礎,在 5000 億 token 數(shù)學相關數(shù)據(jù)上進行預訓練。在競賽級 MATH 基準測試中取得 51.7% 的成績,性能接近 Gemini - Ultra 和 GPT - 4,在數(shù)學領域表現(xiàn)卓越。
- DeepSeek - VL:2024 年 3 月 11 日發(fā)布,是開源視覺 - 語言模型,采用混合視覺編碼器,能夠處理高分辨率圖像,在廣泛的視覺 - 語言基準測試中性能先進或極具競爭力,為多模態(tài)應用提供了有力支持。
- DeepSeek - V2:2024 年 5 月 7 日發(fā)布,擁有 2360 億參數(shù),中文綜合能力在眾多開源模型中表現(xiàn)最強,英文綜合能力與 LLaMA3 - 70B 處于同一梯隊,且訓練效率高,在語言處理的綜合能力上優(yōu)勢明顯。
- DeepSeek - Coder - V2:2024 年 6 月 17 日發(fā)布,是開源混合專家代碼語言模型,從 DeepSeek - V2 中間檢查點開始,進一步在 6 萬億 token 上進行預訓練,編碼和數(shù)學推理能力得到增強,支持 338 種編程語言,上下文長度擴展到 128K,極大地拓展了代碼處理的范圍和能力。
- DeepSeek - V2.5:2024 年 9 月 5 日發(fā)布,由 DeepSeek Coder V2 和 DeepSeek V2 Chat 合并升級而來,在評測中與 GPT - 4 - Turbo 等閉源模型處于同一梯隊,英文綜合能力與 LLaMA3 - 70B 相當,在寫作任務、指令跟隨等多個方面都進行了優(yōu)化,提升了用戶體驗。
- DeepSeek - VL2:2024 年 12 月 13 日發(fā)布,是大型混合專家視覺 - 語言模型,在視覺問答、光學字符識別等多種任務中展現(xiàn)出卓越能力,擁有 DeepSeek - VL2 - Tiny、 - Small 和無后綴三個變體,滿足不同場景需求。
- DeepSeek - V3:2024 年 12 月 26 日發(fā)布,是 6710 億參數(shù)的混合專家模型,激活參數(shù) 370 億,在 14.8 萬億 token 上預訓練。多項評測成績超越 Qwen2.5 - 72B 和 Llama - 3.1 - 405B 等開源模型,在知識類任務上的能力顯著提升,展現(xiàn)出強大的知識儲備和處理能力。
- DeepSeek - R1:2025 年 1 月 20 日發(fā)布,在數(shù)學、代碼、自然語言推理等任務上性能與 OpenAI o1 正式版相當,通過大規(guī)模強化學習和冷啟動技術,專注于推理和多模態(tài)任務,為用戶帶來全新的智能體驗。
- Janus - Pro:2025 年 1 月發(fā)布,作為多模態(tài)大模型進軍文生圖領域,為圖像生成帶來新的技術突破。
在眾多產(chǎn)品中,我們重點聚焦于 DeepSeek - R1,深入探索其獨特之處。
DeepSeek - R1 的發(fā)布歷經(jīng)關鍵節(jié)點。2024 年 11 月 20 日,DeepSeek - R1 - Lite 預覽版上線網(wǎng)頁端,提前向用戶展示了部分功能。2025 年 1 月 20 日,DeepSeek 正式發(fā)布 DeepSeek - R1 模型,并同步開源模型權重,為全球開發(fā)者和研究人員提供了深入研究和應用的機會。
DeepSeek - R1 采用深度 Transformer 架構,以 DeepSeek - V3 - Base 模型為基礎,通過使用 V3 的數(shù)十億參數(shù)的密集 Transformer Base 子模型進行初始化,確保了模型具備強大的基礎能力。同時,利用自研的 “群組相對策略優(yōu)化”(GRPO)算法進行強化學習訓練,這種創(chuàng)新的算法為模型的優(yōu)化和性能提升提供了關鍵支持。
其訓練流程采用多階段逐步增強策略:
- 冷啟動監(jiān)督微調(diào):為模型奠定初始的知識和能力基礎,使其能夠初步理解和處理任務。
- 第一階段強化學習:通過強化學習進一步優(yōu)化模型,提升其在特定任務上的表現(xiàn)。
- 拒絕采樣與二次監(jiān)督微調(diào):對模型的輸出進行篩選和優(yōu)化,再次通過監(jiān)督微調(diào)提升模型性能。
- 第二階段強化學習:經(jīng)過多輪優(yōu)化后,使模型在各種任務中達到更優(yōu)的性能表現(xiàn)。
DeepSeek - R1 通過強化學習訓練,在推理過程中包含大量反思和驗證環(huán)節(jié),思維鏈長度可達數(shù)萬字。這使得它在數(shù)學、代碼以及各種復雜邏輯推理任務上,取得了媲美 OpenAI o1 - preview 的推理效果,并且能為用戶展示 o1 沒有公開的完整思考過程,幫助用戶更好地理解和應用推理結果。
DeepSeek - R1 直接面向用戶和開發(fā)者,提供了豐富的應用場景。在智能對話方面,它能夠與用戶進行自然流暢的交流,解答各種問題;文本生成功能可用于創(chuàng)作文章、故事、報告等多種文本類型;語義理解能力使其能夠準確把握用戶輸入的含義,為后續(xù)處理提供準確依據(jù);計算推理可解決各類數(shù)學和邏輯問題;代碼生成補全則為開發(fā)者在編寫代碼時提供高效支持。
它支持聯(lián)網(wǎng)搜索與深度思考模式,能夠快速獲取互聯(lián)網(wǎng)上的信息并進行深入分析。同時支持文件上傳,可掃描讀取各類文件及圖片中的文字內(nèi)容,實現(xiàn)對多源數(shù)據(jù)的處理和分析。
- 生活場景:
- 生活助手:無論是制定旅行攻略,還是翻譯菜單、學習地方麻將規(guī)則,DeepSeek - R1 都能提供詳細準確的幫助。
- 人生決策輔助:通過分析用戶提供的信息,如個人經(jīng)歷、興趣愛好等,為用戶在事業(yè)選擇、學業(yè)規(guī)劃等方面提供有價值的建議和決策參考。不過,需要注意的是,根據(jù)生辰八字分析運勢這類內(nèi)容目前更多是基于娛樂層面,缺乏科學依據(jù)。
- 創(chuàng)意創(chuàng)作:網(wǎng)文作者可以借助它實現(xiàn)快速寫作,激發(fā)創(chuàng)作靈感,豐富故事情節(jié)。網(wǎng)友開發(fā)的 “AI 對聯(lián)生成” 等玩法,也為生活增添了不少樂趣。
- 工作場景:
- 科創(chuàng)情報分析:智慧芽接入 DeepSeek - R1 后,能夠幫助用戶更精準快速地獲取專利、論文等多維度科創(chuàng)信息,深入分析技術演進邏輯和競爭格局,從而優(yōu)化知識產(chǎn)權布局,助力科技創(chuàng)新發(fā)展。
- 醫(yī)療輔助:智云健康將 DeepSeek - R1 接入其醫(yī)療 AI 系統(tǒng) “智云大腦”,可以提升醫(yī)院和藥店 SaaS 的慢病管理效率,為醫(yī)療健康領域提供智能化支持。
- 證券金融:雖然不能完全準確預測股市走勢,但可以分析金融數(shù)據(jù),為投資者提供一定的參考,幫助投資者做出更合理的決策。
- 學習場景:
- 數(shù)學問題求解:能夠解決高中及以上難度的數(shù)學問題,并展示詳細的解題步驟,幫助學生理解數(shù)學原理,提升學習效果。
- 編程輔助:在編程過程中,可根據(jù)需求編寫 Python 腳本,進行代碼生成、代碼糾錯等任務,提高編程效率。
- 語言學習:支持語言翻譯、語法講解、語言表達潤色等功能,輔助用戶學習各種語言,提升語言能力。
- 通用場景:
- 信息檢索與整合:具備類似 ChatGPT 的網(wǎng)絡搜索功能,能夠快速檢索和整合互聯(lián)網(wǎng)上的信息,為用戶提供全面準確的答案,滿足用戶對各類知識的需求。
- 文本處理與分析:可以對輸入的文本進行理解、分析、總結、生成等操作,例如對 PDF 文件內(nèi)容進行提取和分析,幫助用戶快速獲取關鍵信息,提高工作和學習效率。
DeepSeek - R1 憑借其強大的性能和豐富的功能,在多個領域展現(xiàn)出巨大的應用潛力,為人們的生活、工作和學習帶來了更多便利和創(chuàng)新可能。