1.點(diǎn)擊下面按鈕復(fù)制微信號(hào)
點(diǎn)擊復(fù)制微信號(hào)
珀菲特企業(yè)管理
Karen /鄭老師
KEY WORDS OF Corporate Training
聯(lián)系我們:
13382173255(Karen鄭老師)
課程背景| Course Background
隨著人工智能技術(shù)的快速發(fā)展,智能助手(如DeepSeek-V3)在多模態(tài)理解、個(gè)性化交互、知識(shí)推理等領(lǐng)域的應(yīng)用日益廣泛。DeepSeek-V3作為深度求索公司推出的第三代智能助手,憑借其先進(jìn)的核心技術(shù)(如大規(guī)模預(yù)訓(xùn)練、多模態(tài)理解、上下文感知等),在智能客服、內(nèi)容創(chuàng)作、教育、醫(yī)療等領(lǐng)域展現(xiàn)了強(qiáng)大的潛力。
然而,要將DeepSeek-V3的能力充分發(fā)揮并應(yīng)用于實(shí)際業(yè)務(wù)場景,不僅需要深入理解其核心技術(shù)原理,還需要掌握本地部署和微調(diào)的方法,以滿足特定領(lǐng)域或企業(yè)的定制化需求。為此,本課程旨在幫助學(xué)員系統(tǒng)學(xué)習(xí)DeepSeek-V3的核心技術(shù)原理,并通過實(shí)操掌握本地部署和微調(diào)的技能,從而提升在實(shí)際項(xiàng)目中的應(yīng)用能力。
課程收益| Program Benefits
1. 深刻理解DeepSeek-V3的核心技術(shù)原理
· 掌握DeepSeek-V3的架構(gòu)設(shè)計(jì)、多模態(tài)理解、上下文感知、知識(shí)圖譜等核心技術(shù)。
· 掌握大規(guī)模預(yù)訓(xùn)練模型(如Transformer)的工作原理及其在DeepSeek-V3中的應(yīng)用。
2. 掌握DeepSeek-V3的本地部署方法
· 學(xué)習(xí)如何搭建適合DeepSeek-V3運(yùn)行的本地環(huán)境(包括硬件配置、依賴庫安裝等)。
· 掌握DeepSeek-V3的本地部署流程,包括模型加載、服務(wù)啟動(dòng)和接口調(diào)用。
· 掌握如何優(yōu)化部署性能,以支持高并發(fā)和低延遲的應(yīng)用場景。
3. 學(xué)會(huì)DeepSeek-V3的微調(diào)與定制化
· 掌握如何利用領(lǐng)域數(shù)據(jù)對DeepSeek-V3進(jìn)行微調(diào),以提升其在特定任務(wù)中的表現(xiàn)。
· 學(xué)習(xí)微調(diào)過程中的關(guān)鍵技術(shù),包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、參數(shù)調(diào)優(yōu)等。
4. 提升實(shí)際項(xiàng)目中的應(yīng)用能力
· 通過實(shí)戰(zhàn)案例,學(xué)習(xí)如何將DeepSeek-V3應(yīng)用于智能客服、內(nèi)容生成、知識(shí)問答等場景。
課程大綱| Course Outline
上午課程
1.1 V3風(fēng)靡海內(nèi)外的關(guān)鍵因素:訓(xùn)練成本極低、引領(lǐng)前沿創(chuàng)新
1.1.1 V3訓(xùn)練成本:所用的GPU訓(xùn)練資源僅為Llama 3.1 405B的差不多1/14
1.1.2 在國內(nèi)也能引領(lǐng)世界級(jí)前沿
1.2 模型架構(gòu):MLA、負(fù)載均衡的MoE、Multi-Token預(yù)測
1.2.1 多頭潛在注意力
1.2.2. 無輔助損失的負(fù)載平衡 DeepSeekMoE
1.2.3 多token預(yù)測:Multi-Token Prediction顯著加快模型的解碼速度
第二部分 DeepSeek-V3基礎(chǔ)設(shè)施層面的創(chuàng)新:FP8 訓(xùn)練等
2.1 訓(xùn)練框架(含GPU的內(nèi)部結(jié)構(gòu)示意圖)
2.1.1 雙管道DualPipe與計(jì)算-通信重疊
2.1.2 跨節(jié)點(diǎn)全對全通信的高效實(shí)現(xiàn):通過PXT連接CUDA和底層GPU硬件
2.1.3. 極致內(nèi)存節(jié)省與最小開銷
2.2 FP8訓(xùn)練:雖算的快 但精度不夠,故需提高精度
2.2.1 混合精度框架
2.2.2. 通過量化和乘法提高精度
2.2.2 低精度存儲(chǔ)和通信:降低內(nèi)存和通信開銷
2.3 推理與部署
2.3.1 預(yù)填充
2.3.2 解碼
2.4 硬件設(shè)計(jì)建議
下午課程
第三部分 DeepSeek-V3的預(yù)訓(xùn)練與后訓(xùn)練
3.1 預(yù)訓(xùn)練
3.1.1 數(shù)據(jù)構(gòu)建:提高數(shù)學(xué)、編程、多語言樣本,最終14.8T語料
3.1.2 超參數(shù)
3.1.3 長上下文擴(kuò)展
3.1.4 評估與討論
3.2 訓(xùn)練后處理:透露了大半后來引爆全球的R1正式版訓(xùn)練流程
3.2.1 監(jiān)督微調(diào)
3.2.2 強(qiáng)化學(xué)習(xí):涉及獎(jiǎng)勵(lì)模型和GRPO
3.2.3 評估與討論:關(guān)于DeepSeek-R1提煉與多token預(yù)測
第四部分 DeepSeek R1:如何通過純RL訓(xùn)練大模型的推理能力
4.1 提出背景與相關(guān)工作
4.1.1 R1-Zero的提出背景:無需人類數(shù)據(jù),從零實(shí)現(xiàn)自我迭代
4.1.2 R1的提出背景:解決Zero可讀性差等問題
4.2 DeepSeek-R1-Zero:規(guī)則驅(qū)動(dòng)的大規(guī)模RL訓(xùn)練,無冷啟動(dòng)、無SFT
4.2.1 RL算法GRPO:不需要critic
4.2.2 規(guī)則獎(jiǎng)勵(lì)建模(準(zhǔn)確率獎(jiǎng)勵(lì) + 格式獎(jiǎng)勵(lì)):不用訓(xùn)練專門的獎(jiǎng)勵(lì)模型RM
4.2.3 訓(xùn)練模板:通過prompt讓Zero啟動(dòng)深度思考的推理模式
4.2.4 Zero的性能、自我進(jìn)化過程和頓悟時(shí)刻
4.3 DeepSeek-R1:先冷啟動(dòng)數(shù)據(jù)SFT 再RL,之后再SFT 再RL
4.3.1 階段一 冷啟動(dòng)(主要關(guān)注推理):通過R1-Zero生成數(shù)千條長CoT數(shù)據(jù)
4.3.2 階段二 面向推理的GRPO RL:類似Zero的規(guī)則獎(jiǎng)勵(lì),但增加語言一致性獎(jiǎng)勵(lì)
4.3.3 階段三 V3上的的兩輪SFT(結(jié)合rejection sampling):涉及80w通用層面的推理和非推理數(shù)據(jù)
4.3.4 階段四 所有場景的RL:提高有用性和無害性,且混合規(guī)則獎(jiǎng)勵(lì)和偏好獎(jiǎng)勵(lì)
4.4 蒸餾:賦予小模型推理能力
4.5 一些經(jīng)驗(yàn)總結(jié):成功和失敗的經(jīng)驗(yàn)分析總結(jié)
上午課程
第五部分 本地部署準(zhǔn)備工作:各個(gè)版本、推理框架、硬件資源
5.1 DeepSeek-R1的多個(gè)版本:加上2個(gè)原裝671B的,總計(jì)8個(gè)參數(shù)版本
5.2 主流的大模型推理框架:分為PC端和Android端
5.3 不同參數(shù)的模型所要求的硬件
5.4 蒸餾版和滿血版的兩類部署
第六部分 通過Ollama、vLLM本地部署DeepSeek-R1蒸餾版:支持聯(lián)網(wǎng)搜索及知識(shí)庫問答
6.1 基于Ollama和各類插件構(gòu)建智能對話:終端、open-webui(支持聯(lián)網(wǎng))、Chatbox
6.1.1 Ollama下的終端命令行交互
6.1.2 Ollama下的open-webui交互:基于docker安裝,且支持聯(lián)網(wǎng)搜索
6.1.3 基于Ollama + ChatBox部署deepseek-r1:7b
6.2 基于Ollama和Page Assist/AnythingLLM構(gòu)建本地知識(shí)庫問答系統(tǒng)
6.2.1 基于Ollama + Page Assist搭建本地知識(shí)庫問答系統(tǒng):且支持聯(lián)網(wǎng)搜索
6.2.2 基于Ollama + AnythingLLM搭建本地知識(shí)庫問答
6.3 通過vLLM推理deepseek-r1
6.3.1 基于vLLM的命令行交互——R1-Distill-Llama-8B
6.3.2 基于vllm + open WebUi 部署r1 7b
6.4 本地手機(jī)端部署DeepSeek-R1蒸餾Llama/Qwen后的版本
下午課程
第七部分 無蒸餾前提下本地部署R1 or R1-Zero 671B滿血版
7.1 折中路徑:無蒸餾但量化部署Deepseek-R1 671B滿血版
7.1.1 本地CPU上運(yùn)行 Deepseek-R1 的完整的硬件 + 軟件設(shè)置
7.1.2 GPU上跑無蒸餾但量化的Deepseek-R1 671B滿血版
7.2 企業(yè)級(jí)部署:無蒸餾不量化部署Deepseek-R1 671B滿血版
專利和文獻(xiàn):
深度學(xué)習(xí)國際發(fā)明專利
1) 基于深度學(xué)習(xí)的圖像檢索方法及裝置,專利公開公告號(hào):CN107368614A。專利類型:發(fā)明公布。發(fā)明人:周紅偉;李凱;任偉;李慶;郭奇杰;周楊;劉川郁
2) Simulation model and droplet ejection performance of a thermal-bubble microejector,Hongwei Zhou,A.M.Gué,Sensors and Actuators B: Chemical Volume 145,Issue 1,4 March 2010,Pages 311-319
3)Simulation Bubble Nucleation and Bubble Growth of a Thermal Bubble Microejector,Hongwei Zhou,A.M.Gué,Excerpt from the Proceedings of the COMSOL Conference 2009 Mila
講師背景| Introduction to lecturers
ChatGPT與大模型實(shí)戰(zhàn)專家—周紅偉老師
(阿里大模型算法專家,大數(shù)據(jù)和AI實(shí)戰(zhàn)專家)
【背景介紹】
? 現(xiàn)任云宇宙科技CEO
? 前馬上消費(fèi)金融風(fēng)控負(fù)責(zé)人
? 前阿里人工智能算法專家
? 前豬八戒大數(shù)據(jù)科學(xué)家
? 重慶市大數(shù)據(jù)科學(xué)家
? 富民銀行--大數(shù)據(jù)專家
? 人工智能科學(xué)家
? 法國科學(xué)院數(shù)據(jù)算法博士
? 發(fā)起《重慶市金融風(fēng)險(xiǎn)防范實(shí)驗(yàn)室》任風(fēng)控總監(jiān)
【實(shí)戰(zhàn)經(jīng)驗(yàn)】
周紅偉先生是重慶市大數(shù)據(jù)和人工智能專家,阿里大模型算法專家。周老師2009年畢業(yè)于法國科學(xué)院LAAS實(shí)驗(yàn)室,榮獲多項(xiàng)人工智能算法國際發(fā)明專利。近10年人工智能算法、大數(shù)據(jù)智能決策實(shí)戰(zhàn)經(jīng)驗(yàn),近兩年大模型部署和微調(diào)經(jīng)驗(yàn)。先后任職互聯(lián)網(wǎng)獨(dú)角獸大數(shù)據(jù)總監(jiān)、技術(shù)總監(jiān)。
畢業(yè)后專注于深度學(xué)習(xí),大數(shù)據(jù),云計(jì)算,大模型。現(xiàn)任職于云宇宙科技有限公司,搭建大模型微調(diào)平臺(tái),深度學(xué)習(xí)算法平臺(tái),基于大模型的智能決策平臺(tái)。應(yīng)用大模型賦能金融科技業(yè)務(wù),大模型應(yīng)用于客戶營銷、客戶業(yè)務(wù)咨詢和實(shí)時(shí)語音質(zhì)檢業(yè)務(wù)。
在港宇科技開發(fā)了基于深度學(xué)習(xí)的車輛視頻跟蹤,車牌識(shí)別,優(yōu)于海康威視的同類產(chǎn)品,為華為公司的OEM供貨商。曾任職豬八戒大數(shù)據(jù)科學(xué)家,伴隨著豬八戒網(wǎng)的閃電擴(kuò)張,從百億估值向千億估值的征程中,領(lǐng)導(dǎo)研發(fā)了國內(nèi)第一個(gè)基于大數(shù)據(jù),深度神經(jīng)網(wǎng)絡(luò)的商標(biāo)搜索系統(tǒng)。作為馬上消費(fèi)金融風(fēng)控負(fù)責(zé)人,領(lǐng)導(dǎo)研發(fā)了基于共享經(jīng)濟(jì)平臺(tái)的大數(shù)據(jù)金融風(fēng)控系統(tǒng)。曾就職于商才數(shù)字科技公司,任技術(shù)總監(jiān),設(shè)計(jì)和領(lǐng)帶開發(fā)了綜合電商交易平臺(tái),點(diǎn)餐外賣平臺(tái),數(shù)據(jù)中臺(tái),服務(wù)于電商、點(diǎn)餐外賣業(yè)務(wù),帶動(dòng)了公司快速的互聯(lián)網(wǎng)生態(tài)化發(fā)展。
周老師一直專注于企業(yè)在大模型、人工智能,大數(shù)據(jù),云計(jì)算的業(yè)務(wù)場景落地應(yīng)用。大模型背景下,如何應(yīng)對移動(dòng)互聯(lián)網(wǎng),互聯(lián)網(wǎng)生態(tài)系統(tǒng)搭建,大數(shù)據(jù),人工智能的挑戰(zhàn)和企業(yè)應(yīng)對策略,商業(yè)模式的變更。企業(yè)如何在大模型時(shí)代,搭建人工智能企業(yè)架構(gòu),博得大數(shù)據(jù)、大模型紅利。大模型時(shí)代共享經(jīng)濟(jì)的思維變革,人工智能金融探秘,互聯(lián)網(wǎng)領(lǐng)域的投資挖掘。
1、《大模型的應(yīng)用、微調(diào)和部署案例實(shí)踐》
2、《大模型微調(diào)、部署、行業(yè)應(yīng)用和接口開發(fā)》
3、《算力網(wǎng)絡(luò):算力網(wǎng)絡(luò)技術(shù)原理及落地實(shí)踐》
4、《ChatGPT與AIGC生成式人工智能操作實(shí)戰(zhàn)》
5、《大模型賦能企業(yè)辦公降本提效案例應(yīng)用實(shí)操》
6、《人工智能下一個(gè)時(shí)代:ChatGPT的技術(shù)實(shí)現(xiàn)原理、行業(yè)實(shí)踐以及商業(yè)變現(xiàn)途徑》
7、《大模型在金融行業(yè)的應(yīng)用案例實(shí)踐》
8、《大模型在通信行業(yè)的應(yīng)用實(shí)踐》
7、《下一代人工智能:隱私計(jì)算和可信人工智能》
8、《互聯(lián)網(wǎng)(消費(fèi)金融)企業(yè)的AI大數(shù)據(jù)應(yīng)用》
9、《AI世界模擬器:Sora視頻生成模型的技術(shù)實(shí)現(xiàn)原理、行業(yè)實(shí)踐以及商業(yè)變現(xiàn)途徑》
10、《大模型技術(shù)體系架構(gòu)和算法案例實(shí)操》
11、《互聯(lián)網(wǎng)金融的大數(shù)據(jù)風(fēng)控》
互聯(lián)網(wǎng):蘋果、微軟、三星、華為、阿里、網(wǎng)易、百度、騰訊、字節(jié)跳動(dòng)、馬上金融;
金融:匯豐銀行、花旗銀行、工商銀行、招商銀行、法國興業(yè)銀行、中國農(nóng)業(yè)銀行、建設(shè)銀行、中國銀行、富民銀行、微眾銀行、中信銀行;
通信:中國移動(dòng)研究院、上海移動(dòng)研究院、北京移動(dòng)、上海移動(dòng)、江蘇移動(dòng)、杭州移動(dòng)、杭州移動(dòng)研究院、黑龍江移動(dòng)、四川移動(dòng)、中國電信、北京電信研究院、中國聯(lián)通、北京聯(lián)通研究總院、四川聯(lián)通、杭州聯(lián)通、中國鐵塔、中移物聯(lián)網(wǎng);
政府:國家網(wǎng)絡(luò)信息安全中心、河南省金融監(jiān)控總局、北京市政府、重慶市政府、杭州市政府、陜西省政府;
能源:中國石油、中國石化、中國海洋石油;
電力:中國電力、中國電力科技
工業(yè):寶武集團(tuán)、上海汽車、中建八局
Service Procedure
Service Advantages
我們擁有幾百家各類企業(yè)的項(xiàng)目咨詢基礎(chǔ)、多行業(yè)數(shù)據(jù)庫、多年的行業(yè)經(jīng)驗(yàn),并對企業(yè)進(jìn)行深度研究和剖析,總結(jié)出一系列深入的觀點(diǎn)和經(jīng)驗(yàn)。
我們的咨詢方案的設(shè)計(jì)過程秉承“知行合一”的理念,既具備理論知識(shí),又重視項(xiàng)目的實(shí)操性。經(jīng)過多年的經(jīng)驗(yàn),我們積累了豐富的案例庫,涉及18個(gè)領(lǐng)域,近千個(gè)案例,并將案例與咨詢項(xiàng)目完美結(jié)合。
我們的咨詢團(tuán)隊(duì)分布于各大領(lǐng)域,擁有多年的業(yè)內(nèi)從業(yè)經(jīng)驗(yàn),具備豐富的企業(yè)管理實(shí)操經(jīng)驗(yàn)。在定制咨詢方案前,我們會(huì)為客戶匹配多位業(yè)內(nèi)咨詢師,供客戶進(jìn)行比對選擇,根據(jù)客戶需求及問題,定制化地設(shè)計(jì)咨詢方案,確保項(xiàng)目的順利進(jìn)行。
ABOUT PERFECT CONSULTANT
We are? Talent training and intelligent manufacturing solutions provider.
What we do ?Provide organizational performance improvement and talent learning development business.
Customers:Each year, we serves more than 1000 enterprises (including fortune 500 enterprises, joint venture factories, state-owned enterprises, rapidly developing private enterprises and industry-leading enterprises).
10年更懂你
中大型企業(yè)共同選擇
累計(jì)培訓(xùn)學(xué)員
現(xiàn)有公開課
現(xiàn)有內(nèi)訓(xùn)課
現(xiàn)有在線課程
輻射城市
OFFLINE BUSINESS
高層團(tuán)隊(duì)引導(dǎo)工作坊
中層管理內(nèi)訓(xùn)
基層管理內(nèi)訓(xùn)
人才梯隊(duì)建設(shè)咨詢項(xiàng)目
工廠運(yùn)營咨詢項(xiàng)目
TTT內(nèi)訓(xùn)師咨詢項(xiàng)目
領(lǐng)導(dǎo)力公開課
精益智造公開課
個(gè)人效能公開課
Video Information
【見證企業(yè)成長每一步】
AI效能提升 × HR實(shí)戰(zhàn)干貨 × 領(lǐng)導(dǎo)力精要,前沿管理智慧每周更新,
關(guān)注視頻號(hào)獲取全場景管理解決方案,讓卓越觸手可及!
企業(yè)視頻號(hào)
官網(wǎng)電話:400-008-4600;手機(jī)號(hào):13382173255(Karen鄭老師);網(wǎng)站:www.perfectpx.com
PART OF TRAINED COMPANIES INCLUDED BUT NOT LIMITED TO
Copyright © 2006-2025 PerfectPX All rights reserved. 蘇州珀菲特企業(yè)管理顧問有限公司 版權(quán)所有 蘇ICP備11056827號(hào)-1 蘇公網(wǎng)安備 32050702010145號(hào)