大模型原理簡單介紹,各種大模型分析,大模型訓練和微調,包括LoRA,PT,FT的原理,glm2-6b微調實戰,大模型歷史、現狀、商業模式和當前中國配套政策。
學員基礎:Python,微積分,線性代數,概率論,numpy; 程序開發人員,算法工程師,數據分析師。
大模型基礎; 大模型歷史、現狀、商業和政策; LoRA; PT; FT; GLM2-6B微調。
-- 大模型的歷史發展; -- 大模型在不同領域的應用; -- 大模型商業模式; -- 當前中國的政策支持; -- 案例研究與討論; -- Lora; -- FT; -- PT; -- 實驗。
學習內容
大模型的歷史發展
大模型的起源:從早期神經網絡到Transformer
重要的里程碑:AlexNet、BERT、GPT系列等
大模型的演進:模型規模與性能的關系
大模型在不同領域的應用
自然語言處理領域
計算機視覺領域
自動駕駛、醫療、金融等領域的案例分析
大模型商業模式
大模型的商業應用場景
云計算與AI服務
大模型數據許可與訪問模式
大模型的商業利潤模式
當前中國的政策支持
中國AI產業政策的演變
大模型的政策支持與監管
數據隱私與安全政策
知識產權保護
案例研究與討論
分析大模型在中國的商業成功案例
政策對企業和行業的影響
介紹Lora、FT和PT的基本原理和方法
未來展望:中國大模型行業的機遇與挑戰
Lora
介紹Lora的背景、原理和優勢
講解Lora的核心技術,包括低秩矩陣分解、稀疏注意力機制和動態投影
演示如何使用Lora對GLM等大模型進行壓縮和加速
指導學員進行Lora的實驗,包括安裝環境、下載數據集、運行代碼和評估結果
FT
介紹FT的背景、原理和優勢
講解FT的核心技術,包括參數共享、任務適應和知識蒸餾
演示如何使用FT對GLM等大模型進行微調和遷移一
指導學員進行FT的實驗,包括選擇任務、加載模型、調整參數和測試性能
PT
介紹PT的背景、原理和優勢
講解PT的核心技術,包括自監督學習、掩碼語言模型和下一句預測
演示如何使用PT對GLM等大模型進行預訓練和初始化
指導學員進行PT的實驗,包括構建語料庫、設計目標函數、訓練模型和保存權重
實驗
實驗室實踐:參與者將應用所學知識,進行一個大模型訓練和微調的實際項目
案例研究:探討大模型在實際項目中的成功案例
無認證考試
暫無開班信息
人工智能訓練師(三級)進階
隨著人工智能技術的快速發展,社會對相關專業人才的需求不斷增加。上海交通大學憑借其在人工智能領域的學科優勢和科研實力,開展人工智能訓練師培訓項目,旨在培養適應市場需求的專業技術人才。
開課時間:暫無
人工智能訓練師(三級)基礎
DeepSeek核心技術原理和本地部署微調實戰
隨著人工智能技術的快速發展,智能助手(如DeepSeek-V3)在多模態理解、個性化交互、知識推理等領域的應用日益廣泛。DeepSeek-V3作為深度求索公司推出的第三代智能助手,憑借其先進的核心技術(如大規模預訓練、多模態理解、上下文感知等),在智能客服、內容創作、教育、醫療等領域展現了強大的潛力。
甫崎咨詢熱線
Copyright ©2009-2020 上海甫崎商務信息咨詢有限公司 版權所有 滬ICP備09041964號
ITIL® is a registered trade mark of AXELOS Limited, used under permission of AXELOS Limited. All rights reserved.
PRINCE2® is a registered trade mark of AXELOS Limited, used under permission of AXELOS Limited. All rights reserved.
Praxis Framework? is a trademark of Praxis Framework Limited. COBIT? is a registered trademark of Information System Audit and Control Association? (ISACA?). CISA? is a registered trademark of Information System Audit and Control Association? (ISACA?).