《动手学大模型》是由上海交通大学《自然语言处理前沿技术》《人工智能安全技术》课程讲义拓展而来的公益性质免费编程实践教程,旨在通过简单易懂的实践内容,帮助学习者快速入门大模型相关技术,为课程设计、学术研究提供入门级编程参考。该项目还联合华为昇腾推出了国产化《大模型开发全流程》系列课程,覆盖初级、中级、高级不同阶段,提供PPT、实验手册、视频等多形式教程,基于昇腾基础软硬件讲解大模型全流程开发与调优。
项目仓库地址:https://github.com/Lordog/dive-into-llms

1、内容体系完整且前沿:
教程覆盖大模型全链路核心技术,从基础的模型微调部署,到进阶的提示学习、知识编辑、数学推理,再到前沿的多模态模型、GUI智能体、智能体安全、RLHF安全对齐等方向,还包含模型水印、大模型隐写、越狱攻击等安全相关内容,形成“基础实践+前沿探索+安全研究”的完整体系。
2、实战导向性强:
每个教程模块均配套**课件、详细教程文档、可运行的脚本(IPython Notebook)**,从环境搭建、工具使用到代码实践、效果验证全流程覆盖,例如:
- 微调与部署模块讲解Transformers工具包使用、Gradio Spaces部署Demo;
- 提示学习模块提供通义千问/智谱AI/OpenAI等API调用实操;
- 多模态模型模块拆解NExT-GPT代码框架,讲解训练、推理全流程。
3、国产化适配与公益属性:
- 核心教程完全免费,无商业门槛;
- 联合华为昇腾推出国产化大模型开发教程,适配昇腾软硬件体系,提供从模型迁移到调优的全流程指南;
- 兼容国产大模型接口(通义千问、智谱AI、文心一言等),降低海外工具依赖。
4、结构清晰易导航:
项目README按“项目动机-教程目录-贡献者”逻辑组织,各章节教程目录标注明确的学习目标、前置准备、实践步骤,配套延伸阅读(论文、视频、开源项目),便于不同基础的学习者按需学习。
1、高校教学与学习:
- 作为高校自然语言处理、人工智能安全等课程的配套实践材料,帮助学生理解大模型理论并落地编程实践;
- 适合大模型零基础学习者入门,快速掌握核心技术栈(如微调、提示工程、多模态建模)。
2、开发者技术落地:
- 企业/个人开发者可参考教程完成大模型微调、部署(如基于Gradio搭建在线Demo)、多模态模型构建、GUI智能体开发(点外卖、购物比价等场景);
- 国产化大模型开发教程可指导开发者基于昇腾平台完成模型迁移、调优与落地。
3、学术研究与创新:
- 覆盖大模型隐写、水印、越狱攻击、智能体安全、RLHF对齐等前沿研究方向,提供基础代码框架与实验思路;
- 多模态模型模块讲解NExT-GPT等前沿架构,为多模态AGI方向研究提供参考。
4、大模型安全相关应用:
- 可用于大模型智能体安全测评、风险监测,例如智能体行为风险识别、越狱攻击防御、RLHF安全对齐验证;
- 模型水印、隐写技术可应用于大模型生成内容的溯源、版权保护。
5、行业解决方案开发:
- GUI智能体模块可拓展至自动化办公(自动回消息、购物比价)、生活服务(AI点外卖)等场景;
- 多模态模型模块可支撑跨模态理解/生成类应用(图文音视频混合交互、多模态内容创作)。
标签:


ppt模板办公生活AI头像绘制浏览器插件扩展插件ChatGPT软件资源AI辅助工具文字工具思维导图mac软件下载前端UI组件库教育学习二手交易学术论文