标签:实践教程,编程教程,AI大模型,上海交通大学 网址:https://github.com/Lordog/dive-into-llms该项目还联合华为昇腾推出了国产化《大模型开发全流程》系列课程,覆盖初级、中级、高级不同阶段,提供PPT、实验手册、视频等多形式教程,基于昇腾基础软硬件讲解大模型全流程开发与调
《动手学大模型》是由上海交通大学《自然语言处理前沿技术》《人工智能安全技术》课程讲义拓展而来的公益性质免费编程实践教程,旨在通过简单易懂的实践内容,帮助学习者快速入门大模型相关技术,为课程设计、学术研究提供入门级编程参考。该项目还联合华为昇腾推出了国产化《大模型开发全流程》系列课程,覆盖初级、中级、高级不同阶段,提供PPT、实验手册、视频等多形式教程,基于昇腾基础软硬件讲解大模型全流程开发与调优。
项目仓库地址:https://github.com/Lordog/dive-into-llms

1、内容体系完整且前沿:
教程覆盖大模型全链路核心技术,从基础的模型微调部署,到进阶的提示学习、知识编辑、数学推理,再到前沿的多模态模型、GUI智能体、智能体安全、RLHF安全对齐等方向,还包含模型水印、大模型隐写、越狱攻击等安全相关内容,形成“基础实践+前沿探索+安全研究”的完整体系。
2、实战导向性强:
每个教程模块均配套**课件、详细教程文档、可运行的脚本(IPython Notebook)**,从环境搭建、工具使用到代码实践、效果验证全流程覆盖,例如:
- 微调与部署模块讲解Transformers工具包使用、Gradio Spaces部署Demo;
- 提示学习模块提供通义千问/智谱AI/OpenAI等API调用实操;
- 多模态模型模块拆解NExT-GPT代码框架,讲解训练、推理全流程。
3、国产化适配与公益属性:
- 核心教程完全免费,无商业门槛;
- 联合华为昇腾推出国产化大模型开发教程,适配昇腾软硬件体系,提供从模型迁移到调优的全流程指南;
- 兼容国产大模型接口(通义千问、智谱AI、文心一言等),降低海外工具依赖。
4、结构清晰易导航:
项目README按“项目动机-教程目录-贡献者”逻辑组织,各章节教程目录标注明确的学习目标、前置准备、实践步骤,配套延伸阅读(论文、视频、开源项目),便于不同基础的学习者按需学习。
1、高校教学与学习:
- 作为高校自然语言处理、人工智能安全等课程的配套实践材料,帮助学生理解大模型理论并落地编程实践;
- 适合大模型零基础学习者入门,快速掌握核心技术栈(如微调、提示工程、多模态建模)。
2、开发者技术落地:
- 企业/个人开发者可参考教程完成大模型微调、部署(如基于Gradio搭建在线Demo)、多模态模型构建、GUI智能体开发(点外卖、购物比价等场景);
- 国产化大模型开发教程可指导开发者基于昇腾平台完成模型迁移、调优与落地。
3、学术研究与创新:
- 覆盖大模型隐写、水印、越狱攻击、智能体安全、RLHF对齐等前沿研究方向,提供基础代码框架与实验思路;
- 多模态模型模块讲解NExT-GPT等前沿架构,为多模态AGI方向研究提供参考。
4、大模型安全相关应用:
- 可用于大模型智能体安全测评、风险监测,例如智能体行为风险识别、越狱攻击防御、RLHF安全对齐验证;
- 模型水印、隐写技术可应用于大模型生成内容的溯源、版权保护。
5、行业解决方案开发:
- GUI智能体模块可拓展至自动化办公(自动回消息、购物比价)、生活服务(AI点外卖)等场景;
- 多模态模型模块可支撑跨模态理解/生成类应用(图文音视频混合交互、多模态内容创作)。
标签:腾讯AI,混元AI大模型,压缩工具,HuggingFace AngelSlim深度集成FP8/INT8/INT4、GPTQ、AWQ等主流压缩策略,支持端到端压缩与无缝部署,产出模型可直接对接vLLM、Sglang等高性能推理框架。
AngelSlim是腾讯混元团队自研并开源的全模态大模型压缩工具套件,通过量化、投机采样、稀疏化、知识蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音模型提供高效、易用、一键式的压缩与推理加速方案。
工具深度集成FP8/INT8/INT4、GPTQ、AWQ等主流压缩策略,支持端到端压缩与无缝部署,产出模型可直接对接vLLM、Sglang等高性能推理框架。本次重磅升级推出首创Eagle3架构,将投机采样首次拓展至全模态场景,实测推理速度最高提升1.4–1.9倍。目前已兼容混元、DeepSeek、Qwen等主流模型生态,开发者可通过pip install angelslim一键安装。

1、多精度量化压缩:
支持FP8、INT8、INT4量化,集成GPTQ、AWQ等先进算法,显著降低模型显存与存储开销。
2、投机采样推理加速:
首创Eagle3训练架构,由小模型生成多步候选token,大模型并行验证,速度最高提升1.4–1.9倍。
3、全模态统一支持:
覆盖LLM、VLM、语音模型(ASR/TTS),业内首次实现投机采样全模态落地。
4、稀疏化与知识蒸馏:
提供结构化/非结构化稀疏剪枝与知识蒸馏,进一步压缩体积并保持能力。
5、一键式调用与低门槛使用:
提供极简API,屏蔽底层复杂度,大幅降低开发者使用成本。
6、无缝对接推理框架:
压缩后模型可直接接入vLLM、Sglang等生态,实现“压缩→训练→部署”全链路打通。
7、主流模型生态兼容:
全面支持Hunyuan、DeepSeek、Qwen、Qwen2.5VL、Qwen3-Omni等开源模型。
1、量化压缩:
将高精度权重(FP16/FP32)映射到低精度格式(INT4/INT8/FP8),结合GPTQ/AWQ最小化精度损失。
2、投机采样(Speculative Decoding):
小模型批量起草候选token,大模型一次性并行验证接受/修正,突破串行解码性能瓶颈。
3、Eagle3前瞻架构:
增强草稿模型多步预测能力,提升单次验证接受长度至1.8–3.5倍,进一步提升加速比。
4、知识蒸馏:
将教师模型的输出分布与隐层特征迁移至学生模型,实现小模型继承大模型效果。
5、结构化/非结构化稀疏:
剪除冗余权重与神经元,降低计算量,适配硬件加速。
6、全模态统一压缩框架:
跨文本、图像、语音设计统一压缩接口与适配层,实现技术能力复用。
1、GitHub项目地址:https://github.com/Tencent/AngelSlim
2、Hugging Face模型库:https://huggingface.co/collections/AngelSlim
1、云端大模型推理加速:降低千亿级模型显存占用,提升高并发服务吞吐量。
2、端侧轻量化部署:INT4/INT8量化使模型可在手机、IoT等设备离线运行,保护隐私。
3、多模态AI应用加速:加速图文理解、语音转录/合成,赋能智能客服、审核、实时翻译。
4、AIGC生成提效:显著降低首包延迟与生成时间,提升写作、代码、图文描述体验。
5、企业私有化降本:压缩模型后本地部署,大幅减少算力成本,构建高性价比AI中台。
标签:人工智能,AI大模型 网址:https://www.rockai.netDolphin模型则提供智能对话、文章生成、文案摘要等功能,支持私域模型微调,以满足不同行业的需求。
岩芯数智是一家专注于人工智能技术研发与落地的科技企业,聚焦为各行业提供高效、高性价比的智能模型解决方案,核心产品涵盖国产化多模态大模型Yan模型与多功能应用型模型Dolphin模型。Yan模型以“训练周期短、数据集需求小、性价比高”为核心优势,助力产业链快速、低成本完成智能化升级;Dolphin模型则主打智能对话、文章生成、文案摘要等实用功能,支持私域模型微调,精准适配不同行业的个性化需求。

1、Yan模型:国产化多模态高效智能引擎:
支持多语言文案理解、文件信息精准提取,具备超低资源推理能力;训练周期短、对数据集要求低,性价比突出,助力企业快速完成智能化转型。
2、Dolphin模型:多功能应用型智能工具:
覆盖智能对话、文章生成、文案摘要等核心功能,支持私域模型定制化微调,可深度适配金融、教育、零售等不同行业的业务需求。
3、智能问答与指令执行:
整合海量知识库与行业数据,能完成复杂知识推理与精准问答;精准识别用户意图并执行对应指令,大幅提升工作流自动化程度。
4、智能巡检无人机:
搭载端侧多模态大模型,实现巡检场景的自主识别、故障定位,适用于电力、交通、安防等领域,提升巡检的效率与准确度。
5、智能服务机器人:
基于先进语音与图像识别技术,提供全天候拟人化接待、咨询、引导服务,广泛应用于商场、写字楼、政务大厅等场景。
6、个性化智能体定制:
可根据行业与企业需求,打造专属个性化智能体,满足差异化的业务场景应用,拓展AI技术的落地边界。
7、100%自主知识产权:
拥有完全自主研发的认知智能机器学习框架,技术自主可控,保障企业应用的安全性与稳定性。
1、访问官方平台:
进入岩芯数智官方网站,了解各款智能模型与服务的详细信息。
2、注册登录账号:
完成企业或个人账号注册与实名认证,登录服务管理后台。
3、选择适配服务:
根据自身业务需求,挑选Yan模型、Dolphin模型或智能硬件等对应服务。
4、查阅使用指南:
仔细阅读服务介绍与功能说明文档,了解产品能力与集成要求。
5、获取技术支持:
联系平台客服或查看在线教程,获取模型集成、部署的专业指导。
6、启动使用服务:
按照指导文档完成配置与调试,正式启用智能模型服务。
7、跟进版本更新:
定期关注平台发布的模型更新与优化公告,及时升级服务,保持技术先进性。
1、电力智能巡检:
电力公司部署岩芯数智智能巡检无人机,依托端侧多模态大模型实现线路自动巡检,精准识别故障隐患,大幅提升巡检效率与作业安全性。
2、商务智能接待:
商务人员应用基于岩芯数智技术的服务机器人,提供全天候拟人化客户接待与咨询服务,优化客户交互体验,提升客户满意度。
3、企业内容生产:
企业接入Yan模型开展文案生成、文件信息提取等工作,快速产出市场推广物料,显著提升内容生产效率,降低营销成本。
标签:AI智能体,AI大模型,AI Agent 网址:https://ai.hundun.cn全球首个战略咨询领域AI Agent产品,内置混沌深度创新框架、BLM模型,能即刻提供整套战略咨询方案。
混沌深度创新(Hundun Deep Innovation,简称HDDI)是由混沌出品,具备自主知识产权的AI新产品。其核心的「AI咨询师」是基于混沌深度创新框架(DIM)开发的首款AI Agent架构智能体。HDDI不是传统咨询的数字化改造,而是从零开始为AI设计的战略咨询系统,旨在重新定义战略咨询。

1、AI原生架构:
- 基于MCP协议(Model Context Protocol),让AI Agent能力无限扩展。
- 专为战略咨询场景设计,为大语言模型配备专业工具包。
- 智能匹配引擎:从海量案例中自动匹配最相关的成功路径。
2、四大革命性突破(4I模型):
- Innovation(创新导向):
- 混沌深度创新框架:建模型→找定位→找单点→必赢之战。
- 第一性原理加持:突破认知边界,发现非共识机会。
- 专注0-1突破:从想法到成功的系统性创新指导。
- Intelligence(智能赋能):
- AI原生架构:基于MCP协议,让AI Agent能力无限扩展。
- 垂类专业化:专为战略咨询场景设计,为大语言模型配备专业工具包。
- 智能匹配引擎:从海量案例中自动匹配最相关的成功路径。
- Insight(深度洞察):
- 十年案例积累:混沌服务数万创新企业的实战智慧结晶。
- 认知建模工具:混沌独家的DIM框架和BLM框架深度集成。
- 高质量数据库:经过清洗的行业数据和持续更新的案例库。
- Instant(即时响应):
- 7×24小时在线:随时随地获得专业战略指导。
- 分钟级交付:从提出问题到获得专业分析的革命性提速。
- 持续陪跑:从战略制定到落地执行的全程智能支持。
3、AI原生战略咨询:
- 深度集成混沌深度创新框架DIM和BLM框架,将原本需要资深顾问才能掌握的复杂战略分析工作进行了AI原生设计。
- 以霸王茶姬的东方星巴克之路为例,AI咨询师运用DIM进行了深度分析,展现了AI战略分析的专业水准。
- 以泡泡玛特Labubu的IP突围策略为例,AI咨询师运用BLM框架进行了系统性的业务诊断,制定了从传统盲盒向IP生态运营转型的系统性策略。
4、商业第二大脑:
- HDDI被设计为企业的“商业第二大脑”,提供7×24小时的专业战略指导,帮助企业快速做出决策。
- 用户可以和芒格、乔布斯和马克思等专家智能体对话,咨询自己面对的商业战略问题。
5、实战应用:
- 通过AI解析20万条亚马逊评论,发现“开箱体验差”是隐形痛点,迅速优化包装设计,复购率提升40%。
- RPA机器人将客服工作效率提升80%,解放员工从事更有价值的创意决策。
标签:DeepSeek,智能助手,AI大模型 网址:https://ai.dangbei.com/chat集成了满血版 DeepSeek R1、豆包和通义千问等优质AI大模型,提供高效、准确的信息和服务,旨在为用户提供个性化的帮助。
当贝AI是一款由当贝公司研发的智能助手,融合了自然语言处理、机器学习和大数据分析等先进技术。该产品集成了满血版 DeepSeek R1、豆包和通义千问等优质AI大模型,提供高效、准确的信息和服务,旨在为用户提供个性化的帮助。

1、满血版 DeepSeek R1 支持:当贝AI 支持 DeepSeek R1 671B 满血版,为用户提供最佳的操作体验,无需个人搭建高昂成本的高性能硬件。
2、开放生态系统:构建了一个开放生态系统,用户可以轻松调用全网优质 AI 大模型,实现一站式 AI 解决方案。
3、免费普惠服务:提供免费服务,用户无需注册账号,通过网页即可直接免费调用。
4、全场景覆盖:覆盖多种应用场景,满足用户在写作、学习、脑力激荡等多方面的需求。
5、广场功能:类似于知乎的问答平台,用户可以自由提问和回答,形成多角度的讨论。
6、分享功能:用户可以将互动内容分享到广场,供其他用户查阅和点赞。
7、智能体与个人知识库:提供多样化的应用场景,支持多库独立管理,实现细分场景的精准调用。
8、无痕模式:用户关闭窗口后,提问记录彻底消失,保护用户隐私[^1969^]。
9、毫秒级响应速度:依托自研高效计算架构与模型优化技术,当贝AI 在连续多轮对话中实现毫秒级响应。
10、大模型一键切换:在当贝AI主页下方可以一键切换不同的大模型,无需切换APP,大大提升使用效率。
11、支持联网搜索:当贝AI支持联网搜索,让用户获得的答案都可以溯源,确保内容的真实性。
12、多端同步:在当贝AI手机版上,可以同步在电脑端上的数据,方便寻找过去的提问内容,避免数据丢失。
1、访问官网:用户可以直接访问当贝AI的官方网站,点击极速体验。
2、无账号使用:当贝AI采用“无账号、无下载、无广告”的极简服务模式,用户无需注册账号即可使用。
3、调用模型:用户可以根据需求调用满血版 DeepSeek R1、豆包AI、通义千问等优质AI大模型。
Composer 2新一代AI编程模型使用入口,价格仅$2.50 / 百万输入token
Qwen3.5-Max-Preview模型使用入口,LMArena评测平台以1464分跻身全球前五、国内第一
StepClaw云端AI助手,阶跃AI基于OpenClaw架构推出的云端AI智能体
SongGeneration 2音乐生成模型,腾讯×清华开源·4B参数音乐生成大模型
Gemini Embedding 2模型使用入口,谷歌推出的首个原生多模态嵌入模型
Yuan3.0 Ultra万亿参数多模态基础模型,激活参数68.8B,基于MoE混合专家架构打造
Helios视频生成模型入口,北大与字节等机构联合研发的14B参数实时长视频生成模型
《动手学大模型》系列编程实践教程AI辅助工具电影下载AI办公效率AI制作PPT在线影视AI大模型3D模型办公生活自学电子书国产AIAI金融事务软件资源思维导图AI法律服务媒体运营AI营销工具音频工具AI开发框架短剧搜索