张楠:大模型与智能体培训

29 阅读 0 点赞更新日期2026-06-21

授课老师： 张楠

常驻地: 北京

擅长领域: 通信人工智能

课程背景

当前，随着大模型技术快速发展，企业在实际应用中面临多重挑战：一方面，大模型复杂的架构设计、高昂的算力成本及部署门槛，导致技术落地困难；开源与闭源模型的选择缺乏系统性对比，企业常陷入“技术选型迷茫”；另一方面，提示词工程、模型微调等关键技术实战经验不足，生成结果存在可控性低、领域适配差等问题，难以满足业务场景的真实需求。加之行业部署方案碎片化，从开发环境搭建到企业级应用落地的全流程缺乏可复用的方法论，进一步延缓了技术价值的释放。

本课程针对以上痛点，系统性地构建从理论到实践的能力闭环：通过解析大模型核心原理与DeepSeek技术优势，帮助学员掌握模型选型与性能优化策略；结合部署架构对比、API开发实战及企业级应用案例，提供低门槛、高可用的工程化指导；更通过提示词工程优化、RAG增强生成等演练，攻克生成质量与场景适配难题，助力学员实现从技术理解到产业落地的跨越式进阶，真正驾驭大模型的变革潜力。

课程收益

1.帮助参训员工了解大模型特点及关键技术

2.帮助参训员工了解大模型技术解析、模型分析

3.帮助参训员工了解部署大模型的架构和设计方案、

4.帮助参训员工了解智能体的架构与实现、

5.协助参训员工完成应用案例与实践

授课形式：讲授与互动：通过PPT讲解等方式，系统介绍理论知识。

学习对象：全体员工

时间安排：系统学习2天（12小时）

课程大纲

Day 1：大模型基础与DeepSeek技术解析‌

‌上午：大模型简介‌

1.‌大模型基础概念

1.1 大模型的定义与核心特征（参数规模、泛化能力、多任务处理）

1.2 大模型发展历程（从Transformer到GPT-4的里程碑事件）

1.3 大模型的技术范式演变（监督学习→自监督学习→指令微调→对齐技术）

2. ‌关键技术解析‌

2.1 核心技术组件

.Transformer架构

.预训练与微调

.参数高效微调技术

2.2 训练与优化技术

.分布式训练框架（Megatron-LM、DeepSpeed）

.模型压缩与加速（量化、蒸馏、剪枝）

3.‌典型大模型对比

3.1 主流模型家族（GPT、LLaMA、PaLM、Claude）对比分析

3.2 开源与闭源模型的优劣势（成本、灵活性、生态支持）

3.3 领域专用模型案例（医学、法律、金融）

4. ‌应用场景与挑战‌

4.1 行业应用（智能客服、代码生成、内容创作、知识问答）

4.2 局限性讨论（幻觉问题、计算资源依赖、伦理风险）

‌下午：DeepSeek技术解析‌

1.‌DeepSeek技术体系概览‌

1.1 发展历程与定位（国内大模型生态中的角色）

1.2 技术路线图（从早期版本到V3/R1的迭代逻辑）

2.‌DeepSeek-V3与DeepSeek-R1对比分析‌

2.1 架构差异（模型规模、注意力机制优化）

2.2 训练策略对比（数据来源、分布式训练方案）

2.3 性能指标对比（MMLU、C-Eval、HumanEval基准测试）

3.‌模型深度解析‌

3.1 核心技术突破

▪ 稀疏注意力（Sparse Attention）设计

▪ 动态上下文窗口扩展技术

3.2 训练数据工程

▪ 高质量数据清洗流程

▪ 多语种与多模态数据融合

4.‌提示词工程实战‌

4.1 结构化提示设计（角色设定、任务分解、示例引导）

4.2 高级技巧（思维链、自洽性校验、知识增强）

4.3 案例实操（通过提示词优化提升代码生成质量）

5.‌DeepSeek应用架构‌

5.1 企业级解决方案架构图解析

5.2 典型落地案例拆解（金融风控、教育问答系统）

‌Day 2：DeepSeek部署与应用开发‌

‌上午：部署架构与技术详解（3小时）‌

1.‌部署方案全景分析‌

1.1 基础设施需求

▪ GPU选型指南（A100/H100 vs 消费级显卡）

▪ 分布式推理集群设计

1.2 部署模式对比

▪ 云端SaaS服务 vs 本地私有化部署

▪ 混合部署方案（边缘计算+中心云）

2.‌学习环境搭建指南‌

2.1 开发环境配置

▪ Docker容器化部署流程

▪ CUDA环境与依赖库管理

2.2 快速启动方案

▪ 预训练模型下载与加载

▪ 轻量化推理服务部署（使用FastAPI+Transformers）

3.‌API开发实践‌

3.1 RESTful API接口详解

▪ 鉴权机制（API Key管理）

▪ 流式响应（Streaming Response）实现

3.2 SDK集成案例

▪ Python SDK调用示例

▪ 多模态输入处理（文本+图像）

‌下午：核心技术实践与演练（3.5小时）‌

1.‌关键技术特点解析‌

1.1 高性能推理优化

▪ 动态批处理（Dynamic Batching）技术

▪ 显存优化策略（PagedAttention）

1.2 企业级功能支持

▪ 多租户隔离方案

▪ 审计日志与安全合规

2.‌全链路实践项目‌

2.1 场景选择（智能知识库问答系统）

2.2 开发流程演示

▪ 数据准备（领域知识向量化）

▪ RAG（检索增强生成）架构实现

▪ 效果评估与迭代优化

3.‌故障排查与调优‌

3.1 常见问题诊断

▪ 显存溢出解决方案

▪ 长文本生成稳定性优化

3.2 性能调优实验

▪ 量化精度对比测试（FP16 vs INT8）

▪ 并发压力测试与扩容策略

4.‌进阶开发指导‌

4.1 自定义模型微调

▪ 领域适配训练数据准备

▪ 基于DeepSeek的继续预训练

4.2 生态工具链使用

▪ 监控仪表盘（Prometheus+Grafana）

▪ 自动化部署工具（Kubernetes编排）

授课老师

张楠自动化运维+AI人工智能专家

常驻地：北京
邀请老师授课：13439064501 陈助理

主讲课程：《5G时代的AI技术应用详解》《HCIP课程》《HCIE课程》《网络编程自动化》《数据中心运维模式研讨》《基于数据中心运维的项目生命周期管理课》《让数据引爆加速——数据中台和业务中台高效赋能》

张楠老师的课程大纲

大模型与智能体培训

本文分类：管理运营
本文标签：张楠 AI大模型 AI智能体
浏览次数：29 次浏览
发布日期：2026-06-21 13:30:21
本文链接：https://www.zms.org.cn/gl_kg/20979.html

上一篇 > AI智能体商业实战应用课
下一篇 > OpenClaw小龙虾应用实战

张楠:大模型与智能体培训

课程背景

课程收益

课程大纲

Day 1：大模型基础与DeepSeek技术解析‌

‌Day 2：DeepSeek部署与应用开发‌

授课老师

张楠老师的课程大纲

【肖昌兴】OpenClaw小龙虾应用实战

【胡文渊】AI智能体商业实战应用课

【甄文智】AI与智能体开发实战

【柯雨金】AI 智能体搭建工作坊

【李铁军】AI智能体企业顶层设计与落地路径

【尹智】智绘未来-AI大模型和智能体时代的的地产行业变革与战略升级

【侯明哲】AI大模型与AI Agent智能体落地

【曾涛】易精人工智能实践工坊