
该文档是浙江大学肖俊在“浙江大学DeepSeek系列专题线上公开课(第二季)”的讲稿,围绕大模型、智能体及复杂AI应用系统构建展开,以产业大脑为例阐述相关技术发展、应用及意义。
- 大纲
- 大模型推理能力快速提升:回顾大模型发展历程,从早期技术积累到ChatGPT出现及GPT 3.5的三阶段训练技术;对比AI 1.0和AI 2.0时代,展示大模型能力增长但早期推理存在短板;介绍OpenAI o1/o3、DeepSeek-R1等模型在推理能力上的突破。
- 推理模型和思维链(CoT):阐述推理大模型通过多种技术提升推理能力,如OpenAI o1/o3、Gemini 2.0 Flash Thinking等模型的推理特点;解释思维链概念,以生活和学术问题为例说明其作用,介绍DeepSeek-R1展示思维链及低成本实现推理模型的方法。
- 智能体(AI Agent)是什么:通过与ChatGPT互动引出智能体概念,指出大语言模型局限性,介绍智能体构成;以撰写调研报告和自动发邮件为例说明智能体工作流程;介绍Agent System五层基石理论和HuggingGPT大小模型协作模式及影响力。
- 四链融合产业大脑案例:分析产业发展面临的国家战略和社会需求,指出产业竞争问题及AI融合的重要性;介绍产业网链大模型,包括训练过程、数据资源和服务框架;列举多个产业大脑应用实例展示其特色与创新。
- 总结:总结新一代大模型推理能力增强、低成本训练模型的可行性、智能体构建复杂AI应用系统的能力,探讨“推理大模型 + 知识图谱(知识库) + 智能体”成为未来AI系统开发范式的可能性。
- 中心思想:本次分享聚焦大模型、智能体到复杂AI应用系统构建,深入探讨大模型推理能力的演进,剖析思维链在提升推理效果中的关键作用,阐释智能体如何拓展大模型应用边界,实现复杂任务。以产业大脑为核心案例,揭示AI技术在产业领域的创新应用及对产业决策、发展的重要支撑作用。整体旨在展示AI技术的发展脉络与应用潜力,启发对未来AI系统开发范式的思考,强调其在推动产业创新、解决实际问题方面的重要价值 。
电子书下载地址:
通过网盘分享的文件:从大模型、智能体到复杂AI应用系统的构建.pdf
链接: https://pan.baidu.com/s/13nAkwA9kEjjSTXY7a_cpYg 提取码: a2tv
