中科院-人工智能技术发展与应用探索

大纲
- 人工智能技术发展
弱人工智能到强人工智能的发展
预训练、自监督学习的进步
计算机视觉、语音、语义分析等领域的发展
ChatGPT与通用人工智能的序幕
通用大模型的优势与不足
优势:通识知识体系、自然语言生成能力等
不足:模型幻觉、常识性错误、安全性问题等
ChatGPT的技术背景与特点
智力密集型工程
分阶段学习方法:泛学、矫正、拟人
大数据与大算力的需求
大模型的应用迭代路径
从感知智能到决策智能
人工智能代理(Agent)的发展
大模型应用的误区
工具化误区:局限于常规应用,与核心业务脱节
神化误区:黑箱化解决重大应用问题,过度依赖
AI+行业落地三步曲
数据工程:高质量领域数据治理
模型工程:继续预训练、多模型适配
领域工程:指令微调、回馈学习、应用研发
大模型应用到行业领域的关键挑战
静态模型与动态数据的不匹配
信息庞杂、跨模态检索难度等
- DeepSeek认知与影响
DeepSeek模型的发展
从V2到V3的技术进步
DeepSeek-R1与OpenAI o1的对比
架构侧优化与训练成本压缩
DeepSeek的三大特征
复制OpenAI o1技术思路,通过强化学习提升推理能力
通过工程优化极致压缩训练成本
定位为OpenAI o1的开源平替,推动技术迭代
DeepSeek的成本与开源策略
硬件、训练、数据与人力成本估算
开源模型权重,促进技术普及
DeepSeek-R1的训练过程
冷启动数据构建与SFT训练
通过强化学习提升推理能力
小模型的蒸馏策略与效果对比
- AI+金融实践案例
数据工具类应用
财报解读问答系统
领域模型类应用
智能合规比稿、财税大模型、信贷审核智能体等
决策AI类应用
金融犯罪智能分析系统、AI信贷尽调报告、投研智能体等
优雅多模态大模型的应用
在多媒体内容创作、文旅、教育、营销等领域的应用
一键AIGC视频生成、联合多模态内容资产一键成片等功能特色
中心思想
本文档全面探讨了人工智能技术的发展历程、现状以及未来趋势,特别是以大模型(如DeepSeek、ChatGPT)为代表的技术突破。文档首先回顾了从弱人工智能到强人工智能的发展路径,强调了预训练、自监督学习等关键技术的重要性,并指出了通用大模型的优势与不足。接着,文档详细分析了ChatGPT的技术背景与特点,以及大模型应用的迭代路径和常见误区。在AI+行业落地方面,文档提出了数据工程、模型工程和领域工程三步曲,并指出了大模型应用到行业领域的关键挑战。
针对DeepSeek模型,文档深入探讨了其发展历程、技术特点、成本估算以及开源策略,强调了DeepSeek在复制OpenAI o1技术思路、通过工程优化压缩训练成本以及定位为开源平替方面的努力。同时,文档还详细介绍了DeepSeek-R1的训练过程,包括冷启动数据构建、SFT训练以及通过强化学习提升推理能力等关键步骤。
最后,文档通过一系列AI+金融实践案例,展示了大模型在金融领域的广泛应用和显著成效,包括数据工具类应用、领域模型类应用以及决策AI类应用等。此外,文档还介绍了优雅多模态大模型在多媒体内容创作等领域的应用,进一步凸显了大模型的跨领域应用潜力和价值。整体而言,本文档旨在推动人工智能技术的进一步发展与应用,为行业智能化转型提供有力支持。
电子书下载地址:
通过网盘分享的文件:中科院-人工智能技术发展与应用探索.pdf
链接: https://pan.baidu.com/s/154aAIplzX1Cwepi0qq8FYw 提取码: krfw
