这份综合学习计划将指导您掌握生成式 AI 生态系统中最常用的工具和技术,每一步都配有实践项目和资源。
基础知识
目标
建立机器学习和深度学习概念的坚实基础
学习用于机器学习的 Python
主题: 数据操作、库(NumPy, pandas)、绘图(matplotlib)
资源: Python 数据科学手册,YouTube 上的 FreeCodeCamp Python 课程
机器学习基础
主题: 回归、分类、过拟合、评估指标
资源: 吴恩达机器学习课程,《机器学习实战:基于 Scikit-Learn、Keras 和 TensorFlow》
深度学习入门
主题: 神经网络、激活函数、反向传播
精通 PyTorch
目标
熟练掌握使用 PyTorch 构建和训练神经网络
PyTorch 初学者指南
主题: 张量(Tensors)、自动微分(autograd)、nn.Module、数据集和数据加载器
资源: PyTorch 官方教程
构建自定义神经网络
任务: 图像分类(MNIST/CIFAR-10 数据集)
资源: Eli Stevens 著《PyTorch 深度学习实战》
预训练模型
主题: 迁移学习、微调
资源: 迁移学习教程
Hugging Face
目标
理解 Transformer 模型和 Hugging Face 生态系统
Hugging Face 基础
主题: Transformers 库、分词器(Tokenizers)和数据集
资源: Hugging Face 课程
使用预训练模型
任务: 文本分类、情感分析、摘要生成
资源: Hugging Face Transformers 文档
使用 Hugging Face 进行微调
主题: 微调 BERT、GPT、T5 模型
LangChain
目标
学习如何使用 LangChain 构建基于 LLM 的应用程序
LangChain 简介
主题: 链(Chains)、记忆(Memory)、代理(Agents)、工具(Tools)
资源: LangChain 文档
构建应用程序
任务: 问答系统、基于文档的聊天机器人
高级特性
主题: 自定义工具、多任务链接、外部 API 集成
RAG (检索增强生成)
目标
学习检索增强生成 (RAG) 如何结合检索与生成模型
RAG 基础
主题: 概念、检索器(Retrievers)、生成器(Generators)、向量存储(Vector Stores)
实现 RAG 管道
任务: 文档搜索 + 生成系统
工具: LangChain + Hugging Face
资源: LangChain RAG 教程,Hugging Face RAG 示例
模型微调
目标
掌握针对特定任务微调生成式模型的过程
微调概念
主题: 迁移学习、超参数调整
资源: Hugging Face 微调指南,Google Colab 实验平台
微调模型
任务: 针对 NLP 任务微调 GPT、T5 或自定义 Transformer
资源: Hugging Face Trainer API 或 PyTorch Lightning
评估微调后的模型
主题: BLEU、ROUGE、困惑度(Perplexity)及实际应用评估
生成式 AI 应用
目标
构建端到端的生成式 AI 解决方案
构建聊天机器人
工具: LangChain、RAG、微调后的 LLM
任务: 基于文档的实时问答
创意生成
任务: 文本、图像和代码生成应用程序
工具: Hugging Face、OpenAI、Stability AI
部署模型
工具: FastAPI、Streamlit 或 Docker 用于部署应用
资源: Hugging Face Spaces,AWS 或 Google Cloud 部署教程
实战项目
目标
通过实际项目巩固所学知识
项目创意
• 使用 Hugging Face 的新闻摘要生成器
• 自定义 RAG 驱动的知识助手
• 结合文本和图像生成的多模态应用
协作与分享
• 在 GitHub 上参与开源项目
• 在 Kaggle 或 Hugging Face Spaces 上分享项目
保持更新
目标
紧跟生成式 AI 的最新发展
博客与新闻通讯
• OpenAI 新闻通讯
参与社区
• Hugging Face 论坛、Reddit 和 Discord 群组