这份综合学习计划将指导您掌握生成式 AI 生态系统中最常用的工具和技术,每一步都配有实践项目和资源。

1

基础知识

目标

建立机器学习和深度学习概念的坚实基础

学习用于机器学习的 Python

主题: 数据操作、库(NumPy, pandas)、绘图(matplotlib)

资源: Python 数据科学手册,YouTube 上的 FreeCodeCamp Python 课程

机器学习基础

主题: 回归、分类、过拟合、评估指标

资源: 吴恩达机器学习课程,《机器学习实战:基于 Scikit-Learn、Keras 和 TensorFlow》

深度学习入门

主题: 神经网络、激活函数、反向传播

资源: 吴恩达深度学习专项课程从零开始构建神经网络

2

精通 PyTorch

目标

熟练掌握使用 PyTorch 构建和训练神经网络

PyTorch 初学者指南

主题: 张量(Tensors)、自动微分(autograd)、nn.Module、数据集和数据加载器

资源: PyTorch 官方教程

构建自定义神经网络

任务: 图像分类(MNIST/CIFAR-10 数据集)

资源: Eli Stevens 著《PyTorch 深度学习实战》

预训练模型

主题: 迁移学习、微调

资源: 迁移学习教程

3

Hugging Face

目标

理解 Transformer 模型和 Hugging Face 生态系统

Hugging Face 基础

主题: Transformers 库、分词器(Tokenizers)和数据集

资源: Hugging Face 课程

使用预训练模型

任务: 文本分类、情感分析、摘要生成

资源: Hugging Face Transformers 文档

使用 Hugging Face 进行微调

主题: 微调 BERT、GPT、T5 模型

资源: Transformers 微调指南

4

LangChain

目标

学习如何使用 LangChain 构建基于 LLM 的应用程序

LangChain 简介

主题: 链(Chains)、记忆(Memory)、代理(Agents)、工具(Tools)

资源: LangChain 文档

构建应用程序

任务: 问答系统、基于文档的聊天机器人

高级特性

主题: 自定义工具、多任务链接、外部 API 集成

5

RAG (检索增强生成)

目标

学习检索增强生成 (RAG) 如何结合检索与生成模型

RAG 基础

主题: 概念、检索器(Retrievers)、生成器(Generators)、向量存储(Vector Stores)

资源: Hugging Face RAG 指南

实现 RAG 管道

任务: 文档搜索 + 生成系统

工具: LangChain + Hugging Face

资源: LangChain RAG 教程,Hugging Face RAG 示例

6

模型微调

目标

掌握针对特定任务微调生成式模型的过程

微调概念

主题: 迁移学习、超参数调整

资源: Hugging Face 微调指南,Google Colab 实验平台

微调模型

任务: 针对 NLP 任务微调 GPT、T5 或自定义 Transformer

资源: Hugging Face Trainer API 或 PyTorch Lightning

评估微调后的模型

主题: BLEU、ROUGE、困惑度(Perplexity)及实际应用评估

7

生成式 AI 应用

目标

构建端到端的生成式 AI 解决方案

构建聊天机器人

工具: LangChain、RAG、微调后的 LLM

任务: 基于文档的实时问答

创意生成

任务: 文本、图像和代码生成应用程序

工具: Hugging Face、OpenAI、Stability AI

部署模型

工具: FastAPI、Streamlit 或 Docker 用于部署应用

资源: Hugging Face Spaces,AWS 或 Google Cloud 部署教程

8

实战项目

目标

通过实际项目巩固所学知识

项目创意

• 使用 Hugging Face 的新闻摘要生成器

• 自定义 RAG 驱动的知识助手

• 结合文本和图像生成的多模态应用

协作与分享

• 在 GitHub 上参与开源项目

• 在 Kaggle 或 Hugging Face Spaces 上分享项目

9

保持更新

目标

紧跟生成式 AI 的最新发展

博客与新闻通讯

Hugging Face 博客

• OpenAI 新闻通讯

参与社区

• Hugging Face 论坛、Reddit 和 Discord 群组