我坐下来,认真通读了 GitHub 上 AI 学习类收藏数最高的五个仓库——不只是 README,而是真正的课程内容、Notebook 和结构设计。这篇文章告诉你它们分别覆盖什么、有何不同,以及如何把它们串成一条路径,而不是五个互不相干的书签。
01 · f/prompts.chat — 建立直觉的起点
⭐ 163k Stars|Forks 21.2k|协议:CC0 + MIT
🔗 https://github.com/f/prompts.chat
最初是一份 ChatGPT 角色提示词的清单,如今已演变成完整平台:可自托管的 Web 应用、MCP 服务器支持、Claude 插件和交互式电子书。提示词本身属于公共领域,任何人都可以部署、贡献或浏览。
核心洞见: 把模型定位成某一类特定角色(Linux 终端、辩论对手、资深代码审查者、苏格拉底式导师),对输出质量的影响远超其他任何单一技巧。在系统学习提示词工程理论之前,花 30 分钟在这里,你会凭直觉就明白"为什么提示词这么重要"。
定位: 学习路径的入口,不是终点。把它当作建立直觉的热身,而不是深度学习的目的地。
02 · dair-ai/Prompt-Engineering-Guide — 理论与机制
⭐ 74.6k Stars|Forks 8.1k|协议:MIT
🔗 https://github.com/dair-ai/Prompt-Engineering-Guide
网站:promptingguide.ai
覆盖范围已远超"提示词工程"本身,包括:零样本与少样本提示、思维链与思维树、上下文窗口管理、检索增强生成(RAG)、智能体设计模式、多模态提示,以及对抗性提示。论文部分还链接了一手研究资料。
核心价值: 大多数提示词内容只告诉你"怎么做",这个仓库试图解释"为什么有效"。"思维链能改善输出"和"思维链通过让中间步骤显式化来激活模型的潜在推理能力"——这两种理解的差距,决定了你能否举一反三,而不只是照猫画虎。
提示: 如果你在 2023 年看过这个仓库就划走了,现在值得重新翻一遍,范围已经大幅扩展。
03 · anthropics/courses — 官方第一手实操课程
⭐ 21.3k Stars|Forks 2.2k|语言:99.9% Jupyter Notebook
🔗 https://github.com/anthropics/courses
Anthropic 官方出品,共 5 门课程,全部可运行的 Jupyter Notebook:
| # | 课程名称 |
|---|---|
| 1 | Anthropic API 基础 |
| 2 | 提示词工程交互教程 |
| 3 | 真实场景提示词实践 |
| 4 | 提示词评估(Evals) |
| 5 | 工具调用(Tool Use) |
为什么值得学: 第一方材料,反映 API 的真实行为,而不是某人 18 个月前写的 Medium 博客。Prompt Evaluations 课程尤其被低估——大多数人构建 AI 应用时完全跳过 Evals,然后不明白为什么质量这么不稳定。Tool Use 课程是你读了所有 Agent 理论之后的实践配套。
git clone https://github.com/anthropics/courses.git
cd courses
jupyter notebook
注意: 课程内容专注于 Claude。如果你在做跨模型开发,把这里当作参考实现,再自行适配。
04 · microsoft/generative-ai-for-beginners — 最完整的结构化课程
⭐ 111k Stars|Forks 57.7k|协议:MIT|50+ 语言翻译
🔗 https://github.com/microsoft/generative-ai-for-beginners
微软 Cloud Advocates 出品,21 课系统覆盖生成式 AI 全栈。每课交替采用 "Learn(概念)+ Build(代码)" 结构,包含视频介绍、书面说明,以及 Python 和 TypeScript 双语实现。
21 课内容一览:
课程设置 / GenAI & LLM 入门 / 模型对比选型 / 负责任 AI /
提示词工程基础 / 高级提示词 / 文本生成应用 / 对话应用 /
搜索与向量数据库 / 图像生成 / 低代码 AI / 函数调用 /
AI 应用 UX 设计 / AI 安全 / GenAI 应用生命周期 /
RAG 与向量数据库 / 开源模型与 Hugging Face / AI 智能体 /
微调 LLM / 构建 SLM / 构建 Mistral / 构建 Meta 模型
核心价值: 这是列表中唯一将负责任 AI、AI 应用 UX 设计、AI 安全和应用全生命周期作为正式课程模块的仓库。大多数面向开发者的课程完全跳过产品层和安全层——这里没有。
# 稀疏克隆,跳过 50+ 个翻译文件夹
git clone --filter=blob:none --sparse https://github.com/microsoft/generative-ai-for-beginners.git
cd generative-ai-for-beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'
注意: 微软生态偏向明显,示例多指向 Azure OpenAI Service 和 GitHub Models。课程本身列出了多种选项,但如果你完全在这个生态之外,需要自行适配。
05 · mlabonne/llm-course — 深入内核的进阶之路
⭐ 78.6k Stars|Forks 9.1k|协议:Apache-2.0
🔗 https://github.com/mlabonne/llm-course
三轨并行,从使用到理解再到构建,覆盖 LLM 的完整深度:
🔷 Track 1 · LLM 基础(可选)
线性代数、微积分、概率论、Python for ML、神经网络、NLP 基础。有相关背景可跳过,遇到盲区时用作参考。
🔶 Track 2 · LLM 科学家(如何构建)
LLM 架构与分词、预训练机制、后训练数据集、有监督微调(LoRA / QLoRA / Axolotl / Unsloth)、偏好对齐(DPO / GRPO / PPO)、评估、量化(GGUF / GPTQ / AWQ),以及模型合并、多模态、测试时计算扩展等前沿方向。
🔹 Track 3 · LLM 工程师(如何部署)
API vs 本地运行、向量存储构建、RAG 流水线、基于智能体的高级 RAG、AI 智能体(MCP / A2A / LangGraph / LlamaIndex / CrewAI)、推理优化(Flash Attention / KV 缓存 / 投机解码)、从本地到生产的部署、安全(提示注入 / 后门 / 红队测试)。
所有主要章节均配有可运行的 Google Colab Notebook。作者还基于本课程合著了《LLM Engineer's Handbook》(Packt 出版),课程本身永久免费。
提示: LLM 科学家轨需要具备运行训练任务的能力。如果你只是想构建应用,直接去 LLM 工程师轨。可选基础部分是有原因的——它真的是可选的。
五个仓库如何拼成一条路径
| 阶段 | 仓库 | 目的 |
|---|---|---|
| 🌱热身 | prompts.chat | 30 分钟建立提示词直觉 |
| 📖理论 | Prompt-Engineering-Guide | 技巧背后的机制,RAG 和 Agent 概念 |
| 🔧实操 | anthropics/courses | 含 Evals 和 Tool Use 的动手实现 |
| 🏗️全栈 | generative-ai-for-beginners | 从基础到部署的完整结构化课程 |
| 🔬深挖 | mlabonne/llm-course | 理解并改造模型,而不只是使用它 |
这五个仓库之间的内容重叠是刻意设计的。在你真正动手实现 RAG 之前,从三个不同角度(Guide、Anthropic 课程、微软课程)看到它被解释,比只看一次更有价值。mlabonne 的课程是唯一深入预训练和量化机制细节的——其他所有课程都假设你在模型之上构建,而不是在模型之下探索。
收藏不等于学习。选一条路,从第一步开始。