深度学习与大模型的完整工程路线——从 2012 年 AlexNet 到 2025 年推理模型,每一个技术都是被前一代局限逼出来的。
| # | 家族 | 关键年份 | 一句话定位 |
|---|---|---|---|
| 01 | CNN 卷积神经网络 | 2012– | 把视觉特征从手工设计交给反向传播 |
| 02 | RNN / LSTM / GRU | 1997, 2014– | 给神经网络装上"记忆" |
| 03 | Word Embedding | 2013– | 让"词"有了分布式的语义坐标 |
| 04 | GAN | 2014– | 用对抗博弈学会"生成" |
| 05 | Transformer | 2017 | 用纯注意力替代循环,彻底并行 |
| 06 | BERT 系预训练 | 2018– | 双向预训练 + 微调成为 NLP 新范式 |
| 07 | GPT 系 + Scaling | 2018–2020 | 把规模做到底,涌现 Few-shot |
| 08 | 视觉 Transformer (ViT) | 2020– | Transformer 反攻视觉 |
| 09 | 多模态对齐 | 2021– | 让"图"和"文"住进同一个空间 |
| 10 | 扩散模型 | 2020– | 生成的新王,从噪声到图像 |
| 11 | PEFT / LoRA | 2021– | 把大模型微调成本压到普通人能玩 |
| 12 | 对齐与 RLHF | 2022– | 把"会答"变成"答得好" |
| 13 | MoE 与高效推理 | 2023– | 大模型在不变贵的前提下变更大 |
| 14 | RAG 与 Agent | 2023– | 把模型接上外部世界 |
| 15 | 推理模型 (o1/R1) | 2024– | 推理时多想几步,能力再上一个台阶 |
按年份速查:TIMELINE.md(自动生成) 横切基础:foundations/
仓库内已提供一个独立的时间线可视化网页,入口在 web/。
本地运行:
cd web
npm install
npm run dev页面结构是“顶部横向时间线 + 下方当前节点内容”,适合浏览整条深度学习与大模型演进链路。当前先作为本地网页维护,公网部署后再补充正式访问地址。
01-cnn/…15-reasoning-o1-r1/— 15 个架构/范式家族,按登场时间排序foundations/— 横切基础(激活、反传、优化器、归一化、注意力机制…)projects/— 跨家族实战项目web/— 可视化网页TIMELINE.md— 自动生成的按年份索引_archive/— 旧timeline/与tracks/内容,作为家族内容重写时的素材源
git clone https://github.com/zkywsg/Daily-LLM.git
cd Daily-LLMpip install -r requirements.txt按阶段选择性安装依赖
# Phase 00-01(前置 + 视觉线)
pip install torch numpy scikit-learn matplotlib
# Phase 02-03(语言线 + 规模多模态)
pip install transformers datasets sentence-transformers
# Phase 04(对齐与微调)
pip install peft trl
# Phase 05(系统与生产)
pip install sentence-transformers faiss-cpu chromadb langchain vllm fastapi mlflow wandb欢迎贡献改进内容、补充案例、修正文档或完善结构。提交前请先阅读 CONTRIBUTING.md。
本项目采用 MIT License。