Skip to content

zkywsg/Daily-LLM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

430 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Daily-LLM banner

深度学习与大模型精通之路

Deep Learning & LLM Mastery

深度学习与大模型的完整工程路线——从 2012 年 AlexNet 到 2025 年推理模型,每一个技术都是被前一代局限逼出来的。

English · 时间线 · 可视化网页 · 模块索引 · 快速开始 · 贡献指南

License: MIT Python 3.8+ Phases Bilingual


时间线:15 个家族(2012–2025)

# 家族 关键年份 一句话定位
01 CNN 卷积神经网络 2012– 把视觉特征从手工设计交给反向传播
02 RNN / LSTM / GRU 1997, 2014– 给神经网络装上"记忆"
03 Word Embedding 2013– 让"词"有了分布式的语义坐标
04 GAN 2014– 用对抗博弈学会"生成"
05 Transformer 2017 用纯注意力替代循环,彻底并行
06 BERT 系预训练 2018– 双向预训练 + 微调成为 NLP 新范式
07 GPT 系 + Scaling 2018–2020 把规模做到底,涌现 Few-shot
08 视觉 Transformer (ViT) 2020– Transformer 反攻视觉
09 多模态对齐 2021– 让"图"和"文"住进同一个空间
10 扩散模型 2020– 生成的新王,从噪声到图像
11 PEFT / LoRA 2021– 把大模型微调成本压到普通人能玩
12 对齐与 RLHF 2022– 把"会答"变成"答得好"
13 MoE 与高效推理 2023– 大模型在不变贵的前提下变更大
14 RAG 与 Agent 2023– 把模型接上外部世界
15 推理模型 (o1/R1) 2024– 推理时多想几步,能力再上一个台阶

按年份速查:TIMELINE.md(自动生成) 横切基础:foundations/


可视化网页

仓库内已提供一个独立的时间线可视化网页,入口在 web/

本地运行:

cd web
npm install
npm run dev

页面结构是“顶部横向时间线 + 下方当前节点内容”,适合浏览整条深度学习与大模型演进链路。当前先作为本地网页维护,公网部署后再补充正式访问地址。


仓库结构

  • 01-cnn/15-reasoning-o1-r1/ — 15 个架构/范式家族,按登场时间排序
  • foundations/ — 横切基础(激活、反传、优化器、归一化、注意力机制…)
  • projects/ — 跨家族实战项目
  • web/ — 可视化网页
  • TIMELINE.md — 自动生成的按年份索引
  • _archive/ — 旧 timeline/tracks/ 内容,作为家族内容重写时的素材源

快速开始

1. 克隆仓库

git clone https://github.com/zkywsg/Daily-LLM.git
cd Daily-LLM

2. 安装依赖

pip install -r requirements.txt
按阶段选择性安装依赖
# Phase 00-01(前置 + 视觉线)
pip install torch numpy scikit-learn matplotlib

# Phase 02-03(语言线 + 规模多模态)
pip install transformers datasets sentence-transformers

# Phase 04(对齐与微调)
pip install peft trl

# Phase 05(系统与生产)
pip install sentence-transformers faiss-cpu chromadb langchain vllm fastapi mlflow wandb

贡献

欢迎贡献改进内容、补充案例、修正文档或完善结构。提交前请先阅读 CONTRIBUTING.md

许可证

本项目采用 MIT License

Releases

No releases published

Packages

 
 
 

Contributors