Part 5:现代计算机视觉
| Title | Author | Date |
|---|---|---|
| 11.1 从 CNN 到 Vision Transformer:把图像当成序列 | 2026-05-11 | |
| 11.2 Patch Embedding:把图像切成 Token | 2026-05-12 | |
| 11.3 Class Token 与 Positional Embedding:让序列表示整张图 | 2026-05-13 | |
| 11.4 ViT Encoder:让 Patch Token 之间交换信息 | 2026-05-13 | |
| 11.5 ViT Backbone:预训练与微调 | 2026-05-19 |
No matching items