2026 阶段性问题总结
Infra层面
- cuda 学的太浅,用的少,记性不好,导致问到也说不出来(GPU 架构, 存储, 通信)
- torch 同样(torch 内存 什么的不了解)
- vllm DeepSpeed 之类的也是 没看过源码,导致问深了答不出
- cpp oop 开发 需要复习,以及实操
算法层面
- 模型架构 看完就忘,每个模块的改进,原因,变体,模块间连接,要细致
- 基础机器学习理论 不了解具体,看了就忘,更多在模糊的感受层面,无法形成术语化的表述(重要!!看完不会说等于不会)
- 要记八股,更要深入理解,应对 followup(比如,根号 d 换成 d 或者变得更小一些为什么不行,会出现什么问题)
项目论文层面
- 叙事不够清晰,动机,问题,解决,为什么这么做为什么不那么做,答得不好
- 想的不够深,方法的本质是什么,为什么有效,为什么不那么做
- 干事情一定形成文档,不然脑子记不清。具体参数,卡,用时,怎么优化的
共性问题
- 太杂,不深,没有重点,没有亮点
- 实操一定要深入,为什么出问题怎么解决的要记
- 术语化表达!!!!!
- 看完不等于会了,常看常复述