TODO
- [ ] 验证RL视角在点监督是否可行 点监督RL
- [ ] 自动发送日报Action 日报自动推送
- [ ] 确定研究方向
- [ ] 多模态?
- [ ] 少样本?
- [ ] 强化学习?
- [ ] 确定canny feat 的传入是否正常
- [ ] loss edge 疑似有误/10个epoch后再加入
- [ ] 验证p2rbox-v2 edge loss → canny feat
日报
2025-10-07
电脑坏了,修了一天。
2025-10-06
今日爬长城。
还没敢看实验结果。
要不要多看看RL和SFT统一视角的研究?
2025-10-05