1) DSAIL 랩 인턴 경험공유
LLM 모델은 참 대단한 것 같습니다. 언어 학습을 통해 다양한 task를 해결할 수 있는게 참 신기한 것 같습니다. 이미지를 추가 학습함으로서 모델 성능이 기존 LLM모델이랑 비교했을 때 얼마나 더 좋아졌는지 궁금하네요.
2) zero-shot semantic segmentation
unseen classes들이 많아도 segmentation를 할 수 있는 ZegFormer가 대단한 것 같습니다. 여기에 clip까지 추가해서 개선할 수 있었다는 게 참 신기한데, 기회가 된다면 clip가 정확히 어떻게 개선을 했는지 논문을 읽어봐야겠어요.