1. AI Research Flow
- 딥러닝 역사
→ 제프리힌턴, 요슈아 벤지오, 얀쿤(현재LLM,transfomer 방식으로는 AGI 불가)
→ 앤드류응, 페이페이리, 데미스하사비스(척척박사심)
→ Transformer팀, Ian Goodfellow, llya Sutskever(AI Safety Startup)
→ 조나단호, 트리다오(mamba model), 단헨드릭스(GELU,MMLU - safe ai)
⇒ 기하급수적으로 증가하는 논문들 - 공부 어떻게 하나?
- ReviewScore: Misinformed Peer Review Detection with LLMs
→ 잘못된 리뷰 판단 - 얼마나 잘못됐는지 점수화
→ 논문 리뷰 가장 잘하는 모델 > sonnet / 논문 리뷰 방식에 대한 논란
2. 창업 경험 공유 - LLM 스타트업
- 투자 인사이트
→ VC(벤처 캐피탈), AC(스타트업 보육 및 투자), LP(유한책임출자자), GP(펀드 운용사)
→ 기술지주회사, TIPS, 신용보증기금, 기술보증기금, 기타 지원사업, SI(전략적 투자), CVC(사내 펀드)
→ VC 왈: 제품을 만드는 건 쉽다⇒진짜 좋은 제품인지 / 초반 유저 모으는건 쉽다 ⇒ 글로벌 확장
- 기술 전략 인사이트
→ 한번에 입력받을 수 있는 토큰 수 급격히 증가(context window) ⇒ 한 번에 주의를 기울일 수 있는 최대 토큰 수를 결정
→ 토크나이저 중요(영어입력이 토큰을 덜 잡아먹는다)
→ context window → 사용자 입력, 모델 응답, 시스템프롬프트, 첨부 문서 및 코드, rag 검색 보조 정보
→ 창업 인사이트 ⇒ 모델을 활용한 서비스, 경험 설계가 더 중요한 시대가 온다.
⇒ 좋은 모델 만들 필요 x, 새로 나오는 좋은 모델을 가져가다 범용 모델을 차별화하고 도메인 특화, 유저 특화 고민