Haribo
ML, AI, MATH, Algorithm
Home
Archives
Categories
Tags
About
DPO 리뷰
2025-11-30
Haribo
실습
AI
DPO
논문리뷰
,
Similar Posts
DPO와 아이들 (GRPO)
개빡치는 정밀도 줄이기 & LoRA
Optimizer 반파시키기
여러 Norm들 + Modulation 연산
Accelerater 참수 (3편, 각종 함수들)
Accelerater 테이크 다운 (2편, 분산학습)
이전 포스트
DPO와 아이들 (GRPO)
Comments
Please enable JavaScript to view the
comments powered by Disqus.
Content
Similar Posts
Comments