'생각의 깊이'를 설계해서 거대 모델만큼 비용이 안 들면서도 거대 모델의 품질을 내게 해 주는, 'Configurable'한 트랜스포머를 만들어 준다
조심스럽지만 과감하게, 월드 모델·에이전트·디퓨전으로 확장되는 테스트-타임 스케일링 패러다임
6년만에 오픈AI가 내놓은 오픈웨이트 모델, 그 안을 들여다봅시다
Moonshot AI, DeepSeek, Qwen, Z.ai에서 만든, 화제의 추론 및 에이전트 모델
Smol과 Qwen 모델, Liquid Foundation 모델, 최신의 Hyena Edge, 그리고 전설적인 BERT의 새로운 모습 등을 다시 돌아봅니다.
튜링포스트 코리아 'AI 101 섹션'에서 다룬, 기억해 두면 좋을 AI 개념, 다시 한 번 상기해 봅시다
튜링포스트 코리아 'AI 101 섹션'에서 다룬 것들 중 가장 의미있는 AI 모델들, 다시 한 번 상기해 봅시다
튜링포스트 코리아 'AI 101 섹션'에서 다룬 것들 중 가장 중요한 핵심 기법들, 다시 한 번 상기해 봅시다
가장 널리 사용되는 RLHF 방식의 대안으로 제안된 세 가지 LLM 정렬(Alignment) 기법들에 대해서 알아봅시다.
추론 모델을 정의하는 정체성은 뭔지, 여기 속하는 모델들이 어떤 것들인지, 앞으로 어떤 진화 방향이 있는지 살펴봅시다.
AI가 스스로 훈련하는 Self-Training 시대, 합성 데이터를 안전하게, 쓸만하게 만들어주는 HITL 기법을 살펴봅시다.
'메타 러닝'의 놀라운 세계 - AI가 '배우는 법'을 배우는 그 곳, 간략한 개념을 알아봅시다.