확률적 접근을 하는 신경망에 엄격한 논리, 규칙을 혼합하는 방법, 그리고 이런 접근방법을 간과해서는 안 되는 이유
Thinking Machines Lab이 다시 쓰고 있는, ‘기하학을 이해하는 인공지능’ 기반의 신경망 학습과 최적화 프레임웍
CWM, PSI, 그리고 그 너머 – AI가 세상을 ‘파악하는’ 방식이 새로워지고 있다
초기 강화학습의 중요 개념부터 RLHF, PPO, GRPO 등 오늘날 주목받는 강화학습의 다양한 혁신, 그리고 안드레 카파시와 리차드 서튼이 생각하는 미래의 AI 연구 방향
'미래는 들여다보지 않는' 오토리그레시브 모델을 더 똑똑하게 만들어 주는 CASTLE과 Future-aware Causal Mask
'안전하고 신뢰할 수 있는 AI 시대'를 위해 사용되는 '가디언 모델'에 대해 알아봅시다
CPU, GPU, TPU, ASIC, APU, NPU - AI를 위한 하드웨어의 세계, 간략히 알아봅시다
'연산 능력'보다는 '메모리'가 더 중요한 이슈가 되는 LLM 환경. 메모리 사용량을 최대 12배 절약하게 해 주는 XQuant, 그리고 XQuant-CL 기법에 대해 알아봅시다
월드 모델의 한계를 돌파하는 새로운 아키텍처, PAN. 패러다임이 뒤집히는 순간이 온다
'생각의 깊이'를 설계해서 거대 모델만큼 비용이 안 들면서도 거대 모델의 품질을 내게 해 주는, 'Configurable'한 트랜스포머를 만들어 준다
조심스럽지만 과감하게, 월드 모델·에이전트·디퓨전으로 확장되는 테스트-타임 스케일링 패러다임
6년만에 오픈AI가 내놓은 오픈웨이트 모델, 그 안을 들여다봅시다