'연산 능력'보다는 '메모리'가 더 중요한 이슈가 되는 LLM 환경. 메모리 사용량을 최대 12배 절약하게 해 주는 XQuant, 그리고 XQuant-CL 기법에 대해 알아봅시다
월드 모델의 한계를 돌파하는 새로운 아키텍처, PAN. 패러다임이 뒤집히는 순간이 온다
'생각의 깊이'를 설계해서 거대 모델만큼 비용이 안 들면서도 거대 모델의 품질을 내게 해 주는, 'Configurable'한 트랜스포머를 만들어 준다
조심스럽지만 과감하게, 월드 모델·에이전트·디퓨전으로 확장되는 테스트-타임 스케일링 패러다임
6년만에 오픈AI가 내놓은 오픈웨이트 모델, 그 안을 들여다봅시다
Moonshot AI, DeepSeek, Qwen, Z.ai에서 만든, 화제의 추론 및 에이전트 모델
Smol과 Qwen 모델, Liquid Foundation 모델, 최신의 Hyena Edge, 그리고 전설적인 BERT의 새로운 모습 등을 다시 돌아봅니다.
튜링포스트 코리아 'AI 101 섹션'에서 다룬, 기억해 두면 좋을 AI 개념, 다시 한 번 상기해 봅시다
튜링포스트 코리아 'AI 101 섹션'에서 다룬 것들 중 가장 의미있는 AI 모델들, 다시 한 번 상기해 봅시다
튜링포스트 코리아 'AI 101 섹션'에서 다룬 것들 중 가장 중요한 핵심 기법들, 다시 한 번 상기해 봅시다
가장 널리 사용되는 RLHF 방식의 대안으로 제안된 세 가지 LLM 정렬(Alignment) 기법들에 대해서 알아봅시다.
추론 모델을 정의하는 정체성은 뭔지, 여기 속하는 모델들이 어떤 것들인지, 앞으로 어떤 진화 방향이 있는지 살펴봅시다.