멀티모달 LLM이 '시각적'으로 단계별 추론을 하게 하는 기법
오픈소스 음성인식모델 Whisper, 어떻게 Multilingual, Multitasking 모델로 만들어졌을까
모델의 성능, 메모리 효율성을 높여준다는 파인튜닝 기법 세 가지를 알아봅시다
MoE 아키텍처 + '오픈소스'라는 철학 = 가치 백만배!
VectorRAG과 GraphRAG을 결합한 HybridRAG 작동방식과 적용 사례 및 가능성
같은 시점에 나온 세 개의 CoK 논문을 통해서 본 AI 진화의 메커니즘
빠르게 업계의 선두로 나서는 DeepSeek의 혁신적 모델 개발 과정과 접근법
기존 RAG 접근법들의 한계, 그리고 Speculative RAG이 착안한 아이디어
LSTM과 xLSTM에 대해서 알아봅시다 - 어떤 것이 나아졌을까요?
Long-Context 환경에서 RAG의 한계를 극복할 수 있는 LongRAG
신경망을 새롭게 정의한다는 KAN - 과연 MLP의 대안이 될까?
YaFSDP는 어떻게 FSDP보다 나은 GPU 최적화 성능을 보여주는가