2월, 2026의 게시물 표시전체 보기
멀티에이전트 전이 시스템을 로직 프로그램으로 짜보기
Activation steering, 왜 생각보다 잘 안 먹히는가
DreamDojo 사람 영상으로 로봇 월드모델을 만든다
InftyThink+ 오래 생각시키는 걸 RL로 다듬으면
activations도 ‘분포’가 있다 내부 상태를 모델링해보기
Jackpot 액터-정책이 안 맞을 때 예산 아끼는 RL
LLM 추론 실패 케이스 모음 왜 자꾸 삐끗할까
시간논리로 보상 설계하기 비마르코프도 다루는 법
LLM은 합리적 선택을 일관되게 할까
그래프 알고리즘 문제로 본 ‘추론 모델’의 빈틈
GUI 그라운딩, 멀티모달 융합이 성능을 어디까지 올릴까
게시물 더보기 검색결과 없음

이 블로그 검색

신고하기

프로필