fly51fly (@fly51fly)
2026년 arXiv에 공개된 논문 'Meta-Reinforcement Learning with Self-Reflection for Agentic Search' 소개 트윗으로, T. Xiao, Y. Yuan, H. Ivison, H. Zhu 등(Allen Institute for AI 및 University of Washington 소속)이 에이전트형 검색(agentic search)을 위해 자기성찰(self-reflection)을 결합한 메타 강화학습 접근을 제시합니다.