在微米尺度上实现自主集体行为一直是机器人学领域的一大挑战。近日,德国康斯坦茨大学(University of Konstanz)及其研究合作者在《Science Robotics》上发表的最新成果,展示了一套利用反事实奖励(counterfactual rewards)提升多智能体强化学习(Multi-Agent Reinforcement ...