该研究聚焦于单个神经元层面,发现了一组重要的神经元,它们实现了简单的启发式算法。只需要关注特定的极少量神经元,就能正确预测大模型进行算术运算的结果(图2)。 举个例子:当输入的提示词为“ 226−68= ...
元模型使用多层感知器(MLP)来编码节点和管道的特征,并使用图神经网络(GNN)来处理这些特征,最后通过MLP解码器将处理后的嵌入转换为具有 ...
该如何确认特定神经元和相关数学运算之间存在因果关系?一种常见的方法是消融分析,即将大模型大模型中特定的神经元敲除,看看模型的效果会有何改变,结果如图4所示。