MEGALODON 的训练损失达到 1.70,处于 LLAMA2-7B ( 1.75 ) 和 13B ( 1.67 ) 之间。MEGALODON 相对于 Transformers 的改进在不同任务和模式的一系列基准测试中表现强劲。