Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减少70% 微软大模型新架构,正式向Transformer建议挑战! 论文标题明晃晃地写道:... 9 月前 0 0 18