moe
-
豆包提出全新稀疏模型架构 UltraMem,推理成本较 MoE 最高可降 83%
豆包大模型团队今日宣布,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,…
豆包大模型团队今日宣布,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,…