橙橘网
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
2024-05-20
微软让MoE长出多个头,大幅提升专家激活率
2024-05-14
刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁
2024-04-10
开源大模型超越GPT-3.5!爆火MoE实测结果出炉
2023-12-12