橙橘网
Llama架构比不上GPT2?神奇token提升10倍记忆?
2024-04-10
大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
2024-03-29
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉
2024-01-02
低调发育 8 个月后,李开复和他的大模型团队首次亮相
2023-11-07
李开复官宣「全球最强」开源大模型:一次处理40万汉字,中英均霸榜
2023-11-06
用暂停token重新训练大模型,AI学会三思而后行
2023-10-15
400万token,大模型推理飙升22倍!清华校友爆火一作,GitHub狂揽1.8k星
2023-10-06