阿里推出全新推理模型,仅1/21参数媲美DeepSeekR1

admin 0次浏览

链桥学院报道,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型,QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨…

随机内容