阿里巴巴发布QwQ-32B开源模型,挑战DeepSeek的霸主地位(阿里巴巴发布了产品怎么没有看到)
在DeepSeek成为全球开源大模型的焦点之后,国产开源大模型的开发热潮不断升温。如今,DeepSeek的最强对手终于亮相了!
阿里巴巴在今日凌晨3点30分发布了一款重磅炸弹——通义千问最新开源模型QwQ-32B。这款模型在尺寸上比DeepSeek更小,但在性能上却与全球最强的开源推理模型不相上下。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现了质的飞跃,整体性能与DeepSeek-R1相当。而且,千问QwQ-32B在保持强劲性能的同时,还大幅降低了部署使用成本,能够在消费级显卡上实现本地部署。
目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可以免费下载及商用。同时,用户也可以通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。
据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。
另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。
受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。
据新浪科技报道,3月6日凌晨,科技圈再次迎来了一场狂欢,一个名为Manus的中国AI产品成为了焦点。一支来自中国的团队正式对外发布了通用型AI Agen
2025-03-07在DeepSeek成为全球开源大模型的焦点之后,国产开源大模型的开发热潮不断升温。如今,DeepSeek的最强对手终于亮相了!阿里巴巴在今日凌晨3点30分发
2025-03-07烽烟再起,群雄逐鹿!招贤共谋,天下归心!3月15日中午12:00,由bilibili游戏独家代理发行的首款多职业战争策略手游《三国:谋定天下》将正式开启“招贤服”,本次招贤主题服,「战神吕布」张光北将亲临战场,与玩家角逐天下霸业!新主公入驻
2025-03-06与大家在《传奇新百区-盟重神兵》欢度新春的记忆犹新,尽管假期已经结束,大家的热情还是持续高涨。我们衷心感谢每一位勇士的支持与厚爱!万物复苏、春回大地。二区“新月”和“流云”已于2月28日14点双服同开!为了庆祝开服,“夺宝爆电竞椅,显示器”
2025-03-06《无限世界》【时空裂变】是一款3D大型多人在线角色扮演游戏,带你穿越奇幻的多元宇宙,体验前所未有的游戏盛宴。在这里,你可以与多种职业的玩家同台竞技,感受激情四溢的PVP战斗,畅游多样副本,驾驭特种坐骑,参与丰富的活动路线,尽享游戏带来的无尽
2025-03-06“艾维”是一名很强势的控场角色,利用伊斯人在地图中四处穿梭以寄生求生者来获取求生者位置信息。熟练切换伊斯人和“艾维”可以让角色更加灵活,但相对的也需要更多练习才能熟练操控,还得有清晰的对局思路。
2025-03-06-
《第五人格》监管者时空之影基础攻略新鲜出炉(第五人格监管闪现开局多少秒) 2025-03-06
-
FGO日服情人节90++本配置介绍(fgo日服情人节活动2024主线开启要求) 2025-02-27
-
《二重螺旋》玩法全解析 多维战斗与轻量化养成(二重螺旋drama2) 2025-02-27
-
怎么入手最省 魔域口袋版蛇年兽攻略 2025-02-27
-
新年兽伤害爆炸 魔域口袋版蛇年兽入手攻略 2025-02-27
-
燕云十六声望归望归任务攻略方法(燕云十六州读音) 2025-02-27