2025年2月2日 星期日

阿里雲新推出Qwen2.5-VL 更勝 Deepseek和GPT-4o 股價急升

 文章來源

Qwenchat

中國阿里巴巴旗下的「阿里雲」昨晚宣布推出超大規模MoE模型「通義千問Qwen 2.5-Max」,在多項權威基準測試中展現出優異的表現,甚至略勝DeepSeek V3,消息一出也帶動阿里巴巴股價昨晚急升超過6%。

阿里巴巴旗下的「通義千問」團隊研發的Qwen2.5-Max在訓練過程中使用超過20兆token的預訓練數據,並採用精心設計的後訓練方案。團隊聲稱與業界領先的閉源或開源模型對比,Qwen2.5-Max在各個評測系統如LiveCodeBench、LiveBench、Arena-Hard等評估中的表現都超越了DeepSeek V3,在MMLU-Pro等其他測試中也展現極具競爭力的成績。

阿里雲也直接拿Qwen2.5-Max與DeepSeek V3、GPT-4o、Claude-3.5-Sonnet等模型表現對比。此外,在基座模型的對比中,由於無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型,阿里雲將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密(Dense)模型Llama-3.1-405B,以及同樣位列前列的Qwen2.5-72B進行了比較,結果顯示Qwen2.5-Max的基座模型在大多數基準測試中都展現出顯著優勢。


沒有留言:

張貼留言