創業家: 阿里雲新推出Qwen2.5-VL 更勝 Deepseek和GPT-4o 股價急升

中國阿里巴巴旗下的「阿里雲」昨晚宣布推出超大規模MoE模型「通義千問Qwen 2.5-Max」，在多項權威基準測試中展現出優異的表現，甚至略勝DeepSeek V3，消息一出也帶動阿里巴巴股價昨晚急升超過6%。

阿里巴巴旗下的「通義千問」團隊研發的Qwen2.5-Max在訓練過程中使用超過20兆token的預訓練數據，並採用精心設計的後訓練方案。團隊聲稱與業界領先的閉源或開源模型對比，Qwen2.5-Max在各個評測系統如LiveCodeBench、LiveBench、Arena-Hard等評估中的表現都超越了DeepSeek V3，在MMLU-Pro等其他測試中也展現極具競爭力的成績。

阿里雲也直接拿Qwen2.5-Max與DeepSeek V3、GPT-4o、Claude-3.5-Sonnet等模型表現對比。此外，在基座模型的對比中，由於無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型，阿里雲將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密（Dense）模型Llama-3.1-405B，以及同樣位列前列的Qwen2.5-72B進行了比較，結果顯示Qwen2.5-Max的基座模型在大多數基準測試中都展現出顯著優勢。

創業家

網頁

2025年2月2日星期日

阿里雲新推出Qwen2.5-VL 更勝 Deepseek和GPT-4o 股價急升

沒有留言:

張貼留言

網頁

2025年2月2日 星期日

阿里雲新推出Qwen2.5-VL 更勝 Deepseek和GPT-4o 股價急升

沒有留言:

張貼留言

2025年2月2日星期日