5月9日,阿里雲正式發佈了通義千問2.5,這一里程碑式的事件標誌著中文大模型領域迎來了新的突破。
通義千問2.5的發佈,無疑為中文大模型領域注入了新的活力。這款最新開源的1100億參數模型,在多個基準測評中均取得了最佳成績,成功超越了Meta的Llama-3-70B模型,成為開源領域的新標杆。其性能全面趕超GPT-4 Turbo,阿里雲更是聲稱其為“地表最強中文大模型”。
相比通義千問2.1版本,通義千問2.5在多個方面均有了顯著提升。在權威基準OpenCompass上,通義千問2.5的得分追平了GPT-4 Turbo,這是該基準首次有國產大模型取得如此出色的成績。這一成績不僅證明了通義千問2.5在中文語境下的卓越性能,也展示了阿里雲在人工智能領域的創新能力。
除了通義千問2.5外,阿里雲還發布了最新款開源模型Qwen1.5-110B。這款擁有1100億參數的模型在MMLU、TheoremQA、GPQA等基準測評中均超越了Meta的Llama-3-70B模型,並在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上榮登榜首。這一成就進一步鞏固了通義開源系列在業界的領先地位。
通義的多模態模型和專有能力模型也展現出了業界頂尖的影響力。其中,通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越了Gemini Ultra和GPT-4V,目前已在多家企業落地應用,為各行各業帶來了實質性的幫助。此外,通義千問代碼大模型CodeQwen1.5-7B也在智能編碼領域嶄露頭角,成為國內用戶規模第一的智能編碼助手通義靈碼的底座。