阿里云發(fā)布開源模型Qwen2,,宣稱性能超美國最強開源模型Llama3-70B
6月7日,,阿里云在技術博客上宣布了一個重要進展:他們發(fā)布了名為Qwen2-72B的開源模型,這款模型在全球范圍內(nèi)以其卓越的性能脫穎而出,。Qwen2-72B不僅超越了美國目前最強的開源模型Llama3-70B,,還優(yōu)于眾多國內(nèi)的閉源大型模型,如文心4.0,、豆包pro,、混元pro等。對于有興趣探索這一新成果的公眾,,阿里云提供了在魔搭社區(qū)和Hugging Face平臺上免費獲取通義千問最新開源模型的途徑,。
此次發(fā)布的Qwen2系列是對今年2月推出的通義千問Qwen1.5的一次顯著升級,整體性能和多項具體能力均有提升,,涉及代碼處理、數(shù)學運算,、邏輯推理,、指令執(zhí)行以及多語言理解等方面。Qwen2-72B在一系列國際公認的測評中,,包括MMLU,、GPQA、HumanEval等,贏得了多項世界第一,,繼續(xù)拉大與美國Llama3模型之間的距離,。阿里云發(fā)布開源模型Qwen2,宣稱性能超美國最強開源模型Llama3-70B,。
Qwen2系列相當全面,,涵蓋了從Qwen2-0.5B至Qwen2-72B等多個不同規(guī)模的預訓練和指令微調(diào)模型,其中特別引入了Qwen2-57B-A14B這一混合專家模型(MoE),,采用了創(chuàng)新的GQA(分組查詢注意力)機制,。這種機制使得模型運行時能更高效地利用資源,用戶將體驗到更快的推理速度和更低的顯存需求,。
自推出以來,,通義千問Qwen系列在全球范圍內(nèi)迅速走紅,其總下載量在短短一個月內(nèi)實現(xiàn)翻番,,目前已超過1600萬次,。開源社區(qū)的積極響應進一步證明了Qwen系列的成功,已有超過1500款基于Qwen的二次開發(fā)模型面世,。值得注意的是,,Qwen系列中的72B及110B模型多次在HuggingFace的Open LLM Leaderboard開源模型排行榜上奪得首位,彰顯了其在全球AI領域的影響力,。
5月17日,,騰訊云在北京舉辦了生成式AI產(chǎn)業(yè)應用峰會,,會上分享了騰訊大模型應用產(chǎn)品的最新進展。當前,,長文模型,、個人助手、智能體平臺成為大模型領域廠商競爭的關鍵點
2024-05-20 08:08:27全球大模型應用百花齊放