美國科技巨頭Meta于4月5日推出了其最強大的開源人工智能模型Llama 4,,該模型有兩個版本,分別名為Scout和Maverick,。Llama 4是一個多模態(tài)大模型,,能夠處理和整合文本、視頻,、圖像和音頻等不同類型的數(shù)據(jù),,并在這些格式之間轉換內容。
Llama 4系列首次采用了混合專家(MoE)架構,,這種架構可以將模型劃分為多個專注于特定任務的“專家”子模型,,從而提高訓練和回答用戶查詢時的效率。據(jù)Meta介紹,,Scout和Maverick不僅是其迄今為止最先進的模型,,也是多模態(tài)領域中最先進的模型之一。Scout擁有170億個活躍參數(shù),、16個“專家”模型,、總參數(shù)量為1090億;而Maverick同樣有170億個活躍參數(shù),,但配備了128個“專家”模型,,總參數(shù)量高達4000億。
除了Scout和Maverick之外,,Meta還在開發(fā)一個功能更加強大的模型Behemoth,,稱其為世界上最智能的大模型之一,是新模型中的教師,。所有這些模型都經過了大量未標注的文本,、圖像和視頻數(shù)據(jù)的訓練,以獲得廣泛的視覺理解能力,。Scout和Maverick模型可以在Llama.com網站以及Meta的合作伙伴處公開獲取,,同時也可以在WhatsApp、Messenger,、Instagram Direct上使用,。
Meta表示,其人工智能助手Meta AI已在40個國家更新為使用Llama 4模型,,目前多模態(tài)功能僅在美國以英語提供,。公司首席執(zhí)行官扎克伯格強調,目標是建立世界領先的人工智能,,將其開源并普及,,讓每個人都能從中受益,。他認為開源人工智能將成為領先的模型,隨著Llama 4的推出,,這一愿景正在逐步實現(xiàn),。此外,Meta首席產品官Chris Cox提到,,Llama 4的推出將使AI智能體變得更強大,,具備更高水平的推理和行動能力。
此前,,Llama 3已經推出一年,,Llama 4之所以遲遲未能發(fā)布,是因為在開發(fā)過程中遇到了技術上的挑戰(zhàn),,特別是在推理和數(shù)學任務方面沒有達到預期,。此外,Meta也擔心其模型在模擬人類語音對話方面不如競爭對手OpenAI的模型,。盡管如此,,Meta計劃今年投入高達650億美元擴大其人工智能基礎設施,但仍面臨來自投資者的壓力,,要求展示投資的實際回報,。
DeepSeek發(fā)布了新一代開源大模型DeepSeek-R1,。該模型在數(shù)學,、代碼、自然語言推理等任務上的性能與美國OpenAI公司的最新o1大模型相當
2025-01-21 22:05:22DeepSeek又有重大突破