OpenAI 公司于4月15日發(fā)布博文,宣布以API形式推出GPT-4.1系列模型,,包括GPT-4.1,、GPT-4.1 mini和GPT-4.1 nano。這些新模型在編程,、指令遵循和長文本理解方面全面超越前代GPT-4o及GPT-4o mini,,上下文窗口最高支持100萬tokens,知識更新至2024年6月,。
目前,,該系列模型專為開發(fā)者設(shè)計,,僅通過開發(fā)者API提供,普通用戶暫時無法通過ChatGPT頁面體驗,。在編程方面,,GPT-4.1的代碼生成速度比GPT-4o快40%,用戶輸入查詢的成本降低了80%,。
GPT-4.1系列模型在編程,、指令遵循和長文本處理上表現(xiàn)出色。GPT-4.1在SWE-bench Verified測試中得分54.6%,,比GPT-4o提升21.4個百分點,,在MultiChallenge測試中提升10.5個百分點,并在Video-MME測試中創(chuàng)下72.0%的新紀錄,。GPT-4.1 mini在多項基準測試中媲美甚至超越GPT-4o,,延遲降低近一半,成本減少83%,。GPT-4.1 nano則擁有100萬個token的上下文窗口,,在MMLU測試中得分80.1%,,適合分類和自動補全任務(wù),。
這些模型通過優(yōu)化推理棧和提示緩存技術(shù),顯著降低了首次響應(yīng)時間,,為開發(fā)者提供了高效低成本的解決方案,。實際應(yīng)用中,GPT-4.1特別適合構(gòu)建智能代理,,處理復(fù)雜任務(wù),。例如,在Windsurf測試中,,GPT-4.1提升了30%的編程效率,,減少了50%不必要的編輯;Thomson Reuters的法律AI助手CoCounsel使用GPT-4.1后,,多文檔審查準確率提升了17%,。