OpenAI 公司于4月15日發(fā)布博文,,宣布以API形式推出GPT-4.1系列模型,包括GPT-4.1,、GPT-4.1 mini和GPT-4.1 nano,。這些新模型在編程、指令遵循和長(zhǎng)文本理解方面全面超越前代GPT-4o及GPT-4o mini,,上下文窗口最高支持100萬tokens,,知識(shí)更新至2024年6月。
目前,,該系列模型專為開發(fā)者設(shè)計(jì),,僅通過開發(fā)者API提供,普通用戶暫時(shí)無法通過ChatGPT頁面體驗(yàn),。在編程方面,,GPT-4.1的代碼生成速度比GPT-4o快40%,用戶輸入查詢的成本降低了80%,。
GPT-4.1系列模型在編程,、指令遵循和長(zhǎng)文本處理上表現(xiàn)出色。GPT-4.1在SWE-bench Verified測(cè)試中得分54.6%,,比GPT-4o提升21.4個(gè)百分點(diǎn),,在MultiChallenge測(cè)試中提升10.5個(gè)百分點(diǎn),并在Video-MME測(cè)試中創(chuàng)下72.0%的新紀(jì)錄,。GPT-4.1 mini在多項(xiàng)基準(zhǔn)測(cè)試中媲美甚至超越GPT-4o,,延遲降低近一半,成本減少83%,。GPT-4.1 nano則擁有100萬個(gè)token的上下文窗口,,在MMLU測(cè)試中得分80.1%,適合分類和自動(dòng)補(bǔ)全任務(wù),。
這些模型通過優(yōu)化推理?xiàng):吞崾揪彺婕夹g(shù),,顯著降低了首次響應(yīng)時(shí)間,,為開發(fā)者提供了高效低成本的解決方案。實(shí)際應(yīng)用中,,GPT-4.1特別適合構(gòu)建智能代理,,處理復(fù)雜任務(wù)。例如,,在Windsurf測(cè)試中,,GPT-4.1提升了30%的編程效率,減少了50%不必要的編輯,;Thomson Reuters的法律AI助手CoCounsel使用GPT-4.1后,,多文檔審查準(zhǔn)確率提升了17%。
GPT-4.1的發(fā)布加劇了OpenAI產(chǎn)品命名的復(fù)雜性,。ChatGPT目前已包含GPT-4o,、GPT-4o mini、o1-pro等多種模型選項(xiàng),。OpenAI首席執(zhí)行官Sam Altman承認(rèn)命名問題,,并計(jì)劃通過未來的GPT-5整合品牌。OpenAI計(jì)劃在2025年7月前逐步淘汰API中的GPT-4.5 Preview模型,,緩解命名混亂,。這一臨時(shí)模型曾被批評(píng)為“失敗品”,開發(fā)者需在2025年7月前遷移到其他模型,,不過GPT-4.5在ChatGPT中暫時(shí)保留,,未受影響。
API價(jià)格方面,,GPT-4.1模型每100萬tokens輸入費(fèi)用為2美元,,每100萬tokens輸出費(fèi)用為8美元。在中等查詢中,,相比GPT-4o,,GPT-4.1不僅性能更強(qiáng)悍,而且便宜26%,。GPT-4.1 nano是OpenAI最便宜,、最快的模型。