臺(tái)退將：DeepSeek只是開始競(jìng)對(duì)聯(lián)手圍剿引發(fā)爭(zhēng)議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-31 10:52:04 量子位

一夜之間,，OpenAI和Claude母公司Anthropic對(duì)DeepSeek發(fā)起了指責(zé),。據(jù)《金融時(shí)報(bào)》報(bào)道，OpenAI聲稱發(fā)現(xiàn)證據(jù),，證明DeepSeek利用其模型進(jìn)行訓(xùn)練,，涉嫌侵犯知識(shí)產(chǎn)權(quán)。具體而言,，他們發(fā)現(xiàn)了DeepSeek“蒸餾”O(jiān)penAI模型的跡象,，即使用更大模型的輸出來提高較小模型的性能，以較低成本在特定任務(wù)上取得類似結(jié)果,。微軟也開始調(diào)查DeepSeek是否使用了OpenAI的API,。

消息一出，引來了一波嘲諷,。紐約大學(xué)教授馬庫(kù)斯表示,，OpenAI需要免費(fèi)使用所有藝術(shù)家和作家的作品訓(xùn)練模型，然后用省下的錢去起訴DeepSeek,。知名技術(shù)媒體404 Media創(chuàng)始人及主編Jason也諷刺OpenAI只許州官放火,。

另一方面，Anthropic創(chuàng)始人Dario Amodei發(fā)表長(zhǎng)文稱,，說DeepSeek構(gòu)成威脅太夸張了,，只是達(dá)到了他們7-10個(gè)月前的水平,，Claude 3.5 Sonnet在許多評(píng)估中依然領(lǐng)先。不過,，為了保持領(lǐng)先,，他建議設(shè)置更多限制。

相比之下,，微軟的做法顯得耐人尋味,。就在指控DeepSeek涉嫌侵權(quán)后不久，微軟的AI平臺(tái)上接入了DeepSeek模型,。網(wǎng)友調(diào)侃道,，否認(rèn)是接受的第一步。

目前,，微軟和OpenAI對(duì)DeepSeek的質(zhì)疑仍處于調(diào)查階段,。根據(jù)微軟工作人員的說法，DeepSeek可能在去年秋天調(diào)用了OpenAI的API,，導(dǎo)致數(shù)據(jù)泄露,。按照OpenAI的服務(wù)條款，任何人都可以注冊(cè)使用其API,，但不能使用輸出數(shù)據(jù)訓(xùn)練對(duì)其造成競(jìng)爭(zhēng)威脅的模型,。OpenAI拒絕進(jìn)一步置評(píng)，也不愿提供證據(jù)細(xì)節(jié),。

模型蒸餾是一種壓縮技術(shù),，通過將復(fù)雜的大模型的知識(shí)轉(zhuǎn)移到更小、更高效的模型中,。這種技術(shù)在學(xué)術(shù)界和工業(yè)界非常普遍且被認(rèn)可,。例如，Together AI曾將Llama 3蒸餾到Mamba,，實(shí)現(xiàn)推理速度提升,。IBM的文章也提到，知識(shí)蒸餾已成為生成式AI普惠化的重要工具,。

然而,，違反OpenAI的服務(wù)條款是個(gè)問題。盡管一些開源模型允許蒸餾,，但OpenAI首席科學(xué)家Mark Chen表示,，DeepSeek獨(dú)立發(fā)現(xiàn)了OpenAI在實(shí)現(xiàn)過程中采用的一些核心理念，并認(rèn)可了其在成本控制上的工作,。同時(shí),，他也提到OpenAI也在積極探索模型壓縮和優(yōu)化技術(shù)。

實(shí)際上，OpenAI自身在合規(guī)性上也存在問題,。它在訓(xùn)練模型時(shí)使用了大量的互聯(lián)網(wǎng)數(shù)據(jù),，包括有版權(quán)的內(nèi)容。2023年12月,，《紐約時(shí)報(bào)》以侵犯知識(shí)產(chǎn)權(quán)為由將微軟和OpenAI告上法庭,。OpenAI辯解稱，使用公開可獲得的互聯(lián)網(wǎng)資料訓(xùn)練AI模型是合理的,，且版權(quán)著作被非商業(yè)性使用是受到合理保護(hù)的,。此外，大語言模型的關(guān)鍵在于Scaling,，任何單獨(dú)被盜的內(nèi)容都不足以支撐訓(xùn)練一個(gè)大模型,。

這引發(fā)了關(guān)于人工智能領(lǐng)域發(fā)展的基本邏輯的討論。Anthropic創(chuàng)始人Dario Amodei認(rèn)為,，DeepSeek的新模型雖然成本更低,，但水平與他們7-10個(gè)月前相當(dāng)。他認(rèn)為正確的說法是“DeepSeek生成了一種模型,，用較低的成本實(shí)現(xiàn)了接近7至10個(gè)月以前的Claude的表現(xiàn)”,。

分析師郭明錤認(rèn)為，DeepSeek R1加速了兩個(gè)趨勢(shì)：一是通過優(yōu)化訓(xùn)練方式持續(xù)增長(zhǎng)AI算力,，二是API/Token價(jià)格顯著下滑,，有利于加速AI應(yīng)用的多元化。這些趨勢(shì)有助于增加AI算力需求,，并降低投資者對(duì)AI投資能否獲利的疑慮,。

(責(zé)任編輯：張蕾)

關(guān)閉

臺(tái)退將：DeepSeek只是開始 競(jìng)對(duì)聯(lián)手圍剿引發(fā)爭(zhēng)議

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

臺(tái)退將：DeepSeek只是開始競(jìng)對(duì)聯(lián)手圍剿引發(fā)爭(zhēng)議