一夜之間,,OpenAI和Claude母公司Anthropic對DeepSeek發(fā)起了指責。據《金融時報》報道,,OpenAI聲稱發(fā)現證據,,證明DeepSeek利用其模型進行訓練,涉嫌侵犯知識產權,。具體而言,,他們發(fā)現了DeepSeek“蒸餾”O(jiān)penAI模型的跡象,即使用更大模型的輸出來提高較小模型的性能,,以較低成本在特定任務上取得類似結果,。微軟也開始調查DeepSeek是否使用了OpenAI的API。
消息一出,,引來了一波嘲諷,。紐約大學教授馬庫斯表示,OpenAI需要免費使用所有藝術家和作家的作品訓練模型,,然后用省下的錢去起訴DeepSeek,。知名技術媒體404 Media創(chuàng)始人及主編Jason也諷刺OpenAI只許州官放火。
另一方面,,Anthropic創(chuàng)始人Dario Amodei發(fā)表長文稱,,說DeepSeek構成威脅太夸張了,只是達到了他們7-10個月前的水平,,Claude 3.5 Sonnet在許多評估中依然領先,。不過,為了保持領先,,他建議設置更多限制,。
相比之下,微軟的做法顯得耐人尋味。就在指控DeepSeek涉嫌侵權后不久,,微軟的AI平臺上接入了DeepSeek模型。網友調侃道,,否認是接受的第一步,。
目前,微軟和OpenAI對DeepSeek的質疑仍處于調查階段,。根據微軟工作人員的說法,,DeepSeek可能在去年秋天調用了OpenAI的API,導致數據泄露,。按照OpenAI的服務條款,,任何人都可以注冊使用其API,但不能使用輸出數據訓練對其造成競爭威脅的模型,。OpenAI拒絕進一步置評,,也不愿提供證據細節(jié)。
模型蒸餾是一種壓縮技術,,通過將復雜的大模型的知識轉移到更小,、更高效的模型中。這種技術在學術界和工業(yè)界非常普遍且被認可,。例如,,Together AI曾將Llama 3蒸餾到Mamba,實現推理速度提升,。IBM的文章也提到,,知識蒸餾已成為生成式AI普惠化的重要工具。
然而,,違反OpenAI的服務條款是個問題,。盡管一些開源模型允許蒸餾,但OpenAI首席科學家Mark Chen表示,,DeepSeek獨立發(fā)現了OpenAI在實現過程中采用的一些核心理念,,并認可了其在成本控制上的工作。同時,,他也提到OpenAI也在積極探索模型壓縮和優(yōu)化技術,。
實際上,OpenAI自身在合規(guī)性上也存在問題,。它在訓練模型時使用了大量的互聯網數據,,包括有版權的內容。2023年12月,,《紐約時報》以侵犯知識產權為由將微軟和OpenAI告上法庭,。OpenAI辯解稱,使用公開可獲得的互聯網資料訓練AI模型是合理的,且版權著作被非商業(yè)性使用是受到合理保護的,。此外,,大語言模型的關鍵在于Scaling,任何單獨被盜的內容都不足以支撐訓練一個大模型,。
這引發(fā)了關于人工智能領域發(fā)展的基本邏輯的討論,。Anthropic創(chuàng)始人Dario Amodei認為,DeepSeek的新模型雖然成本更低,,但水平與他們7-10個月前相當,。他認為正確的說法是“DeepSeek生成了一種模型,用較低的成本實現了接近7至10個月以前的Claude的表現”,。
分析師郭明錤認為,,DeepSeek R1加速了兩個趨勢:一是通過優(yōu)化訓練方式持續(xù)增長AI算力,二是API/Token價格顯著下滑,,有利于加速AI應用的多元化,。這些趨勢有助于增加AI算力需求,并降低投資者對AI投資能否獲利的疑慮,。
臺退將:臺民眾不要迷信美國會出兵。這位臺退將的話一語中的,,頭腦清醒,。
2024-09-26 10:17:28臺退將:臺民眾不要迷信美國會出兵本文內容皆有可靠信息來源,,相關信源述于文章結尾,請理性閱讀,?!厩把浴?0月25日西方媒體披露的一則新聞在國際輿論場上引起了不小的波瀾,美國政府宣布了一項對臺軍售計劃,,總額高達僅近20億美元
2024-10-30 16:17:24臺退將解讀美對臺軍售武器部署問題雙航母聯合演訓、11架戰(zhàn)機密集繞臺,,近期解放軍打出的組合拳讓臺媒終于意識到情況不妙,,臺退將帥化民直言,臺軍最害怕的武器已經出現,,不是威力巨大的航母,,而是解放軍的另一件“收臺利器”
2024-11-07 20:09:37臺退將:臺軍對解放軍毫無招架之力近日,臺灣地區(qū)民進黨對統(tǒng)派愛國志士高安國進行了抓捕和迫害,,這種行為被批評為“綠色恐怖”,。近年來,民進黨當局在追求“獨立”的道路上越走越遠,,制造了一系列的“綠色恐怖”事件
2025-01-07 19:00:03臺統(tǒng)派集會要求釋放統(tǒng)派退將高安國