工程院院士與DeepSeek過了一招,。美國當?shù)貢r間2月17日晚間,馬斯克旗下的人工智能公司xAI發(fā)布了最新人工智能模型Grok 3,。在這場直播發(fā)布中,DeepSeek成為屢次被提及的比較對象,,以此展示Grok 3的性能。前幾年,,中國企業(yè)每每推出模型時,都要和GPT-3.5,、GPT-4進行對比,。如今,Grok 3的主要比較對象變成了DeepSeek,,這再次證明了DeepSeek在全球人工智能行業(yè)中的影響力,。
過去,,人工智能領(lǐng)域信奉“大力出奇跡”,,即通過增加模型規(guī)模、數(shù)據(jù)量和計算資源來顯著提升模型性能,。而DeepSeek則開辟了一條新路,以低成本,、高效率的方式改寫了行業(yè)競爭法則,,給全球人工智能界帶來新的啟示,。早在DeepSeek“出圈”之前,青島的人工智能企業(yè)就開始關(guān)注這個“不走尋常路”的新物種,,并在DeepSeek推理模型推出的第一時間積極擁抱,,用以提升自家行業(yè)模型能力,。
對青島的人工智能企業(yè)來說,,DeepSeek的到來將加速大模型在各行各業(yè)的應(yīng)用,為垂直領(lǐng)域的行業(yè)大模型帶來新的機遇,。但當前再強大的通用大模型對行業(yè)專業(yè)知識的理解仍有不足,,大模型要在各個行業(yè)中真正發(fā)揮作用仍需學習更多專業(yè)知識,,垂域大模型還有許多工作要做。
沒有人會否認,,DeepSeek是繼ChatGPT之后全球人工智能領(lǐng)域最引人注目的產(chǎn)品,。某種意義上,,DeepSeek對于推動全球人工智能發(fā)展的意義要遠甚于ChatGPT,。如果說ChatGPT展示了大模型的強大,那DeepSeek則表明最強的大模型并非遙不可及,。
更低的算力成本和開源路線,是DeepSeek與ChatGPT最顯著的區(qū)別,。正是基于這兩點,DeepSeek改變了現(xiàn)有全球AI的競爭規(guī)則,。算法,、算力,、數(shù)據(jù)被稱為人工智能三要素,。自ChatGPT引發(fā)全球大模型浪潮以來,,算力的重要性不斷上升,。然而,DeepSeek重構(gòu)了這種以算力為中心的競爭規(guī)則,。通過多元專家混合的模型架構(gòu),DeepSeek V3版本的訓練成本僅為600萬美元,,顯著低于此前海外主流大模型的成本,。中國工程院院士李國杰認為,DeepSeek的創(chuàng)新不僅是技術(shù)上的突破,,也是發(fā)展模式上的顛覆性創(chuàng)新,。
更低的成本意味著降低了擁抱大模型的門檻。海爾相關(guān)負責人表示,,依托算法突破大幅降低模型的算力需求,,將極大提速大模型的產(chǎn)業(yè)化應(yīng)用進程,成為中國和中國企業(yè)贏得AI時代競爭的關(guān)鍵優(yōu)勢,。例如,,在家電行業(yè),低成本人工智能技術(shù)有望突破制造業(yè)與生成式人工智能結(jié)合的局限性,,催生基于垂域大模型賦能的新型智能制造產(chǎn)業(yè),促進智能家居及家用服務(wù)機器人同步發(fā)展,。
選擇開源路線,則進一步降低了技術(shù)普及應(yīng)用的門檻,,對全球加快構(gòu)建大模型AI產(chǎn)業(yè)生態(tài)具有重要意義,。專注“AI+教育”領(lǐng)域的青島羅博數(shù)碼科技有限公司董事長殷述軍表示,如果拿AI行業(yè)與移動互聯(lián)網(wǎng)做類比,可以說這是AI行業(yè)的“安卓時刻”,,接下來行業(yè)一定會像2012年移動互聯(lián)網(wǎng)一樣,,產(chǎn)生生態(tài)的大爆發(fā),。百度也宣布將于6月30日起正式開源下一代文心大模型,,似乎也從側(cè)面印證了DeepSeek的影響,。
種種跡象表明,,DeepSeek是全球AI發(fā)展的又一個標志性時刻,,大模型商業(yè)化落地有望提速。極視角聯(lián)合創(chuàng)始人陳碩表示,2025年將是大模型在產(chǎn)業(yè)側(cè)應(yīng)用的爆發(fā)年,。
DeepSeek火爆之后,,青島的人工智能相關(guān)企業(yè)紛紛第一時間接入DeepSeek,。根據(jù)DeepSeek提供的解釋,,接入DeepSeek是指通過API,、SDK或預訓練模型接口直接調(diào)用DeepSeek提供的現(xiàn)有服務(wù)或模型能力。從全球來看,,微軟最早宣布將DeepSeek-R1模型添加到云平臺Azure AI Foundry,,開發(fā)者可用于構(gòu)建基于云的應(yīng)用程序和服務(wù)。接著,,AWS,、英偉達,、AMD等公司相繼宣布在其AI服務(wù)平臺上部署DeepSeek-R1模型。
青島的人工智能企業(yè)緊跟行業(yè)步伐,。誕生于海爾生態(tài)的三翼鳥HomeGPT智慧家庭領(lǐng)域大模型,、卡奧斯天智工業(yè)大模型平臺、海納云安全大模型,、國創(chuàng)大模型等,,均已引入了DeepSeek的能力,為智慧家庭,、生產(chǎn)數(shù)字化,、城市應(yīng)急安全等場景賦能。海信自研的星海大模型接入DeepSeek,,在智慧生活和智慧城市領(lǐng)域為用戶帶來全新的智能交互體驗,。青島聯(lián)通也進行了模型的本地化部署,開發(fā)并上線了多個大模型智能體應(yīng)用,,有效賦能內(nèi)部營銷,、客服、財務(wù),、管理等多個環(huán)節(jié),。
盡管DeepSeek十分強大,但對專注于垂直細分領(lǐng)域的人工智能企業(yè)來說,,要真正將DeepSeek帶來的行業(yè)利好轉(zhuǎn)化為商業(yè)落地前景,,“專業(yè)”能力仍是要持續(xù)精進的核心競爭力。海納云安全大模型相關(guān)負責人介紹,,盡管DeepSeek在多個領(lǐng)域展示了其卓越的性能,,但在與應(yīng)急管理結(jié)合時仍然面臨一些難點,如算法場景適配,,應(yīng)急場景復雜多樣等,。這就要求模型兼具靈活性和準確性,此外,,應(yīng)急行業(yè)很多政策標準文件更新頻率快,,需要模型具備快速迭代和學習的能力。
今年,,羅博科技將基于DeepSeek等開源模型蒸餾訓練特定領(lǐng)域的專家模型,,在端側(cè)實現(xiàn)更好的效果和更低的成本。如果將DeepSeek等通用大模型比喻為知識面廣博的“通才”,,那垂直領(lǐng)域行業(yè)大模型則為精通某一具體行業(yè)的“專才”,。從“通才”到“專才”,,很多時候并非通過簡單地調(diào)整幾個參數(shù)或增加行業(yè)數(shù)據(jù)來實現(xiàn)的。將“通才”的能力為我所用,,開發(fā)更優(yōu)秀的“專才”是未來垂域模型的重要發(fā)力方向,,也是垂域模型的重要核心競爭力所在。
近日,,DeepSeek的出現(xiàn)引發(fā)了全球科技領(lǐng)域的廣泛關(guān)注和深入討論
2025-03-03 09:44:52中國工程院院士與DeepSeek過了一招DeepSeek近期的一系列動作,,尤其是其模型的發(fā)布,迫使OpenAI在深夜緊急推出了o3-mini,。過去半個月里,,中國AI公司在國內(nèi)外媒體上頻頻亮相,影響力持續(xù)上升
2025-02-01 13:45:38DeepSeek突圍奧秘曝光