火遍全球的DeepSeek科學(xué)家是怎么用它的,。過年期間爆火的DeepSeek是一家專注于開發(fā)先進(jìn)大語言模型和相關(guān)技術(shù)的創(chuàng)新型科技公司,,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,。在硅谷,,DeepSeek被稱作“來自東方的神秘力量”。2024年底,,DeepSeek發(fā)布了新一代大語言模型V3,,隨后在2025年1月20日推出了開源模型R1,再次引發(fā)全球關(guān)注,。R1模型通過純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,,發(fā)布后在全球范圍內(nèi)掀起熱潮,在中國區(qū)和美國區(qū)蘋果AppStore免費(fèi)榜均位列首位,,超越了包括ChatGPT在內(nèi)的多個(gè)知名AI產(chǎn)品,。
火遍全球的DeepSeek:科學(xué)家是怎么用它的?創(chuàng)新技術(shù)引領(lǐng)未來方向
阿里云,、百度智能云,、華為云、騰訊云等國內(nèi)四大云巨頭以及海外的亞馬遜AWS,、微軟Azure等云巨頭都已正式支持DeepSeek,。春節(jié)期間,多家國產(chǎn)芯片廠商也積極響應(yīng),,如天數(shù)智芯,、摩爾線程等宣布支持DeepSeek模型。GiteeAI聯(lián)合沐曦還首發(fā)了全套DeepSeek-R1千問蒸餾模型,,實(shí)現(xiàn)了從芯片到平臺,,從算力到模型的全國產(chǎn)研發(fā)、中國制造。
DeepSeek不僅在技術(shù)上表現(xiàn)出色,,在市場上也取得了巨大成功,。這款由中國的深度求索公司研發(fā)的大型語言模型擁有強(qiáng)大的自然語言處理能力,能夠理解并回答問題,,還能輔助寫代碼,、整理資料和解決復(fù)雜的數(shù)學(xué)問題。與OpenAI開發(fā)的Chat-GPT相比,,DeepSeek以更低的成本達(dá)到了相似甚至更好的效果,,引發(fā)了廣泛討論。DeepSeek代表了AI的未來方向——更懂人話,,更會思考,,并且擅長個(gè)性化發(fā)揮,被稱為“全能型AI助手”,。
隨著DeepSeek掀起新一輪AI熱潮,,業(yè)內(nèi)人士認(rèn)為它將推動AI實(shí)現(xiàn)“平民化”。正如蘋果iPhone改變了人們的生活方式,,DeepSeek將通過開源系統(tǒng)讓更多開發(fā)者開發(fā)出有用的AI應(yīng)用場景,,使AI走入普通人的生活。AI開源初創(chuàng)公司HuggingFace聯(lián)合創(chuàng)始人Thomas Wolf表示,,下一步將是建立在這些模型之上的應(yīng)用,,讓模型在應(yīng)用層面變得有用,從而完成現(xiàn)實(shí)中的任務(wù),,讓人們在生活中受益,。
然而,DeepSeek的成功也引起了某些勢力的注意,。1月30日凌晨,,針對DeepSeek線上服務(wù)的攻擊烈度突然升級,至少有2個(gè)僵尸網(wǎng)絡(luò)參與了攻擊,。中國常駐聯(lián)合國代表傅聰對此表示:“永遠(yuǎn)不要低估中國科研人員的聰明才智,。DeepSeek引發(fā)全球轟動和一些人的焦慮恐慌,說明技術(shù)遏制和技術(shù)限制無法奏效,?!?/p>
DeepSeek之所以讓美國感到緊張,主要因?yàn)樗哂懈咝詢r(jià)比,、模式創(chuàng)新和顯著的進(jìn)步,。DeepSeek的出現(xiàn)打破了美國大模型的壟斷地位,降低了行業(yè)門檻,,并通過創(chuàng)新的數(shù)據(jù)處理方法優(yōu)化了算力,,提升了模型性能。這不僅沖擊了美國的技術(shù)優(yōu)勢,,也引發(fā)了美國高新技術(shù)人員的擔(dān)憂,。根據(jù)報(bào)告,2024年國內(nèi)大模型的能力進(jìn)步顯著,,國內(nèi)外差距大幅縮小,。這表明DeepSeek的成功是中國國內(nèi)大模型整體發(fā)展的階段性成果。