據(jù)國外媒體報道,,在近日舉行的2024年Databricks Data + AI峰會上,,英偉達創(chuàng)始人、CEO黃仁勛與Databricks的聯(lián)合創(chuàng)始人,、CEO阿里·戈德西(Ali Ghodsi)進行了一場精彩對話,。雙方的對話展示了人工智能和數(shù)據(jù)處理技術在現(xiàn)代企業(yè)中的重要性和發(fā)展趨勢,強調(diào)技術創(chuàng)新,、數(shù)據(jù)處理能力和能源效率在推動企業(yè)轉型和行業(yè)發(fā)展中的關鍵作用,。
黃仁勛在對話中展望了數(shù)據(jù)處理和生成式人工智能的未來。他指出,,每家公司的業(yè)務數(shù)據(jù)都如同一座未被充分挖掘的金礦,,盡管蘊藏著巨大的價值,,但要從中提取深刻的洞察力和智能一直是一項艱巨的任務。
黃仁勛還談到開源模型如Llama和DBRX正推動企業(yè)轉型為AI公司,,激活全球AI運動,,促進技術發(fā)展和企業(yè)創(chuàng)新。通過這次英偉達與Databricks的合作,,兩家公司將攜手發(fā)揮各自在加速計算和生成式人工智能領域的專長,,共同為用戶帶來前所未有的好處。
以下為對話實錄:
主持人:我非常激動地向大家介紹下一位嘉賓,,他是一位無需任何介紹的杰出人物--全球獨一無二的“搖滾巨星”CEO——英偉達CEO黃仁勛,。請上舞臺。非常感謝你的到來,!我想先從英偉達令人矚目的業(yè)績談起,,貴公司市值高達3萬億美元。五年前你是否曾想過世界會如此迅速地演變,,展現(xiàn)出今天這樣一幅令人矚目的景象?
黃仁勛:當然,!我從最初就預料到會這樣,。
主持人:真是令人贊嘆。能否為臺下的CEO們提供一些建議,,我們應該如何實現(xiàn)目標,?
黃仁勛:無論你決定做什么,我的建議是不要涉足圖形處理器(GPU)的研發(fā),。
主持人:我會告訴團隊我們不打算涉足這個領域,。我們今天花費了許多時間深入討論了數(shù)據(jù)智能的深遠意義。企業(yè)手中握有海量的專有數(shù)據(jù),,這些數(shù)據(jù)是構建定制化人工智能模型的關鍵,。這些數(shù)據(jù)的深度挖掘與應用對我們至關重要。你是否也注意到了這一行業(yè)趨勢,?是否認為我們應當在這一領域加大投入,?你是否收集到了業(yè)界對此問題的聲音和洞見?
黃仁勛:每家企業(yè)都像擁有一座金礦,,掌握著豐富的業(yè)務數(shù)據(jù),。如果你的公司提供了一系列服務或產(chǎn)品,并且客戶對這些服務和產(chǎn)品感到滿意,,同時提供了寶貴的反饋,,那么你已經(jīng)積累了大量有價值的數(shù)據(jù)。這些數(shù)據(jù)可能涉及客戶信息,、市場動態(tài)或供應鏈管理,。長期以來,,我們都在收集這些數(shù)據(jù),擁有龐大的數(shù)據(jù)量,,但直到現(xiàn)在,,我們才真正開始從中提煉出有價值的洞見,甚至是更高層次的智能,。
目前,,我們對此充滿激情。我們在芯片設計,、缺陷數(shù)據(jù)庫,、新產(chǎn)品和新服務的創(chuàng)造,以及供應鏈管理中都運用了這些數(shù)據(jù),。這是我們首次采用以數(shù)據(jù)處理和精細化分析為起點的工程流程,,通過構建學習模型,然后部署這些模型,,并與數(shù)據(jù)收集的Flywheel平臺相連,,以獲取更多的數(shù)據(jù)。我們公司正通過這種方式,,使我們能夠躋身于世界上最大的公司之列,。這當然得益于我們公司大量采用人工智能技術,這些技術幫助我們完成了眾多令人矚目的成就,。我相信,,每家公司都在經(jīng)歷這樣的變革,因此,,我認為我們正處在一個非凡的時代,。這個時代的起點是數(shù)據(jù),以及對數(shù)據(jù)的積累和有效利用,。
01開源與閉源的和諧共存
主持人:這真是太令人贊嘆了,,非常感謝。目前,,關于閉源模型與開源模型之間的辯論正逐漸升溫,。開源模型是否能夠迎頭趕上?兩者是否能夠共存,?或者最終是否會被一個單一的閉源巨頭所主導,?你對整個開源生態(tài)系統(tǒng)有何看法?它在大語言模型的發(fā)展中扮演了怎樣的角色,?未來又將如何發(fā)展,?
黃仁勛:我們需要前沿的模型,尤其是那些能夠開拓視野的先進模型,。OpenAI和谷歌在這方面的工作至關重要,,它們不僅拓展了技術邊界,,還幫助我們探索了新的可能性。然而,,如果審視今年的情況,,可能最重要的事件都與開源緊密相關,比如Llama 2,、Llama 3,、Mistral,以及Databricks團隊所開展的DBRX項目,。DBRX確實是非??岬某晒K目嶂幵谟?,它激發(fā)了每一家企業(yè)的活力,,使得任何一家公司都有可能轉型為一家人工智能公司。你一定也注意到了這一點,,我們在全球范圍內(nèi)都看到了這樣的趨勢,。我們最近將Llama 3轉化為了一個推理微服務,并且現(xiàn)在可以下載使用,。你可以訪問Hugging Face,,當然還有Databricks,現(xiàn)在它已經(jīng)被全球數(shù)百家公司所采納,。
這充分說明了開源激發(fā)了每一家公司的潛力,,讓它們有機會成為人工智能領域的一份子,。在英偉達,,我們廣泛地使用開源模型,并結合我們自己的數(shù)據(jù)和技能,,對它們進行微調(diào)和訓練,。如果沒有開源,就不會有這場激勵全球每一家公司向人工智能轉型的運動,。我認為,,這無疑是一件具有重大意義的事情。
主持人:確實,,這是一個令人贊嘆的發(fā)展,。開源與閉源模型將共存,我們確實需要這兩種模式,。您提到的Nim框架,,即Nims,正是我們所關注的,。我非常興奮地在這里宣布,,我們將把DBRX集成到Nims中,,并在Databricks平臺上提供服務。事實上,,我們未來開發(fā)的所有新模型也將采用這種方式,。我們對Nims的前景充滿期待。
黃仁勛:創(chuàng)建大型語言模型API的過程確實是一項技術挑戰(zhàn),。盡管這些模型在當前看來可能不算龐大,,但它們在計算上依然非常復雜,技術棧涉及眾多依賴項,。為此,,我們開發(fā)了英偉達推理微服務Nim,它整合并優(yōu)化了所有必要的依賴項,。英偉達擁有專業(yè)的工程師團隊,,他們專注于這一領域,將復雜的技術封裝成易于使用的微服務,。用戶可以在Databricks平臺上輕松使用這一服務,,也可以下載并根據(jù)需要進行個性化微調(diào)。英偉達NeMo(更新版本的神經(jīng)模塊)微服務提供了這種靈活性,,確保它能夠在任何云環(huán)境或本地環(huán)境中運行,,真正實現(xiàn)了無處不在的人工智能能力。
主持人:這確實是一項令人贊嘆的技術,。能夠在本地部署運行的能力尤為突出,,它意味著我們不再完全依賴云服務,這無疑是一項巨大的進步,。在與客戶的交流中,,我們發(fā)現(xiàn)他們正致力于培養(yǎng)內(nèi)部專業(yè)技能,以定制模型并獲得競爭優(yōu)勢,。對于這一現(xiàn)象,,你有何看法?
黃仁勛:我認為,,未來的趨勢是,,正如我們今天所見證的,我們已經(jīng)能夠?qū)缀跛蓄愋偷男畔⒑蛿?shù)據(jù)進行標記化處理,。我們能夠提取其結構,、理解其內(nèi)涵,并學習其表示,,無論是聲音,、語言、圖像,、視頻,,還是化學物質(zhì),、蛋白質(zhì),甚至是機器人的動作控制或駕駛操作,,我們都能夠進行標記化,。由于云數(shù)據(jù)中心正在生產(chǎn)這些標記,我們實際上是在制造一些前所未有的獨特產(chǎn)品,。這是首次,,我們擁有了被稱為人工智能超級計算機的工具,它們在專門為此目的設計的工廠中生產(chǎn)標記,,我們大規(guī)模生產(chǎn)智能的能力是一項全新的技術,。這也是我堅信我們正處于一場新工業(yè)革命的開端的原因之一,這場革命不是生產(chǎn)電力,,而是生產(chǎn)智能,。
當然,每家公司在其核心都是關于特定領域的智能,。在數(shù)據(jù),、數(shù)據(jù)處理、人工智能及其基礎設施方面,,很少有公司能比Databricks擁有更深入的了解,。我們專注于我們的專業(yè)領域,我們的基礎是這種特定領域的智能,,無論是金融服務還是醫(yī)療保健等各個領域,。最終,我們所有人都將成為智能制造商,。
如果你今天要成為智能制造商,,你將來會有人工智能領域的人力資源,我們稱之為人工智能工廠,。因此,,每個公司都必須開始這一進程,。我們正在這樣做,,你也將這樣做。我們觀察到,,無論公司規(guī)模大小,,它們都在朝著這個方向努力。因此,,在未來,,我們所有人都將參與到這一進程中。你將從你的特定領域數(shù)據(jù)開始,,這些數(shù)據(jù)存儲在Databricks的某個地方,,你將處理這些數(shù)據(jù),,提煉并從中提取智能,然后將其放入Flywheel平臺中,,你將擁有一個人工智能工廠,。
02加速計算與生成式AI的融合
主持人:這確實是一項令人贊嘆的成就,我對此深信不疑,。我們對此充滿熱情,,尤其是在數(shù)據(jù)處理方面。我們Databricks每天處理的數(shù)據(jù)量極為龐大,,大約每天4000萬億字節(jié),。
黃仁勛:這無疑是目前地球上最大的計算需求之一,也就是所謂的數(shù)據(jù)處理,。事實上,,幾乎每一家企業(yè)都在進行這項工作。
主持人:確實,,數(shù)據(jù)處理的高并行性使其成為我們重復執(zhí)行相同操作的理想領域,。我對于我們能夠攜手合作,將GPU加速技術引入數(shù)據(jù)處理充滿期待,。我們致力于在核心數(shù)據(jù)處理領域?qū)崿F(xiàn)與AI模型相媲美的革命性進步,。我們對與您攜手,利用GPU加速技術優(yōu)化我們的Photon引擎,,以邁入將GPU應用于核心數(shù)據(jù)處理的新時代感到無比激動,。目前,這些龐大的工作流程不得不依賴CPU來執(zhí)行,,我們期望它們也能在Nvidia GPU上高效運行,。
黃仁勛:順便提一下,這是一個重大的消息:當今計算領域的兩大關鍵趨勢--加速計算和生成式人工智能,,Nvidia和Databricks將強強聯(lián)合,,匯聚我們在這些領域的專業(yè)技能,將這些前沿技術帶給每一位用戶,。數(shù)據(jù)處理的加速雖然在技術上極具挑戰(zhàn),,但我們已經(jīng)投入了五年的時間,不懈努力,,終于開發(fā)出了能夠顯著提升Photon性能的庫,。這是我們長期努力的成果,現(xiàn)在我們將使Photon加速,,讓數(shù)據(jù)處理變得更加迅速,、成本效益更高,并且非常重要的是,顯著降低能源消耗,。
主持人:這確實是一個意義深遠的進展,,它在邏輯上非常合理。盡管數(shù)據(jù)處理過程復雜且充滿特殊情況,,但由于其高度的可并行性,,我們實際上并不需要通用的計算能力。我們面對的是重復性極高的操作,,處理的是龐大的數(shù)據(jù)集,,而不是獨一無二的數(shù)據(jù)。因此,,我對這項技術充滿期待,,它不僅具有顛覆現(xiàn)狀的能力,還將大幅提升性能,,降低成本,,這無疑將帶來令人驚嘆的變革。
黃仁勛:當我們能夠迅速處理海量數(shù)據(jù)時,,研究人員便有可能在某個清晨醒來,,突發(fā)奇想地說:“讓我們收集互聯(lián)網(wǎng)上的所有數(shù)據(jù)來訓練一個龐大的模型,因為現(xiàn)在這已不再是耗時費力的工作,?!比舴羌铀儆嬎慵夹g的發(fā)展,人們不會考慮這樣的想法,,因為那將成本高昂且耗時漫長,。但現(xiàn)在,這已成為可能,,我們能夠以更低的成本和更高的效率處理前所未有的數(shù)據(jù)量,。這將激發(fā)出無限的創(chuàng)新思維,比如:“讓我們利用公司的全部數(shù)據(jù)來訓練我們的超級人工智能,,”這樣的日子即將到來,。
03開啟智能服務的新篇章
主持人:的確,將整個互聯(lián)網(wǎng)的數(shù)據(jù)進行處理,,這曾是一個只存在于科幻小說中的概念,。我們曾認為這是不可能實現(xiàn)的,直到硬件和基礎設施發(fā)展到足夠先進的水平,,使得我們能夠?qū)夹g進行專門化處理,。如今,,這已成為現(xiàn)實,,每個人都在參與其中。讓我們轉向另一個話題,。生成式人工智能的蓬勃發(fā)展確實令人矚目,。起初,,眾多企業(yè)以聊天機器人為起點,致力于開發(fā)和定制基于自身數(shù)據(jù)的聊天機器人,。然而,,目前我們觀察到人們正逐步拓展至更多尖端的應用場景。展望未來,,人工智能的哪些新應用最令你感到興奮,?
黃仁勛:在所有潛在影響中,客戶服務可能是最為深遠的領域,。對于在座的每家企業(yè)而言,,客戶服務涉及的開支高達數(shù)萬億美元,橫跨每一個行業(yè),,每一家企業(yè),。聊天機器人在客戶服務中的應用,其重要性不僅在于自動化能力,,更在于其對數(shù)據(jù)飛輪的貢獻,。企業(yè)需要捕捉對話,將客戶互動納入數(shù)據(jù)體系,,這無疑將產(chǎn)生大量數(shù)據(jù),。目前,數(shù)據(jù)量的增長速度大約是每五年增加十倍,。鑒于客戶服務的推動,,我預計未來數(shù)據(jù)量的增長速度可能達到每五年百倍。我們將把所有元素整合入數(shù)據(jù)飛輪,,它將收集更多數(shù)據(jù),,提煉更深層次的洞察,從而提取更精準的智能信息,,提供更優(yōu)質(zhì)的服務,,甚至實現(xiàn)在問題出現(xiàn)前的主動預防和解決,類似于預防性維護,,我們將實現(xiàn)主動式客戶支持,,這將進一步推動數(shù)據(jù)的生成和飛輪的旋轉。因此,,我認為客戶服務將是大多數(shù)公司實現(xiàn)超級加速的關鍵,,尤其是考慮到它將收集的數(shù)據(jù)量。
我們已經(jīng)實現(xiàn)了對一切事物的數(shù)字化標記,,我對我們在化學,、蛋白質(zhì)、碳捕獲材料、酶,、以及創(chuàng)新電池等領域的進展感到興奮,。我們還利用生成式人工智能實現(xiàn)了區(qū)域天氣預報的精確度,在以往,,這需要超級計算機的計算能力才能達到,。物流、保險,、以及保護人們免受傷害的能力都將因此得到提升,。
此外,生成式人工智能在物理,、生物領域,,以及3D圖形、數(shù)字孿生,、視頻游戲虛擬世界構建等方面也展現(xiàn)出巨大潛力,。如果貴公司尚未涉足生成式人工智能,那可能是因為尚未充分關注,。事實上,,它已經(jīng)滲透到了每一個行業(yè)。
主持人:我完全贊同你的觀點,,人工智能的應用無疑將遍布各個領域,,這不僅合理,更充滿無限可能,,令人充滿期待,。面對這些新興的前沿領域,我們對數(shù)據(jù)的需求正日益增長,。關于如何幫助企業(yè)實現(xiàn)更可持續(xù)的人工智能發(fā)展,,您有何看法?
黃仁勛:可持續(xù)性可以從多個角度來考量,,尤其是與能源相關的方面,。值得注意的是,人工智能本身并不挑剔其“學習”的地點,。我們沒有必要將人工智能的訓練數(shù)據(jù)中心設立在那些電網(wǎng)已經(jīng)承受壓力的人口密集區(qū)域,。恰恰相反,我們可以將它們安置在能源充足且分布均勻的地區(qū),。全球能源資源十分豐富,,關鍵在于如何合理分配和利用。因此,,我認為這是我們首次有機會捕獲并利用那些過剩的能源,,將其轉化為人工智能模型的動力,,并最終將這些智能成果回饋給社會,服務于我們的實際需求,。
另一個重要的視角是,,人工智能的核心不僅僅在于模型的訓練,,更在于其推理和生成能力,。我們訓練模型的最終目的是為了應用它們。當我們著眼于人工智能的長期效益時,,以我先前提及的利用人工智能進行天氣預報為例,,我們不再需要每次都從頭開始模擬物理定律,而是可以通過人工智能來生成預測結果,。這種方法不僅縮短了預測時間,,提高了預測精度,更在能源消耗上實現(xiàn)了數(shù)千倍的降低,。
此外,,人工智能的縱向效益還體現(xiàn)在其他方面,例如通過一次性訓練模型來設計手機芯片,,從而為所有用戶節(jié)省能源,。我相信,隨著時間的推移,,人工智能將展現(xiàn)出其在節(jié)能方面的潛力,。
最后,關于生成式人工智能,,今天的計算體驗大多是基于檢索的,。每次我們點擊手機,雖然看似消耗的能量不多,,但實際上它激活了全球的API,,檢索信息,點亮了互聯(lián)網(wǎng),,然后從不同的數(shù)據(jù)中心收集少量信息,,通過推薦系統(tǒng)呈現(xiàn)給我們。未來,,隨著設備上運行的小語言模型變得更加上下文化和生成化,,互聯(lián)網(wǎng)流量將大幅減少,計算將更多地即時生成,,這將極大地節(jié)省能源,,使計算模型發(fā)生根本性轉變。
通過這種方式,,我們不僅能夠節(jié)省大量能源,,還能更高效地獲取答案,。這將徹底改變我們的計算方式,使我們能夠更快地提出問題,,得到答案,,從而激發(fā)出更多有趣的問題。這種與人工智能合作的未來,,將是一個充滿提示和啟發(fā)的新時代,。
主持人:是的,未來非常激動人心,。好的,,我最后一個問題是,我們?nèi)绾螏椭蛻?,也就是在座的各位,,今天就開始行動?最好的方法是什么,?
黃仁勛:我之前提到過,,我認為Databricks從數(shù)據(jù)處理擴展到數(shù)據(jù)治理,再到數(shù)據(jù)存儲,,然后將其縱向擴展到從數(shù)據(jù)中提取智能,,這一轉變是非常有遠見的。我未能記起她的名字,,但毫無疑問,,那位“Cookie女士”的工作表現(xiàn)極為出色。是Casey吧,?請別讓她被其他公司挖走,,她剛才在后臺的演示確實令人印象深刻。我被她的演示深深吸引,,盡管在后臺有許多交流的機會,,但我個人更傾向于全神貫注地觀看她的演示。她對數(shù)據(jù)智能平臺的掌握和展示技巧,,無疑值得我們的高度贊揚和尊重,。我認為這個平臺非常了不起,你們讓人們更容易地管理數(shù)據(jù),、提取信息,、處理數(shù)據(jù)。數(shù)據(jù)整理在模型訓練中仍然是一個非常重要的部分,。人們談論模型訓練,,但在訓練模型之前,你必須弄清楚哪些數(shù)據(jù)是正確的,。這關乎數(shù)據(jù)質(zhì)量,、數(shù)據(jù)格式,、數(shù)據(jù)準備。所以,,我認為開始的方式是來到Databricks,,使用Databricks的數(shù)據(jù)智能平臺。我說的對嗎,?
主持人:完全正確,。
黃仁勛:確實,沒有人會反對將他們的平臺命名為DIP,,即數(shù)據(jù)智能平臺(Data Intelligence Platform),。這個名稱既響亮又富有內(nèi)涵,,我對此十分贊賞,。它與Nims一樣,都是令人印象深刻的命名,。你完全可以同時使用這兩者,,無需做出選擇。獲取一個Nims加上DIP,,我完全贊同這種結合使用的方式,,這是一個明智的策略。
無論你計劃做什么,,關鍵在于立即開始行動,。你必須積極參與進來,投身于這趟迅猛發(fā)展的列車之中,。切記,,生成式人工智能正以指數(shù)速度增長,你不應僅僅觀望或等待,。指數(shù)趨勢的發(fā)展速度是驚人的,,幾年之內(nèi),落后者將被遠遠拋在后面,。因此,,立即加入這場技術革命,隨著技術的不斷進步,,你也將隨之學習和成長,。這正是我們所采取的行動方式。
這是一個不應通過旁觀來學習的過程,,你不能僅通過閱讀來掌握它,,真正的學習來自于親身實踐。正如我們所做的,,全身心投入其中,。
主持人:非常感謝,。這是一條寶貴的建議。過去十年的合作令人難忘,,感謝你所做的一切,。我們一直是出色的合作伙伴,期待與Databricks共同迎接下一個十年的輝煌,。
美國英偉達公司的創(chuàng)辦人及CEO黃仁勛訪問臺灣,此行引發(fā)臺灣地區(qū)的高度關注,,他的言論成為媒體聚焦點
2024-06-07 18:12:09黃仁勛妄稱臺灣為“國家”6月7日,阿里云在技術博客上宣布了一個重要進展:他們發(fā)布了名為Qwen2-72B的開源模型,,這款模型在全球范圍內(nèi)以其卓越的性能脫穎而出
2024-06-07 10:49:47阿里云發(fā)布開源模型Qwen2