您當前的位置 :觀察 >
朱民:發揮我國數據優勢 讓數據流起來,變成資源、資產、財富 資訊推薦
2023-02-24 20:26:42   來源:財經網  分享 分享到搜狐微博 分享到網易微博

2月24日,由《財經》雜志、《財經》智庫、財通匯聯合主辦的“第五屆全球財富管理論壇——經濟重構中的財富管理態勢”在北京舉行。中國國際經濟交流中心副理事長、IMF前副總裁朱民在會上表示:當下在ChatGPT大熱的時候,在更深的層面上考慮問題,我們要看的是大模型的發展,這是影響今天、影響未來、影響中國、影響世界的最根本的科技發展。


【資料圖】

朱民表示,從文字到圖像生成的模式,從GPT3開始,到DALLE,到DALLE2是一個突破點,從文字到圖像的過程是走的很快的。這背后一個核心的變化是人工智能從1.0走向2.0,1.0是以編程為中心,2.0是以數據為中心的,這是一個特別大的區別。

在這種情況下,產生另一個更大的變化,就是人工智能“脫虛向實”,虛就是人工智能以前是服務于虛擬世界的,搜索、資訊、信息等等,但有了大模型以后,特別生成人工智能以后,人工智能逐漸走向物理世界,在大模型的基礎上,通常走的是文字到圖像、到音頻、視頻、到三維、到蛋白,但未來是什么?在這條線以前,人工智能服務的是虛的,在這條線以后,人工智能服務是實的,是走向物理世界。第一個突破是蛋白,第二個突破是材料,這以后會走得特別厲害,這是因為在大模型的情況下,科學研究的方式發生了根本變化,我們稱之為科學研究的“第四范式”。

我們必須承認人工智能走得很快,中國在2021年第一次人工智能的論文總量超過了美國,中國在兩年前人工智能的專利超過了美國,我們趕超非常厲害。我們需要圍繞趕超的過程,圍繞AI的2.0重新制定自己的人工智能發展戰略,因為這個世界從根本上變了。第二點特別重要的,就是發揮我們的數據,人工智能三項核心的資源,算力、算法、數據。我們真正的優勢是數據。

三年以后,我們預計2025年中國的數據會超過美國,成為世界上最大的數據之國,因為物聯網,中國數據的質量也會很好,所以讓數據流起來變成資源、變成資產、變成財富,就是今天這個論壇的主題,讓數據變成生產力是我們迎接科學革命、迎接大模型的最根本的一條,只有在這個基礎上,我們才能把大模型的應用和商業化、企業化的發展結合起來,才能走上我們的趕超之路。

以下為部分發言實錄:

今天是一個經濟學家跨界的時代,我講的是ChatGPT,網上都在講它確實厲害,很驚艷,前景非常好,大家都在講怎么追隨它、怎么做自己的ChatGPT,各個網站現在討論很多,我借這個機會把我的觀察給各位嘉賓做一個匯報。

ChatGPT很有意思,很有未來,它的基礎是大模型,是GPT,它是延伸到GPT3.5的往前的一個應用。人工智能發展的核心轉移是GPT,是大模型,不是ChatGPT,我覺得這個概念特別重要,理解這一點的話,我們要把所有的工作重點、趕超的重點、研究的重點放到大模型,放到GPT上來,而不是放在ChatGPT。當然,我們應該承認,我們在ChatGPT,在大模型上落后,但是怎么發揮我們的優勢,這是在人工智能也是在中國未來科技創新,以及未來的經濟金融發展中特別重要的一戰,這確實是科技走到今天一個重大的轉折點。所以我們要跨越ChatGPT,看到大模型和AI2.0以及它的未來。

ChatGPT橫空出世,ChatGPT的出現有點像2016年阿爾法戰勝了韓國的世界冠軍一樣,引起了所有輿論的關注,它的應用場景確實很多,比如財富管理中心,每個人都要填表,要做風險測試,以后就可以用ChatGPT做風險測試,把你的偏好需求全部搞清楚,剩下的就是機器和機器交換,構造財富管理的產品,做風險管理,做整個后臺,精準度可以大大提高,產品也可以大大豐富,所以ChatGPT是一個很有意思的產品。

比如走向醫院,給你看的第一個醫生是ChatGPT,它可以把你的基本問題全部搞清楚,剩下的就是機器和機器的溝通和交流,給你做基本的解答,再加上人的輔助,做最終的解答。在這個過程中把數據全部留下來,這是了不得的事情。ChatGPT基本上是一個語言大模型,它是WebGPT的基礎,最早是教上網查詢的機器,但它主要應用了生成AI,可以不斷推演、不斷反饋,使得它的反饋學習加強,訓練加強以后,能夠把語言模型的輸出和用戶的意圖連起來,反饋和強制訓練強化一下就爆發了,這還是很厲害的。它的核心是Transformer、Transformer之后的ChatGPT1/2/3,它的核心還是在Transformer的集成,它是基于GPT3.5基礎上的應用,它的好處很多,能記住大量的信息,搜索效率真的很高,它給我做經濟學研究的文獻索引不亞于我的助理,因為它的面廣、快。

它能夠保持對話和對話的一致性,但它也能承認錯誤,與此同時,它支持多種任務,支持藝術創造、改故事。我有一次讓ChatGPT給我做翻譯,翻譯得非常優美,它可以編碼,可以寫辦公郵件,它的用途是很廣的,這就使得它特別火爆。它參加考試的話,可以考到中以上的水平,這是很不容易的,當然它有它的局限性,主要是輸入的知識的局限性,它的時間點基本停留在2021年以前,我們用最新的東西試它,就有點跟不上。

從大的應用來看,它是從2020年5月份GPT3開始,一直到DALLE生成,到ChatGPT,從大模型發展的過程中長出來的一個東西。國內也一直在做大模型,但我們是落后的,落后兩年左右,我們的生態也不夠,所以不能從大模型衍生出ChatGPT應用。歸根結底要回到什么地方呢?回到大模型,現在在ChatGPT大熱的時候,在更深的層面上考慮問題,我們要看的是大模型的發展,這是影響今天、影響未來、影響中國、影響世界的最根本的科技發展。

大模型還是從GPT3開始,1150億個變量,一路過來,我們有PanGu,我們也有百度,清華最近也出了一個GLM,現在世界上已經GPT3走到GPT4,所以大模型的發展應用是很厲害的。在大模型層面上走的最快的是深層次的人工智能,深層次人工智能能從文字轉到圖形、文字轉到編程、文字轉到影像錄像,然后走向3D,一旦走向3D就很厲害了,現在生成AI就是做蛋白質的三維結構分析,深層AI在整個大模型基礎上走,這是未來的一個特別重要的方面。

與此同時,從文字到圖像生成的模式,從GPT3開始,到DALLE,到DALLE2是一個突破點,從文字到圖像的過程是走的很快的。我剛才講對蛋白質的分析,我們可以對190萬個蛋白質用人工做三維的結構圖,大概占了我們已知蛋白質的1/100,不能小看這個數,這是一個很短的時間。再仔細想人是什么?人是蛋白質組成的,如果我們能把蛋白質全部數字化,還不能說把蛋白質合成一個人,但可以合成新的物種,所以蛋白質的應用現在也是走的特別厲害的。

這背后一個核心的變化是人工智能從1.0走向2.0,1.0是以編程為中心,2.0是以數據為中心的,這是一個特別大的區別。1.0的時候聚焦的是算法、模型、程序,是軟件工程師在主導,2.0的時候是數據,數據越多越精越好,機器自己通過數據學習反饋優化不斷生成、迭代,幾乎就是一個無限的過程,它就離開了人腦,這是大模型和2.0最大的潛力和最大的遠景,我們已經看到了人工智能可能可以離開人,從已有的智能走向一種新的智能,這個智能并沒有被人所意識到,這個事情就很有意思了。所以在這個基礎上,大模型產生的基礎模型是GPT3,現在出現因果人工智能,這是巨大的發展。最后是神經,因為一切都是神經AI的網絡,神經AI現在走得很快。我現在列的這些最新籃球模型,在整個曲線下都是在兩年到五年的階段成熟,科技的浪潮非常厲害。

在這種情況下,產生另一個更大的變化,就是人工智能“脫虛向實”,虛就是人工智能以前是服務于虛擬世界的,搜索、資訊、信息等等,但有了大模型以后,特別生成人工智能以后,人工智能逐漸走向物理世界,在大模型的基礎上,通常走的是文字到圖像、到音頻、視頻、到三維、到蛋白,但未來是什么?在這條線以前,人工智能服務的是虛的,在這條線以后,人工智能服務是實的,是走向物理世界。第一個突破是蛋白,第二個突破是材料,這以后會走得特別厲害,這是因為在大模型的情況下,科學研究的方式發生了根本變化,我們稱之為科學研究的“第四范式”。

牛頓和愛因斯坦時期科學研究的簡單方式,是通過觀察把數學模型化,這是最簡單的第一方式,第二是用模型推演,第三是用計算機仿真,這不是很成功。進入近代以后,我們發現最大的問題是你觀察到的東西沒辦法寫成數學方程式,因為維度太高,在科學研究上有一個概念叫維度的詛咒,特別是量子物理學的角度沒法計算,大模型出現以后,現在可以做1024到2048個維度,這已經不完全是個空間概念。兩千億到一萬億的變量,方程可以做到兩千億個變量,這個世界上還有什么方程是不可解的,這在根本上改變了科學研究的方式。以前是慢慢做、細細做,現在是用數據大規模做,這個世界就真的變了。

這就是為什么最近在有些領域突破特別快,生化、藥、材料,都是因為人工智能的原因。根本的科學研究的方式變了,以前科學研究是從最早的原理一步一步往前走,現在科學是從數據逆向倒推,整個思維方式根本變了。大模型現在幫助科學家人工智能進入物理學,特別在數學和材料學,現在用一個數學家和機器合作來探索新的材料,這里有很多邏輯、很多理論,就不細說了,特別是也取得了一些很有意思的進展,因為數學家的核心是把所有的一切數學化,能夠用公式表達才有應用,不能用公式表達就不能作為產品,就不能生產。做藥,最近的生物藥研究的時間短了一半,成本下降一半,就是因為大模型的幫助,從數據著手,生物進展很快。

材料,德州用大模型做耐高溫耐氧化的高熵的合金,材料科學將來會走得很快,新的材料會出來,會有無限想象的空間,它的算力如此之大,算法效率如此之高,第一次我們可以把物理世界和信息世界、虛擬世界連起來,物理世界的數字在虛擬世界經過大模型回到物理世界去操縱物理世界,這個世界真的變了。現在用的最多的是什么?戰爭,現在戰爭的電子演習已經做得很大規模和經濟化。現在由人工智能主導運營數字化的過程,因為數字的產生和迭代效率特別高,這個過程也在不斷加速自動化,而且在提升自動化的效率。

人工智能幫助管理物理世界最典型的案例,最近美國公布在核聚變取得突破性發展,人類第一次核聚變產出的電大于投入的電,我在普林斯頓讀書的時候,80年代和蘇聯合建的裝置,這個裝置做一次試驗,我們小鎮就沒有電了,做了幾十年沒有進展,這是突破的一個核心功能,等離子在磁的電里轉的時候,產生功能的時候,不能碰到地,一旦碰到電磁的地就衰退,一衰退就沒有能量,但是等離子是沒法控制的,它自由在里面轉,怎么控制呢?人想了一個別的辦法,控制外面磁的線圈,怎么控制磁的線圈呢?用人工智能。深度學習可以幫助形成一秒鐘高達幾千次的線圈位置的移動,來使得里面走的等離子不會碰到這個線圈,它是移動墻壁使里面走的人自由,而不是走的人不能碰到墻壁,這個思維方式是反過來的,結果就有了核聚變的突破。美國的目標是核聚變讓每度電一美分,如果達到這個標準,今天所有的能源世界徹底改觀。

這種對物理世界的管理和深化,影響是巨大的。大模型帶來了巨大的想象空間,特別在推動科學實驗方面空間是很大的,它對生命科學、藥物研發空間很大,材料科學空間很大,能源科學空間很大,電子工程和計算機科學空間也很大,當然環境地球空間就更大了。大模型現在變成了工程學,變成了一個輔助工具,變成了我們今天所有一切超高級、超高速效率的輔助工具,世界在這個基點上變了。

我們必須承認人工智能走得很快,中國在2021年第一次人工智能的論文總量超過了美國,中國在兩年前人工智能的專利超過了美國,我們趕超非常厲害。我們需要圍繞趕超的過程,圍繞AI的2.0重新制定自己的人工智能發展戰略,因為這個世界從根本上變了。第二點特別重要的,就是發揮我們的數據,人工智能三項核心的資源,算力、算法、數據。我們真正的優勢是數據。

三年以后,我們預計2025年中國的數據會超過美國,成為世界上最大的數據之國,因為物聯網,中國數據的質量也會很好,所以讓數據流起來變成資源、變成資產、變成財富,就是今天這個論壇的主題,讓數據變成生產力是我們迎接科學革命、迎接大模型的最根本的一條,只有在這個基礎上,我們才能把大模型的應用和商業化、企業化的發展結合起來,才能走上我們的趕超之路。

好,這就是我的簡短匯報,謝謝大家!

關鍵詞:


[責任編輯:ruirui]






本站違法和不良信息舉報 聯系郵箱: 58 55 973@qq.com
 

關于我們| 客服中心| 廣告服務| 建站服務| 聯系我們
 

中國焦點日報網 版權所有 滬ICP備2022005074號-20,未經授權,請勿轉載或建立鏡像,違者依法必究。