- 熱門推薦
瑞見——投資人說
2024年07月08日
瑞見——動態(tài)
2024年07月08日
瑞見——動態(tài)
2024年07月08日
瑞見——投資人說
2024年07月08日
瑞見——動態(tài)
2024年07月08日
瑞見——投資人說
2024年07月08日
瑞見——瑞鵬行研
瀏覽次數(shù):1268
發(fā)布時間:2024-07-08
返回列表
最后的半子
瑞鵬資產(chǎn) 戴勝藍
(一)
機器學習先驅(qū)者Rich Sutton在2019年發(fā)表了《苦澀的教訓》,Rich Sutton認為,從長遠來看,對AI的訓練使用通用計算方法往往比直接灌輸人類經(jīng)驗知識的特定方法更加有效。它揭示了過去人工智能研究中的一個關鍵誤區(qū):過度依賴人類設計的特定領域知識和規(guī)則,而忽視了通用計算和大規(guī)模學習的長遠深度和力量。后來,《苦澀的教訓》被OpenAI的工程師們奉為“圣經(jīng)”。結(jié)合AI的發(fā)展歷史,從早期的專家系統(tǒng),到SVM及其核方法,再到深度神經(jīng)網(wǎng)絡,以及現(xiàn)在的大語言模型,工程師們已逐步認知到這個教訓,走出誤區(qū)。1934年10月,由于王明、博古等同志“左”傾冒險主義的錯誤領導,加之外部敵強我弱,中央革命根據(jù)地第五次反“圍剿”遭到失敗,紅軍第一方面軍(中央紅軍)主力開始長征。但在出發(fā)之前,沒有人明確知道該往哪兒走、走多遠、走到何時休。只是基本確定向西與紅二、六軍團會合。年輕的教員同志因受到排擠,差點沒有被允許加入長征隊伍。在一路反復的戰(zhàn)術錯誤之后,中央紅軍付出了極其慘重的代價,從長征出發(fā)時的8.6萬人銳減到3萬余人。1935年1月,中央政治局在遵義召開了擴大會議,將教員同志增選為中央政治局常委,并以其杰出的遠見和正確的主張被認可為新的領導人。敵人40萬重兵已在長江沿線布下,勢要將中央紅軍圍困,徹底一鍋端。《苦澀的教訓》強調(diào),從長遠來看,依靠大規(guī)模計算和通用學習方法的AI系統(tǒng)將更具優(yōu)勢。這使系統(tǒng)不受限于特定領域的規(guī)則和知識,能夠通過海量數(shù)據(jù)和自我優(yōu)化,不斷提升自我性能。早期的AlphaGo結(jié)合了人類棋譜數(shù)據(jù)和深度學習、蒙特卡羅樹搜索算法——它是依賴人類專家經(jīng)驗和策略知識進行訓練的典型成功案例。2016年,AlphaGo擊敗了世界圍棋冠軍李世石,展示了人類知識結(jié)合機器學習的強大能力。DeepMind的二代產(chǎn)品AlphaZero,完全不依賴任何人類玩家的數(shù)據(jù)或先驗知識,只利用深度神經(jīng)網(wǎng)絡來預測每個游戲狀態(tài)的價值和最優(yōu)行動,然后通過自我對弈的方式進行訓練,利用強化學習算法不斷優(yōu)化策略。在比AlphaGo更短的訓練時間內(nèi),AlphaZero在包含圍棋在內(nèi)的各種棋類游戲中都取得了超過AlphaGo在圍棋領域的成績。并且AlphaZero所使用的訓練數(shù)據(jù)量遠小于AlphaGo。語音識別技術最早起源于20世紀50年代的美國貝爾實驗室,過去的語音識別訓練依賴于手工設計的特征提取和規(guī)則,結(jié)合隱馬爾可夫模型等統(tǒng)計方法。這類訓練需要工程師們預先對語音特征和語言模型的深入理解和設計,效率非常低下。現(xiàn)代語音識別系統(tǒng)采用深度學習,通過大規(guī)模數(shù)據(jù)訓練、卷積神經(jīng)網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡,完全脫離工程師對語言模型的手工特征設計。當前的語音識別系統(tǒng)可以在上百個語言和環(huán)境下流暢運行,且顯著提升了識別準確率和適應性。訓練效率指數(shù)增長。急功近利的自動駕駛廠商將自動駕駛的訓練依賴于人工設計的規(guī)則和特征,如路徑規(guī)劃、雷達和傳感器數(shù)據(jù)處理等。這類自動駕駛技術在簡單和受控環(huán)境中非常有效,但在復雜和動態(tài)環(huán)境中可能造成未知后果。長期主義的自動駕駛廠商通過深度學習模型進行端到端訓練,從大量駕駛數(shù)據(jù)中自動學習駕駛行為和環(huán)境理解。長期來看,這類訓練將有望推動自動駕駛系統(tǒng)在處理幾乎所有道路環(huán)境中交出完美答卷。人類積累數(shù)百萬年的知識,可能抵不過大模型毫秒級的運算決策。如果通用大模型可以通吃一切,那么站在時間延長線上看人類當下的文明史,依靠人類經(jīng)驗和知識快速成長的垂直AI,是否會成為偽命題?短期內(nèi),垂直細分領域的AI應用通過整合人類的知識和經(jīng)驗,能夠迅速取得顯著成果。在特定領域,這類AI系統(tǒng)可以在有限的任務范圍內(nèi)表現(xiàn)得非常出色,如醫(yī)學影像分析、工業(yè)自動化、量化交易等。由此可見,垂直細分領域的AI仍然具有價值,因為它們可以快速解決實際問題,帶來直接收益。有收益才能吸引更多的人才進入,才能反哺通用大模型的訓練。但從長期來看,依靠通用大模型的AI系統(tǒng)的確會表現(xiàn)出更強的適應性和效率,這與《苦澀的教訓》觀點一致。隨著技術、算力和清潔能源的發(fā)展,通用模型的優(yōu)勢將越來越明顯。AI研究和應用需要在短期收益與長期潛力之間找到平衡,才能推動技術和應用的更優(yōu)結(jié)合與迭代。偉大的馬克思主義哲學早就解釋了這一段AI發(fā)展史:“量變與質(zhì)變、辯證與統(tǒng)一”。我不知道AI怎么看世界,但從數(shù)理上說,世界一定程度上是一個隨機性和波動性的組合,宇宙也是。在量子物理中,基本粒子的行為表現(xiàn)出本質(zhì)的隨機性。這意味著,即便我們知道所有的初始條件,也無法精確預測一個量子系統(tǒng)的未來狀態(tài)。從更大尺度去看,現(xiàn)代宇宙學模型一直在試圖研究宇宙中暗物質(zhì)和暗能量的作用,以及宇宙的加速膨脹現(xiàn)象,其底層邏輯都是想要解釋宇宙在大尺度上的動態(tài)變化和不確定性。人類處于這樣一個狹小的三維空間中,幾乎沒有任何對抗宏觀尺度隨機性和波動性的能力,只能在相對平整的安全時間周期中生存、繁衍。依靠碳基生物自身的條件和有限的生命時長,想要去搞清楚微觀粒子或宇宙尺度的隨機性和波動性,我看不到任何可能。世界本身的隨機性就是對人類文明進步甚至生存的最大干擾。但是超級通用人工智能可以處理和過濾大量的干擾和波動,找出隱藏在背后的模式和規(guī)律,或許將大幅度提升人類處理復雜問題的能力,幫助人類更好地理解和應對復雜系統(tǒng)中的不確定性和波動性。長遠來看,這是否必將強化我們面對未知事件的脆弱,增強文明長久生存的概率?因為超級通用人工智能的出現(xiàn),本身就是一件巨大的隨機性和波動性事件。當人類面對一個毫秒級運算就能碾壓你所有知識的強大存在,還有何勝算?盡管迄今為止無人知曉造物主的動機和設計機制,但好在這位偉大的神并未像設計其他抽象物體一樣設計人類。遵義會議之后,中央紅軍只有16個團、3.5萬人。而敵軍調(diào)集了中央軍薛岳兵團和黔軍全部,滇軍主力和川、湘、桂軍各一部,總兵力達到150個團、40萬人。川黔地區(qū)地形復雜,山高水深,對于機械化幾乎為零的中央紅軍來說,交通條件險惡萬分。此外,中央紅軍面臨糧食、藥品和武器彈藥等物資的極度短缺,無從補給。遵義會議后,如何團結(jié)內(nèi)部力量、制定正確戰(zhàn)略、鞏固領導地位、重塑革命信念,更是擺在教員同志面前無比棘手的難題。絕境之下,教員同志展現(xiàn)出了超凡的軍事才能和智慧。通過巧妙的戰(zhàn)略布局和靈活機動,不斷變換作戰(zhàn)方向,充分利用地形和敵情,隱藏真實意圖,迷惑、牽制敵軍,打亂其部署,選擇有利于己方的戰(zhàn)場進行戰(zhàn)斗,奪取戰(zhàn)略主動。最后,教員同志打出了震古爍今的“四渡赤水”戰(zhàn)術,一舉將紅軍帶離絕境,前往陜北甘南地區(qū)建立新的革命根據(jù)地,至此展開了中國革命運動波瀾壯闊的新畫卷。新中國成立后,面對越過三八線的美軍,面對國內(nèi)一片畏戰(zhàn)之聲,面對中美兩國實力的巨大差距,教員同志高瞻遠矚,力排眾議,人民志愿軍義無反顧奔赴前線,迎擊來犯之敵。1950年,美國GDP約為3000億美元,中國250億美元。美國鋼產(chǎn)量8700萬噸,石油5.4億桶,中國鋼產(chǎn)量60萬噸,石油3萬桶。美國參戰(zhàn)3000輛坦克,1500架飛機,外加11艘航母、大量驅(qū)逐艦和巡洋艦。中國僅有100輛坦克,200架飛機。美國有強大的后勤保障、先進的補給和醫(yī)療體系、快捷且強大的??者\輸、投送能力。中國只有少量卡車和純?nèi)肆Α?/span>我相信,再強大的通用大模型,面對這樣的戰(zhàn)前數(shù)據(jù)對比,也不會做出“出兵”的決策,更不會預測人民志愿軍將取得最后的勝利。同樣,再“毫秒級”的人工智能也打不出“四渡赤水”戰(zhàn)術。人類似乎有一個特別的法寶,能在絕境中爆發(fā)不可思議的力量。我找不到合適的詞語概括,暫且就叫它“Humanity(人性)”吧。憑借堅韌的意志和不滅的希望,“人性”總能在絕境中熠熠生輝,喚醒深度隱藏的勇氣、魄力、膽識、信念與力量,如破曉的晨曦,如凜冬的暖陽,如旱地的甘霖,如黎明的曙光,指引個體走向新生。通過復雜的情感學習算法,人工智能未來一定可以模擬和表達類似人類的情感反應:快樂、悲傷、憤怒等,甚至可以與人類進行復雜的互動,表現(xiàn)出同理心、幽默感和“社交情商”。但真正的人性不僅僅是行為的表現(xiàn),還涉及底層的復雜意識、信念和情感。即使超級人工智能最終完全“復制”了你,但這種“復制”依舊是基于統(tǒng)計和概率,而不是基于真正的情感、意識、信念、倫理。更甚,超級人工智能同樣可以做出某些“道德”決策,但這些決策依舊是基于預設的規(guī)則和參數(shù),而不是基于真正的道德觀念或情感判斷。憑借“人性”的超強傍身,人類依舊有希望在某些時刻的對弈上勝機器半子。克里斯托弗·諾蘭的《星際穿越》,其實就是一部人性與萬物對弈,并最終勝出的電影。面對人類生死存亡之抉擇,老邁的Brand博士選擇隱藏自己的人性,寧背一世之罵名,也要給絕境中的人類強行刷出一個PLAN B選項,哪怕潛在的代價是放棄地球上現(xiàn)有的所有人類,包括他自己。Do not go gentle into that good night(不要溫和地進入那個良夜),Old age should burn and rave at close of day(暮年也應在黃昏時燃燒咆哮),Rage, rage against the dying of the light(怒斥吧,怒斥光明的消逝)。當Doctor Mann降落在一個冰冷、不宜居、表面常年覆蓋著凍雪和液氨、環(huán)境極其惡劣的星球上時,為了逃離,Mann偽造數(shù)據(jù),損毀機器,持續(xù)冬眠35年,終于等到重返地球的機會。當Mann與空間站對接失敗,引發(fā)爆炸,Cooper毫不猶豫啟動引擎,加速追趕。機器人Tars立即勸阻,Cooper一個字母都聽不進去,立刻命令Tars分析永恒號的旋轉(zhuǎn)狀態(tài),接下來二者展開了本片中最為精彩震撼的對話:Tars: Cooper, there is no point using fuel to chase…Cooper: Analyze the Endurance’s spin(分析永恒號的旋轉(zhuǎn)狀態(tài)).Cooper: Get ready to match our spin with the retro thrusters(利用反向推進器讓我們跟永恒號實現(xiàn)同步).Cooper: No…it’s necessary.
Tars可以瞬間分析出永恒號的旋轉(zhuǎn)狀態(tài),可以瞬間擬合出一條追擊路線,可以瞬間跟蹤每一塊碎片的飛行路徑以作最優(yōu)躲避策略,也可以完成高速旋轉(zhuǎn)引起的離心力狀態(tài)下的完美對接,但它始終無法理解——機器只會做出當下最優(yōu)的選擇,它無法理解“人性”被激發(fā)出強大意志力和信念后“不可理喻”的操作。Cooper與Tars共同完成的這次向死而生的Docking,才有了人類最終的生存機會。在絕境時刻,只有最硬核的情感、信念、意志、對家人不棄的愛,才敢于勇闖絕境。或許,在看到Cooper帶著女兒Murph誤入NASA的那一刻,Brand博士心里就已經(jīng)有了最優(yōu)的宇航員人選——Brand為團隊湊齊了星際穿越之旅的最后拼圖:人性。我穿越引力,跨越光年,追逐了幾個星系,只為回到你的身邊。機器不會了解,“半子”不是一個可以模仿的程序或行為。
瑞見——瑞鵬行研
瑞見——投資人說