作者 | 弗雷迪
數據支持 | 勾股大數據(www.gogudata.com)
在新一代GPT問世後,微軟旋即推出了Microsoft 365 Copilot,新的辦公軟體由GPT-4驅動,在減少大量用戶操作下,協助生成文檔、電子郵件、演示文稿和更多內容。
處理效率之高,愈發讓人驚呼,生產力和人機交互的新一輪革命不再只是想像。
新技術的顛覆效果,往往看它能否展現出更低成本、更高產出、更省時間的產品力。
為GPT提供算力的CPU服從摩爾定律,即每隔18-24個月(更省時間),原來的晶圓上封裝的電晶體數量將會翻倍(更低成本),晶片的性能也會隨之翻倍(更高產出)。
能夠實現以上三角的優化解決方案,最終會推動飛輪旋轉,實現強大的規模效應。而Open AI與微軟的合作,似乎在朝著這個方向努力。
01 GPT-4讓我們離AGI又近了一步
ChatGPT風靡全球之後,OpenAI的創始人Sam Altman曾表示,一個全新的摩爾定律即將出現,宇宙中的智能數量每18個月翻一番。
AI的複雜性會隨著市場邊界的擴大而進一步加深,具有湧現出新特性的潛質。
模型的底層邏輯是算力、數據、演算法三位一體的結合,但複雜程度與數據規模相匹配。
隨著參數量的增長,大模型的能力比起小模型要更加泛化。如果小模型的目標是做一個行業專家,那麼大模型的定位則是要成為一個通才。
AGI(通用人工智慧)被設計的目的,是讓機器模仿並逐漸超越人類,實現與人類相近的能力,計算、推理、思考、創造,但是會更快、更高效。
學會吸納更多的參數,是大模型複雜度提升的基礎條件,數據就是AI 的血液。
第一代GPT的訓練參數只有1.17億參數,模型引入了Transformer架構,在處理文本的時候,學會利用上下文資訊來預測下一個單詞。
在處理不同的任務時,僅需要對預訓練形成的網路結構進行微調,就能取得比傳統NLP模型更好的泛化效果,也加快了模型處理數據的效率。
GPT2.0階段,模型學會了多任務處理。開發者再次測試了容量對於性能提升的幫助,不再需要標注,而是讓模型根據給定的指令去理解任務。
這個階段的訓練表明,隨著模型容量和數據增大,不需要給模型提供樣例,它也能夠很好地理解並且完成任務。
基於這層理解,到了GPT-3,開發者也就有了更大的底氣實現參數規模的躍遷,在海量語言模型參數集中,少數樣例設置下,GPT的準確性繼續得到提升。
語言模型參數增加,GTP在NLP任務上表現提升
到了第四代,模型之間的代際差異隨著任務複雜度的提高更加明顯,這是GPT-4能做到的事情:
考試成績取得比老版本更好的表現,意味著語言理解、推理能力持續進步;
語言風格更加靈活,GPT-4向我們展示了她能夠當好一個耐心的數學老師;
支持文字和圖像的混合輸入,並且能夠精准地描述圖片上的內容,理解任務要求並生成代碼。
國內百度16日發佈了對標chatGPT的產品“文心一言”,也已經能夠支持多模態的轉換,文字可以直接在對話中生成圖片和視頻。
- 隨著多模態的實現,基於自然語言模型的GPT未來有希望率先向AGI靠近:
- 大幅降低內容生成的門檻;
- 學習成為各個領域的專家,作為企業業務增長、科研進度加快的重要抓手;
- 革新人機交互的方式
OpenAI開放GPT 的初衷不僅在於找到最佳的落地應用,而且在複雜的人類資訊流裏得到回饋,擴大其能力的邊界。代際之間,GPT快速進步的能力超乎想像。
基於AGI最終很可能會實現的設想,AI的安全也將逐漸上升為一個全人類的重要議題。
OpenAI因此會在正式版本發佈之前花費數月的時間進行風險評估,不過最終,無論進行多嚴格的審查,人類的未來始終該由全人類來共同決定。
02 微軟的iPhone時刻
殺手級應用的誕生,對加速生產力變革具有重要的轉折作用。
19世紀末的蒸汽機靠燒煤提供動力,但操作和燃料需要耗散大量人工和效率。後來西門子率先發明了電動機車,只消鋪一條電線,不過當時電費比煤費還要貴,需要頻繁充電。
直到福特T型車橫空出世,流水線生產讓汽車製造成本大幅降低。隨之重量更輕、體積更小、操作更靈活的內燃機汽車開始走進千家萬戶,逐漸替代了蒸汽機和電動機。在這之後我們又有了飛機和火箭。
AI的應用,讓人和電腦交互的方式產生了劇變。微軟CEO曾經表示,Copilot的自然語言交互將是下一輪人機交互方式變革的雛形。
從圖像介面的PC,到iPhone多點觸控的智能機,每一次人機交互方式的變革孕育著全新的下游應用生態。
過去的AI就只是大模型,把幾十臺伺服器放在一起訓練,沒有落到實地的應用。OpenAI與微軟的合作,實現了兩件事情。
一是跑通了商業模式,GPT的訓練和日常運營背靠微軟Azure的算力支持,微軟雲服務Azure的市場份額僅次於AWS,是穀歌的兩倍。
巨額算力和AI大模型的結合,允許OpenAI進一步推出訂閱式服務,形成了MaaS(Model as a Service)。
Open AI 有兩種訂閱模式,一種to B,給企業客戶和開發者提供ChatGPT API,一千個token輸入按0.002美元算,另一種to C,給普通用戶開放最新功能,每個月收20美元。
用戶的快速增長攤平了訓練和推理所需的算力成本。GPT經過用戶回饋的自主增強學習後,能力有了更快的提升,形成良好的正回饋機制,跟平臺粘性越強,獲客成本就越低是一個道理。
二是在微軟的加持下,GPT和Bing、Gibhub以及Office等多個線上工具深度綁定。你有技術,我有產品,兩家在商業化上擁有完美的協同效應,率先完善了雲計算+AI大模型+應用工具開發的生態。
微軟和穀歌兩家巨頭對於推進AI應用有著截然不同的態度。
交互介面的改變對兩家來說都如同革自己產品的命。不同之處在於,微軟的產品矩陣更快速地適應了進化。
GPT-4推出不久後,微軟即正式為365應用服務提供GPT-4驅動Copilot,對於用戶而言就像一個辦公助手,附著在側邊欄。用戶可以調用它來生成文檔,根據文本創建PPT,或者分析Excel數據。
有了GPT的賦能,對於微軟產品本身便是如虎添翼,這塊業務,“Productivity and Business Process”去年下半年的收入達到了330億美元。全面鋪開後,增長有著更大的想像空間。
未來人們轉向AI聊天介面來搜索資訊,必然會給搜索引擎的廣告業務帶來巨大衝擊。而穀歌的廣告收入占了營收的80%左右,其中占大頭的還是搜索廣告。
穀歌還沒有想好怎麼革自己的命,一直如履薄冰,在應用上還沒有拿出完美的方案,把iPhone時刻拱手讓給了微軟。
03 應用層湧現,小模型也大有可為
晶片和算力相當於鋰礦和電池,其稀缺性決定了這是少數企業有條件參與的遊戲。
要匹配相應規模的算力用於AI訓練並非易事,因此ChatGPT概念一火,便立刻帶動有關晶片、算力的股票板塊。
英偉達的A100/H100是目前最強大的數據中心專用GPU。1萬顆A100晶片被認為是AI模型的算力門檻。據國盛證券估算,按照ChatGPT1月份1300萬的訪問量水準,對應的晶片需求就多達3萬多顆A100。
此外,ChatGPT單月運營需要算力約4874.4PFlop/s-day。擁有亞洲最大超算中心的商湯科技,總算力超過每秒4910Petaflops,也就是說要訓練GPT幾乎得用上全部算力。
在國內,只有雲廠商具備算力和AI模型的基礎條件。在這個性能快速提升的領域,先發優勢可能會給後邊的企業帶來不可逾越的鴻溝。
AI大模型對於雲計算行業將發揮game changer的作用,按李彥宏的話說,以前更關注的是基礎算力,而現在需要考慮的則是晶片、模型、框架協同做得好不好。
可以預見的是,AI大模型未來會自然滲透到各個辦公、內容創作場景,新的應用正在湧現,正如石油、煤炭賦能了工業生產、交通運輸等領域。
對於不想錯過這一波技術紅利的企業來說,站在巨人的肩膀上,成功概率也許更大一些。
相比垂類行業的小模型,大模型具有廣泛的遷移學習能力,就像人類把騎自行車的能力遷移到學騎摩托車一樣,比如在金融領域習得的知識可以遷移到稅務會計等其他經濟場景裏。
但在大小模型聯動的學習方式裏,小模型可以通過知識蒸餾從大模型中學習,並可以在許多下游任務中達到與大模型相似的性能,就像老師帶著學生。
同時,AI模型+文本&對話&圖像&視頻&代碼等多模態的實現,讓AGI有在影視娛樂、遊戲、電商零售、廣告行銷等商業場景具有成為專家的能力,能夠大幅降低內容創作的門檻,帶來生產力和成本的優化。
因為API的開放,大模型根植於更多已經成熟的商業模式,場景和用戶規模正在大幅擴展。許多已經積累了大量用戶的應用結合api對產品形態進行了升級,包括移動端App以及流覽器插件,被分流到各類應用的用戶一旦成為AI使用者,其規模必將是指數級的增長。
04 尾 聲
許多看過《2001太空漫遊》的人應該都對電影開頭那個史詩級的蒙太奇影響深刻:
開頭兩分鐘的鏡頭展示了人類祖先的生活面貌,猿人第一次瞭解到骨頭如何作為工具使用,開啟了智性。當白色的獸骨扔到空中時,瞬間切成了遨遊在太空裏的孤寂的太空船。
這一幕匹配剪輯僅用幾秒鐘的時間,就完成了人類進步的跨越。幾秒鐘的時間,對於宇宙來說無甚區別,但對於人類則是長達幾十萬年的進化。
在占比不到1%的技術文明浪潮中,人類的知識和財富呈現爆炸性增長,這是由技術驅動創新帶來的結果。
過去幾十年,關於智能的定義一直在不斷的被修正,在這一輪技術革命中,AGI不會缺席。
(全文完)