互聯網作爲第一(yī)大(dà)平台,将全世界的信息數字化;社交媒體(tǐ)作爲第二大(dà)平台,解決了人際關系數字化;繼兩大(dà)平台之後,第三大(dà)平台也即将全新登場,即鏡像世界,将現實世界全部數字化。
一(yī)、大(dà)模型時代構建新的力量和财富
自從美國的OpenAI公司發布了ChatGPT之後,通用人工(gōng)智能(AIGC)達到了發展奇點,這也催生(shēng)了一(yī)系列圍繞AIGC的創業熱潮。亞馬遜首席科學家李沐近日離(lí)職,與其導師亞馬遜前副總裁Alex Smola一(yī)同創業,阿裏M6大(dà)模型的前帶頭人楊紅霞加入字節人工(gōng)智能實驗室,參與語言生(shēng)成大(dà)模型的研發。阿裏VP賈揚清離(lí)職創業投身大(dà)模型,創新工(gōng)場董事長兼首席執行官李開(kāi)複近日宣布将籌組名爲“AI2.0”的項目,表示将在全球範圍尋找具有 AI大(dà)模型、語言生(shēng)成模型、多模态等領域能力的優秀技術人才和研究員(yuán)。諸多頂尖行業人才二次創業無不提示AIGC的盛世已在眼前。
人們爲什麽會如此敏感于大(dà)模型帶來的變化,并快速投身其中(zhōng),是源于它會帶來新的力量與新的财富,更重要的是産生(shēng)新的世界格局。想想互聯網技術帶來的産業與世界的現狀,我(wǒ)們可以設想一(yī)下(xià),未來的鏡像世界中(zhōng),所有的産業都将再一(yī)次被重塑,一(yī)方面再一(yī)次産生(shēng)行業的新價值,另一(yī)方面加速淘汰落後産能。每個人都将要與智能機器一(yī)起生(shēng)活和工(gōng)作,并與數百萬人一(yī)起協同工(gōng)作,全新的工(gōng)作方式需要“新人”,也同樣有更多的“舊(jiù)人”被淘汰。世界的格局,也不再是國家與國家相互作用來構建,而需要加上擁有大(dà)模型的科技巨頭公司,那将是一(yī)種前所未有的格局。
二、尋找大(dà)模型時代的商(shāng)業機會
正如我(wǒ)們感知(zhī)大(dà)模型時代來臨是從ChatGPT開(kāi)始的,那麽,要尋找大(dà)模型時代的機會,我(wǒ)們同樣需要從認識OpenAI模式局限性開(kāi)始。我(wǒ)們以商(shāng)業機會作爲思考的領域,也因此會關注目前領先的OpenAI公司和其他已知(zhī)擁有大(dà)模型技術的公司的商(shāng)業模式所存在的局限性,通過研究分(fēn)析和思考,我(wǒ)們認爲,OpenAI公司通過直接向訂閱的企業客戶和C端用戶開(kāi)放(fàng)ChatGPT3.5/GPT4通用對話(huà)大(dà)模型接口來獲取收入的商(shāng)業模式,将會面臨三方面的局限。
首先,由于用于專業知(zhī)識訓練的語料不夠,ChatGPT在專業領域提供的回答通常過于膚淺,無法提供深入的建議和解答且無法溯源,甚至經常存在難以分(fēn)辨的事實性錯誤以及生(shēng)成質量不穩定、邏輯不連貫、重複或不一(yī)緻的現象,這會導緻回答缺乏可靠性,無法滿足專業領域對回答質量的高要求。第二,ChatGPT在專業領域存在隐私漏洞:ChatGPT将提問上傳雲端,在異地處理并反饋解答。這可能存在用戶隐私洩露的危險。同時,ChatGPT将用戶的輸入作爲訓練的語料,這也會導緻用戶的輸入信息安全無法得到保證(雖然最近OpenAI已決定不再使用用戶數據訓練,但此舉必将限制OpenAI在專業領域的能力提升)。第三,更爲嚴重的是,由于用戶數據與模型産權均被中(zhōng)心化公司所有,這種模式不能最大(dà)程度地激勵用戶在系統裏創造新數據和新知(zhī)識。
ChatGPT的上述問題是由于領域知(zhī)識圖譜的訓練預料不足、閉源模式導緻用戶信息外(wài)洩和用戶數據的産權被侵占等固有缺陷導緻的,這就給企業通過用多年積累的領域知(zhī)識對大(dà)模型進行微調和優化,從而獲得本行業的領域大(dà)模型提供了窗口機會。
綜上所述,現有OpenAI類公司提供的中(zhōng)心化、一(yī)體(tǐ)化、閉源的商(shāng)業模式存在固有的缺陷,難以在各行各業廣泛推廣應用。
下(xià)面,我(wǒ)們将針對這些局限性提出一(yī)種未來可能的發展方向,即基于通用大(dà)模型和專業知(zhī)識圖譜構建領域大(dà)模型,并由此提出領域大(dà)模型的商(shāng)業模式選擇。
三、“生(shēng)成式大(dà)模型+辨識型小(xiǎo)模型”技術架構形成領域大(dà)模型是出路
正如我(wǒ)們在開(kāi)篇讨論的那樣,随着ChatGPT的橫空出世,人們或者因爲敏感其帶來的機會,或者因爲焦慮其帶來的颠覆,都在想辦法讓自己與其發生(shēng)關聯。但是,這是一(yī)個從0到1的過程,進入的路徑非常多,同時坑也特别多。和之前發生(shēng)的數字技術背景下(xià)生(shēng)存的芯片、操作系統等領域不一(yī)樣的地方是,現在沒有時間的壁壘,先發者也不會形成累積性的競争優勢,正因爲此,其對産業的颠覆也将超乎人們的想象。
在這樣的變化特征下(xià),大(dà)模型時代的商(shāng)業模式,需要針對這樣的變化特征做出應對,并利用這些變化特征産生(shēng)新的商(shāng)業價值機會,因此,需要在現在生(shēng)成模型的基礎上,解決行業知(zhī)識與時間價值的問題,後者我(wǒ)們發現可以用行業辨識型模型來解決,即必須使用辨識模型來解決生(shēng)成模型的不足。辨識模型補足的是兩個比較重要的方面,一(yī)個是業務場景中(zhōng)特有的需求,另一(yī)個是結構化知(zhī)識的生(shēng)産,類似人類形成長期記憶。長期來講,兩者一(yī)定是缺一(yī)不可的。
從企業的視角去(qù)看,有關企業商(shāng)業模式的構建,可以确定是一(yī)個領域大(dà)模型,這一(yī)大(dà)模型主要由小(xiǎo)模型(辨識模型)産生(shēng)的專業知(zhī)識圖譜、提供通用知(zhī)識和語言理解與組織能力的大(dà)模型(生(shēng)成模型)兩部分(fēn)組成。小(xiǎo)模型的主要功能是基于知(zhī)識圖譜等技術,爲大(dà)模型提供訓練和微調的專業知(zhī)識,以便生(shēng)成式大(dà)模型進行專業知(zhī)識的理解。
通用大(dà)模型的主要任務是面向客戶直接進行語義理解和答案的生(shēng)成,如閉源的ChatGPT、開(kāi)源的LLaMA等均屬于此類通用模型。我(wǒ)們可以簡單介紹一(yī)下(xià)構建這樣一(yī)個領域大(dà)模型的過程。
第一(yī)步是訓練基于生(shēng)成式大(dà)模型的自然語言處理模型,其訓練主要分(fēn)爲預訓練和叠代微調兩個步驟。步驟一(yī),預訓練階段,利用海量語料訓練生(shēng)成式大(dà)模型,得到大(dà)模型的模型文件。步驟二,叠代微調階段,依據指令提示學習和思維鏈提示學習對上一(yī)步的模型文件進行微調,再通過強化學習的方式,分(fēn)别進行獎勵模型訓練和生(shēng)成策略優化。
第二步是用辨識型小(xiǎo)模型生(shēng)成領域知(zhī)識圖譜。小(xiǎo)模型部分(fēn)本身也是一(yī)個針對特定任務的自然語言處理模型,其訓練同樣分(fēn)爲預訓練和微調兩個步驟。步驟一(yī),預訓練階段,可以采用BERT、T5等預訓練模型。步驟二,微調階段,利用各種針對不同下(xià)遊任務的語料對預訓練的模型進行特定領域的微調。利用微調後的自然語言處理模型,可以基于語義理解方面的能力,生(shēng)成特定領域的專業知(zhī)識圖譜。
第三步,分(fēn)析專業知(zhī)識圖譜,并進一(yī)步将從其中(zhōng)得到的專業信息用于大(dà)模型部分(fēn)的增量預訓練、微調、校驗和溯源,産生(shēng)具備專業知(zhī)識能力的領域大(dà)模型。
第四步,利用加入了專業知(zhī)識的領域大(dà)模型,實現專業領域的文本解析、報告生(shēng)成和專業問答,同時也可以解決通用大(dà)模型在專業領域的非事實性回答的問題。
不同于行業某些專家認爲“不要用知(zhī)識圖譜、它根本不起作用”的觀點,我(wǒ)們通過開(kāi)發實踐證明知(zhī)識圖譜,在解決純生(shēng)成式大(dà)模型(如GPT4)關于事實性問題的缺陷方面不但能發揮關鍵作用,而且相比于生(shēng)成式大(dà)模型+插件機制的架構(如Bing Chat),經過知(zhī)識圖譜微調、校驗和溯源的領域大(dà)模型在事實準确率和生(shēng)成内容的專業性方面有着非常突出的優勢。
四、大(dà)模型的共生(shēng)體(tǐ)和商(shāng)業模式創新
領域大(dà)模型在未來擁有更加豐富的商(shāng)業化場景,這些場景将形成一(yī)個如圖1所示的大(dà)模型共生(shēng)體(tǐ)。該共生(shēng)體(tǐ)擁有以下(xià)角色和相應的業務活動環節,包括搭建訓練框架、輸出模型文件、模型微調、私有模型及其部署、開(kāi)放(fàng)API、構建知(zhī)識圖譜知(zhī)識、構建終端應用和提供訓練數據等。進入該共生(shēng)體(tǐ)的企業可以通過選取不同的業務活動并在其中(zhōng)扮演特定的角色,與共生(shēng)體(tǐ)中(zhōng)的其他主體(tǐ)交易,由此可以衍生(shēng)出很多不同的商(shāng)業模式。
商(shāng)業模式創新的起點可以源于對共生(shēng)體(tǐ)中(zhōng)不同角色的選擇,這能夠幫助企業定位其邊界以及交易的主體(tǐ)。如下(xià)圖2所示,這是一(yī)個大(dà)模型共生(shēng)體(tǐ)的三軸工(gōng)具。其中(zhōng),Y軸代表了上下(xià)遊直接業務活動,包括了搭建訓練框架、預訓練、輸出模型文件和終端應用等。X軸是直接業務活動的橫向展開(kāi),在不同的直接業務活動層面進一(yī)步區分(fēn)出不同的活動。例如,訓練框架、預訓練數據可以選擇是開(kāi)源、閉源(私有)還是混合;在模型文件環節可以選擇GPT-3、GPT-4、Stable Diffusion等不同的訓練好的模型參數數據;在終端應用環節可以切入對話(huà)、搜索、畫圖、寫作等多樣化場景。除此以外(wài),Z軸代表了業務活動的豎向分(fēn)層。例如,針對提供模型文件這一(yī)業務活動,将已有訓練好的模型參數數據當作基礎模型,企業可以通過模型微調使用特定領域或任務相關的全量或增量語料,對模型進行進一(yī)步訓練。在模型微調的基礎上企業可以提供客戶的私有模型部署,客戶将系統的組件和服務部署在自己的私有數據中(zhōng)心或基礎設施中(zhōng),不僅滿足了對數據隐私和安全性的要求,還可以進行定制開(kāi)發以滿足特定的業務需求。
三個坐标軸充分(fēn)表達了現有的業務活動。擁有不同初始禀賦、技術優勢的企業可以從事共生(shēng)體(tǐ)中(zhōng)不同的角色,從而采取不同的大(dà)模型的商(shāng)業模式。例如:
模式1,通用大(dà)模型訓練與提供模型文件的商(shāng)業模式。企業的主要業務活動選擇爲基礎的通用大(dà)模型訓練,通過出租或銷售通用大(dà)模型盈利。
模式2,企業自用領域大(dà)模型訓練的商(shāng)業模式。企業在自用場景下(xià),對通用大(dà)模型的模型文件進行領域适應性的二次微調,輸出一(yī)種滿足專業企業需求的領域大(dà)模型。
模式3,爲不同行業提供領域大(dà)模型文件的商(shāng)業模式。企業可以結合領域專業數據公司提供的專業化數據構建領域知(zhī)識圖譜,訓練更适用于垂直領域需要的領域大(dà)模型。
模式4,結合知(zhī)識圖譜的領域大(dà)模型訓練的商(shāng)業模式。這類企業的核心在于承擔了知(zhī)識圖譜構建的活動,爲某一(yī)領域構建更加專業化的解決方案。
模式5,平台型商(shāng)業模式。這類企業将模型訓練的基礎設施開(kāi)放(fàng)給用戶,讓用戶開(kāi)發屬于自己的領域大(dà)模型。
模式6,一(yī)體(tǐ)化且可私有化部署的商(shāng)業模式。企業提供領域大(dà)模型或通用大(dà)模型,可提供模型文件給用戶私有化部署。此模式與現行的OpenAI的API模式相比,能夠激勵行業客戶創造專屬的領域大(dà)模型。
五、這個路徑的選擇是普遍可應用的嗎(ma)?
我(wǒ)們确定“生(shēng)成式大(dà)模型+辨識型小(xiǎo)模型”作爲大(dà)模型時代企業的技術架構及大(dà)模型的商(shāng)業模式選擇路徑,正是基于對行業發展、技術演進以及企業現狀的梳理和判斷,更重要的是,企業按照這個選擇路徑尋找大(dà)模型時代的商(shāng)業模式創新機會,是相對可行且沒有太大(dà)技術和投入壁壘的。
未來,我(wǒ)們相信基于“生(shēng)成式大(dà)模型+辨識型小(xiǎo)模型”技術架構的共生(shēng)體(tǐ),及其産生(shēng)的商(shāng)業模式将會擁有更廣闊的創新發展空間。大(dà)量新玩家會通過重新定位、價值鏈延伸以嶄新的身份與角色進入大(dà)模型的生(shēng)态系統。相比于OpenAI的中(zhōng)心化一(yī)體(tǐ)化閉源模式,從大(dà)模型共生(shēng)體(tǐ)中(zhōng)衍生(shēng)出的幾種局部閉源或開(kāi)源模式将更可持續地創造價值。除此以外(wài),也可以廣泛地采用區塊鏈技術甚至區塊鏈系統。區塊鏈作爲一(yī)種去(qù)中(zhōng)心化、透明且不可篡改的分(fēn)布式技術,可以提供一(yī)種可靠的方式來确保數據的确權和分(fēn)配獎勵,并記錄用戶的數據與知(zhī)識來源、創造時間和所有權信息,通過智能合約來實現自動化的獎賞機制,爲數據和知(zhī)識的貢獻者提供激勵。
如果一(yī)定要探讨實現大(dà)模型條件下(xià)的商(shāng)業模式創新的障礙問題,那麽主要的障礙是人的思想不能轉變過來。在現實的實踐中(zhōng),我(wǒ)們發現,即便是離(lí)AI最近的算法工(gōng)程師,都很難完全理解目前技術上翻天覆地的變化,更何況其他人。而在大(dà)模型時代,人們的工(gōng)作模式将發生(shēng)根本的變化。新的工(gōng)作模型,對從業者的要求不再僅僅是個人的勝任力,還要求有協同工(gōng)作的能力,以及創造力、新的能力要求,一(yī)些從業者也許會無法轉變到大(dà)模型時代所需要的能力結構中(zhōng)。還有一(yī)個障礙是大(dà)部分(fēn)老闆對這個更不了解,僅僅知(zhī)道需要很多資(zī)金和資(zī)源的投入,并且不一(yī)定有當期或者近期的産出,所以一(yī)直處在搖擺之中(zhōng)。其實,後面的這一(yī)點,恰恰是我(wǒ)們建議企業選擇做領域大(dà)模型商(shāng)業模式創新的原因,因爲這樣的選擇,先從行業的中(zhōng)遊、下(xià)遊去(qù)做,既可以發揮企業自身對行業所擁有的優勢知(zhī)識資(zī)源,又(yòu)可以貼近顧客需求端,獲得競争優勢。
亞馬遜創始人傑夫·貝佐斯曾說過:“亞馬遜必然會消亡”。據資(zī)料顯示,自2000年以來,《财富》500強企業中(zhōng)有52%的公司宣布破産或被收購、兼并,但是,伴随着這些公司的消亡,一(yī)大(dà)批創新的公司正在茁壯成長,機遇到處都是,隻是需要我(wǒ)們能夠與機遇走在一(yī)起。
(資(zī)料來源:網絡、衆智雲慧成都管理咨詢CRC 行研中(zhōng)心)
====================================================================
衆智雲慧成都管理咨詢公司/廣州/重慶管理咨詢公司,管理創造效益,咨詢成就商(shāng)業!衆智雲慧助推中(zhōng)國管理咨詢行業快速、健康發展!
成都管理咨詢/咨詢服務/戰略規劃/人力資(zī)源/薪酬考核/績效管理/股權激勵/三項制度/成都咨詢公司/流程制度/企業文化/崗位價值評估
歡迎浏覽 http://www.meishanzhuce.com 成都辦公室:028-61894747 客服熱線:400-687-6811