不僅“上知天文、下知地理”,似乎還能對(duì)答如流、出口成詩(shī),甚至還能寫劇本、編音樂(lè)、寫代碼——最近,一款名叫ChatGPT的人工智能聊天機(jī)器人火爆全球。由此,一系列關(guān)于新一代技術(shù)變革、人工智能替代人力、巨頭企業(yè)扎堆入局AI的討論在互聯(lián)網(wǎng)上甚囂塵上,并引發(fā)資本市場(chǎng)跟進(jìn)炒作。
然而,隨著越來(lái)越多的用戶實(shí)測(cè)結(jié)果不及預(yù)期,許多人也在重新審視ChatGPT是否真如想象中那么完美。熱鬧過(guò)后,也許是時(shí)候開始冷靜思考,ChatGPT的發(fā)展模式面臨哪些不可規(guī)避的問(wèn)題和風(fēng)險(xiǎn)?這對(duì)我國(guó)人工智能發(fā)展有何重要啟示?
(資料圖)
ChatGPT頁(yè)面截圖。
ChatGPT 的“無(wú)所不能”和“無(wú)能為力”
問(wèn):“ChatGPT和其他聊天機(jī)器人有什么不同?”
答:“ChatGPT是一種先進(jìn)的語(yǔ)言模型,具有更強(qiáng)的語(yǔ)言能力和知識(shí)范圍,能夠與用戶進(jìn)行更自然有效的對(duì)話?!?/p>
以上是人民網(wǎng)財(cái)經(jīng)和ChatGPT的一組對(duì)話截圖。
正如ChatGPT在回答人民網(wǎng)財(cái)經(jīng)提問(wèn)時(shí)所言,相較于此前科技企業(yè)推出的聊天機(jī)器人,ChatGPT在智能化程度上大幅提升,給對(duì)話者的感覺(jué)也“更聰明”。
2022年11月底,ChatGPT由美國(guó)一家名為OpenAI的人工智能研究公司推出,可以實(shí)現(xiàn)與用戶之間的智能聊天對(duì)話,屬于偏任務(wù)型的多輪對(duì)話和問(wèn)答系統(tǒng)。
“ChatGPT的出現(xiàn),是人工智能技術(shù)發(fā)展的一次飛躍?!眰鞑?nèi)容認(rèn)知全國(guó)重點(diǎn)實(shí)驗(yàn)室首席科學(xué)家張勇東表示,其在交互和創(chuàng)作方面展現(xiàn)的出色能力,標(biāo)志人工智能由決策式向生成式轉(zhuǎn)變。
中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所內(nèi)容科技部副主任石霖介紹,ChatGPT的技術(shù)基于OpenAI開發(fā)的GPT3.5系列模型。該模型參數(shù)規(guī)模據(jù)推測(cè)達(dá)十億級(jí)別,加之在訓(xùn)練過(guò)程中引入人類反饋機(jī)制技術(shù),使得ChatGPT在回答準(zhǔn)確率、道德表現(xiàn)上進(jìn)一步得到提升。
近期,有研究發(fā)現(xiàn),ChatGPT的“聰明”程度足以通過(guò)美國(guó)行醫(yī)執(zhí)照、研究生入學(xué)等考試。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授黃民烈表示,目前ChatGPT的對(duì)話能力已超出人類平均水準(zhǔn),未來(lái)其能達(dá)到的類人對(duì)話水平值得期待。
不過(guò),看似“無(wú)所不能”的ChatGPT,也會(huì)存在“無(wú)能為力”的尷尬。
如,目前ChatGPT難以進(jìn)行高級(jí)邏輯處理。在完成“多準(zhǔn)快全”的基本資料梳理和內(nèi)容整合后,ChatGPT尚不能提供綜合判斷、修改調(diào)整、邏輯完善等“畫龍點(diǎn)睛”之筆,而這恰恰是人類高級(jí)智慧的體現(xiàn)。
此外,用于ChatGPT語(yǔ)言模型訓(xùn)練的數(shù)據(jù)為2021年底前的數(shù)據(jù),因此在一些最新的數(shù)據(jù)和事件方面它可能會(huì)存在滯后。這在一定程度上造成了ChatGPT在內(nèi)容準(zhǔn)確性和知識(shí)性上的短板。不少用戶反映它經(jīng)?!耙槐菊?jīng)地胡說(shuō)八道”。
ChatGPT在常識(shí)問(wèn)題和算術(shù)題上出現(xiàn)錯(cuò)誤,被網(wǎng)友戲稱“一本正經(jīng)地胡說(shuō)八道”。
預(yù)訓(xùn)練“機(jī)器人”潛藏侵權(quán)風(fēng)險(xiǎn)和監(jiān)管隱憂
以ChatGPT為代表的預(yù)訓(xùn)練模型“機(jī)器人”,在預(yù)訓(xùn)練過(guò)程中需要“投喂”海量數(shù)據(jù),才能使得模型能夠成功理解人類語(yǔ)言并模擬出愈加真實(shí)的類人表達(dá)方式。
據(jù)OpenAI的相關(guān)論文透露,ChatGPT的訓(xùn)練集使用了總計(jì)約320TB的文字信息,涵蓋超4000億詞和約31億個(gè)網(wǎng)頁(yè),其中包括來(lái)自新聞、博客、社交媒體的內(nèi)容。
但這種未經(jīng)授權(quán)獲取文本數(shù)據(jù)的預(yù)訓(xùn)練方式已引發(fā)爭(zhēng)議和不滿。推特(Twitter)現(xiàn)任首席執(zhí)行官埃隆·馬斯克就于近日宣布,叫停ChatGPT訪問(wèn)Twitter數(shù)據(jù)庫(kù)來(lái)獲取培訓(xùn)數(shù)據(jù),聲稱“需要更多了解OpenAI的治理結(jié)構(gòu)和未來(lái)收入計(jì)劃”。
無(wú)獨(dú)有偶,近日,擁有國(guó)際性體育資源的蓋蒂圖片社對(duì)同為人工智能企業(yè)的Stability AI提起訴訟,指責(zé)其未經(jīng)許可從其數(shù)據(jù)庫(kù)中復(fù)制了1200多萬(wàn)張圖片,用于建立競(jìng)爭(zhēng)性業(yè)務(wù),并侵犯了該公司的版權(quán)和商標(biāo)保護(hù)權(quán)。
張勇東表示,類似ChatGPT這樣的預(yù)訓(xùn)練模型,其訓(xùn)練數(shù)據(jù)往往來(lái)源于書籍、網(wǎng)站等,而其用于訓(xùn)練的語(yǔ)料未經(jīng)授權(quán),存在版權(quán)風(fēng)險(xiǎn)。且這種訓(xùn)練過(guò)程往往不對(duì)外公開,訓(xùn)練數(shù)據(jù)也不對(duì)外公布,因此版權(quán)擁有者并不知情。待模型完成后,生成的內(nèi)容往往是原始訓(xùn)練數(shù)據(jù)的某種組合,對(duì)外服務(wù)過(guò)程中就會(huì)存在侵犯原始版權(quán)的問(wèn)題。
“這點(diǎn)與搜索引擎的服務(wù)機(jī)制不同。搜索引擎只是提供原始內(nèi)容的鏈接,但ChatGPT則是以自身生成內(nèi)容的形式提供服務(wù),甚至連模型自己都無(wú)法確認(rèn)是參考或綜合了哪些原始素材?!彼f(shuō)。
正因如此,對(duì)于人工智能生成內(nèi)容不能全盤接收,要注意甄別風(fēng)險(xiǎn)、加強(qiáng)監(jiān)管,正成為業(yè)界共識(shí)。
近日,OpenAI首席技術(shù)官米拉·穆拉蒂在接受媒體采訪時(shí)坦言,和其他聊天機(jī)器人一樣,ChatGPT可能會(huì)編造事實(shí),也可能會(huì)被壞人利用,需要政府部門盡早介入進(jìn)行監(jiān)管。
“從長(zhǎng)遠(yuǎn)來(lái)看,社會(huì)各界應(yīng)該積極推動(dòng)制定人工智能生成內(nèi)容(AIGC)的規(guī)范標(biāo)準(zhǔn)。世界各國(guó)應(yīng)該共同努力,基于海量數(shù)據(jù)研發(fā)生產(chǎn)出更加符合全人類道德價(jià)值標(biāo)準(zhǔn)的內(nèi)容?!睆堄聳|說(shuō)。
他建議,要強(qiáng)化數(shù)據(jù)源頭把控,尤其是對(duì)涉及隱私、倫理、道德、政治偏見(jiàn)和種族主義等內(nèi)容,要進(jìn)行更嚴(yán)格的數(shù)據(jù)審查和清洗。
石霖建議,應(yīng)加快布局人工智能安全標(biāo)準(zhǔn)、倫理規(guī)則的研究,針對(duì)人工智能新技術(shù)可能帶來(lái)的版權(quán)風(fēng)險(xiǎn)、內(nèi)容風(fēng)險(xiǎn)等推動(dòng)形成行業(yè)自律。同時(shí),還應(yīng)做好AIGC技術(shù)應(yīng)用的科普工作,提升民眾的科學(xué)素養(yǎng)和風(fēng)險(xiǎn)認(rèn)識(shí)。
炒作“啞火”后思考行業(yè)長(zhǎng)遠(yuǎn)發(fā)展
ChatGPT的爆紅,讓OpenAI賺到了第一桶金,也讓各路資本爭(zhēng)相入局。
2023年1月,微軟再次宣布向 OpenAI 投資數(shù)十億美元。據(jù)了解,這是目前人工智能領(lǐng)域規(guī)模最大的一筆投資。投資機(jī)構(gòu)紅杉資本預(yù)測(cè),未來(lái)AIGC有潛力產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。
連日來(lái),A股市場(chǎng)也經(jīng)歷了人工智能概念股大幅波動(dòng)。但隨著監(jiān)管函的下達(dá),炒作現(xiàn)象逐漸開始“啞火”,更多關(guān)于人工智能行業(yè)長(zhǎng)遠(yuǎn)發(fā)展的思考和理性聲音正在出現(xiàn)。
針對(duì)人工智能將取代部分人類職業(yè)的網(wǎng)絡(luò)討論,張勇東直言,人工智能技術(shù)距離真正達(dá)到類人的程度還有很長(zhǎng)一段路要走。目前以ChatGPT為代表的AIGC在邏輯性、可解釋性和可溯源性方面都有待完善。
“國(guó)際上先進(jìn)的人工智能發(fā)展都不是一蹴而就的,而是有跡可循、不斷突破的?!比斯ぶ悄芷髽I(yè)智譜AI首席執(zhí)行官?gòu)堸i表示,“ChatGPT的出現(xiàn)是否意味著人工智能已經(jīng)‘踩’到了通用人工智能這一終極目標(biāo)的‘門檻’,還需冷靜看待。”
多位行業(yè)專家表示,可以預(yù)見(jiàn)的是,在“人機(jī)共生”的未來(lái)時(shí)代,人工智能確將解放人類、提高效率,但其身份是“助手”而非“主人”。
而針對(duì)ChatGPT爆火引發(fā)的對(duì)國(guó)內(nèi)人工智能產(chǎn)業(yè)的質(zhì)疑,也需要用更加全面的眼光來(lái)看待。
多年來(lái),我國(guó)人工智能產(chǎn)業(yè)在生態(tài)完善、技術(shù)研發(fā)、應(yīng)用推廣、人才建設(shè)等方面不斷培育優(yōu)勢(shì):過(guò)去十年間專利申請(qǐng)量位居世界第一,核心產(chǎn)業(yè)規(guī)模超過(guò)4000億元。國(guó)際市場(chǎng)分析機(jī)構(gòu)Gartner在研究報(bào)告中指出,阿里巴巴、百度、騰訊等科技企業(yè)在語(yǔ)言AI技術(shù)上的排名進(jìn)入世界前十位……
“ChatGPT的成功再次給我們提了個(gè)醒,人工智能的發(fā)展需要在基礎(chǔ)研究和技術(shù)研發(fā)方面不懈堅(jiān)持。”張鵬表示,過(guò)去我國(guó)人工智能產(chǎn)業(yè)對(duì)基礎(chǔ)設(shè)施和技術(shù)的重視和投入不足。未來(lái),如何發(fā)揮長(zhǎng)處、補(bǔ)齊短板,真正實(shí)現(xiàn)我國(guó)人工智能領(lǐng)域的關(guān)鍵躍升,值得期待。
展望未來(lái),石霖認(rèn)為,以ChatGPT為代表的AIGC技術(shù)應(yīng)用,將形成“智能底座+服務(wù)”的商業(yè)模式。AIGC技術(shù)應(yīng)用還將進(jìn)一步發(fā)揮在數(shù)據(jù)、算力和算法上構(gòu)筑的技術(shù)壁壘優(yōu)勢(shì),對(duì)人工智能的應(yīng)用推廣帶來(lái)深層次變革。
他指出,AIGC技術(shù)應(yīng)用正在軟件代碼編寫、工業(yè)設(shè)計(jì)、分子結(jié)構(gòu)預(yù)測(cè)、基因編輯等科研生產(chǎn)領(lǐng)域探索應(yīng)用場(chǎng)景,幫助縮短研發(fā)周期、降低試驗(yàn)成本,也將改變軟件、工業(yè)、醫(yī)療、生物等行業(yè)運(yùn)行模式。
張勇東表示,過(guò)去十年,人工智能領(lǐng)域主要圍繞更好的感知和理解來(lái)發(fā)展,比如自動(dòng)駕駛、數(shù)字醫(yī)療。未來(lái)十年,人工智能領(lǐng)域深層技術(shù)有望不斷突破,將具備重塑數(shù)字化內(nèi)容生產(chǎn)和消費(fèi)模式的強(qiáng)大潛力。
深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任、百度首席技術(shù)官王海峰認(rèn)為,融合大規(guī)模知識(shí)的深度學(xué)習(xí)是人工智能發(fā)展的重要方向。要聯(lián)合產(chǎn)學(xué)研各方力量,探索協(xié)同育人創(chuàng)新模式,建立全方位多層次的人工智能人才培養(yǎng)體系。
關(guān)鍵詞: ChatGPT 訓(xùn)練模型 研究生入學(xué)
責(zé)任編輯:Rex_14