ChatGPT檢索功能可能引發(fā)的法律風(fēng)險(xiǎn)及防控
文 | 重慶大學(xué)法學(xué)院 自正法 李曉梅
當(dāng)?shù)貢r(shí)間10月31日,OpenAI宣布ChatGPT推出“檢索”功能。與谷歌、微軟等傳統(tǒng)搜索引擎相比,ChatGPT搜索采用人機(jī)交互對(duì)話(huà)方式,在分析用戶(hù)搜索目的基礎(chǔ)上,實(shí)時(shí)檢索在線資源信息,生成包含經(jīng)過(guò)算法模型分析的結(jié)論和來(lái)源鏈接,以此為用戶(hù)提供更加精確和簡(jiǎn)潔的檢索結(jié)果。同時(shí),隨著檢索量的疊加提高用戶(hù)檢索信息效率,實(shí)現(xiàn)動(dòng)態(tài)、精確的問(wèn)答。對(duì)話(huà)式人工智能技術(shù)的應(yīng)用對(duì)現(xiàn)有的信息檢索方式而言,可能帶來(lái)一場(chǎng)深刻變革。但是,由于其算法模型的固有缺陷,隱藏的風(fēng)險(xiǎn)也不容小覷,自然語(yǔ)言交互、自動(dòng)化提取、個(gè)性化推薦等特點(diǎn)使其在為用戶(hù)提供貼心服務(wù)的同時(shí),也會(huì)帶來(lái)很多潛在風(fēng)險(xiǎn)。
ChatGPT檢索功能可能引發(fā)的法律風(fēng)險(xiǎn)
其一,自然語(yǔ)言交互帶來(lái)“信息侵權(quán)”風(fēng)險(xiǎn)。傳統(tǒng)檢索引擎呈現(xiàn)結(jié)論的方式為“網(wǎng)頁(yè)標(biāo)題+少量開(kāi)頭內(nèi)容”,用戶(hù)需要點(diǎn)擊鏈接跳轉(zhuǎn)至來(lái)源地址才能知道具體內(nèi)容。這種方式在很大程度上保護(hù)了原始平臺(tái)的點(diǎn)擊流量和版權(quán)權(quán)益。但是,ChatGPT搜索利用算法模型概括總結(jié)收集的信息,直接向用戶(hù)生成簡(jiǎn)潔清晰的結(jié)論,這可能導(dǎo)致用戶(hù)大概率不會(huì)點(diǎn)擊原文鏈接進(jìn)行深入閱讀。盡管OpenAI宣布與多家新聞媒體和出版商達(dá)成合作,但其生成結(jié)果還包括不阻止其搜索爬蟲(chóng)所獲得的其他在線信息資源,這可能構(gòu)成對(duì)被引用平臺(tái)和作者的信息侵權(quán),從而引發(fā)版權(quán)爭(zhēng)議。由此可見(jiàn),ChatGPT推出檢索功能,以現(xiàn)有方式進(jìn)入搜索引擎領(lǐng)域,勢(shì)必會(huì)面臨更多侵權(quán)風(fēng)險(xiǎn)。甚至,ChatGPT推出的人工智能檢索可能會(huì)剝奪作者生存所需的數(shù)據(jù)訪問(wèn)量和“眼球”。
其二,自動(dòng)化提取帶來(lái)“信息泄露”風(fēng)險(xiǎn)。ChatGPT推出檢索功能后,引發(fā)了很多人對(duì)個(gè)人信息泄露的擔(dān)憂(yōu),用戶(hù)擔(dān)心檢索記錄會(huì)碎片化地反映出個(gè)人的隱私數(shù)據(jù),甚至產(chǎn)生精準(zhǔn)識(shí)別風(fēng)險(xiǎn)。嚴(yán)格來(lái)講,ChatGPT算法模型的自動(dòng)化提取是無(wú)法規(guī)避的程序,數(shù)據(jù)庫(kù)隱秘收集用戶(hù)的搜索記錄、喜好習(xí)慣、位置信息等在所難免,這成為算法模型升級(jí)和優(yōu)化的訓(xùn)練基礎(chǔ),因?yàn)樗?jīng)過(guò)訓(xùn)練可以有效提高人機(jī)自然語(yǔ)言對(duì)話(huà)的精確度和可信度。一般情況下,搜索引擎運(yùn)作時(shí)不是嚴(yán)格意義上的信息收集階段,這些碎片化信息也不具有可識(shí)別性,不會(huì)對(duì)個(gè)人隱私造成侵犯。但隨著算法結(jié)構(gòu)的深度訓(xùn)練和優(yōu)化,會(huì)形成一種整合碎片化的、去匿名化的“深度處理”效果,平臺(tái)在海量關(guān)聯(lián)性極小的搜索信息中提取關(guān)鍵要素,最終可能生成指向明確的可識(shí)別信息。換句話(huà)說(shuō),隨著個(gè)人信息碎片的不斷疊加,類(lèi)似于“拼圖”游戲,個(gè)人的有效識(shí)別點(diǎn)會(huì)被不斷擴(kuò)大,直至最終被識(shí)別,這將給個(gè)人隱私和安全造成極大隱患。
其三,個(gè)性化推薦帶來(lái)“信息繭房”風(fēng)險(xiǎn)。ChatGPT搜索采用的是自然語(yǔ)言對(duì)話(huà)方式,這種“問(wèn)答”屬性的檢索機(jī)制,會(huì)根據(jù)檢索語(yǔ)境和目的自動(dòng)提取用戶(hù)的喜好和習(xí)慣,納入后臺(tái)語(yǔ)料數(shù)據(jù)庫(kù),并在獲得用戶(hù)反饋和追問(wèn)后,對(duì)算法模式進(jìn)行評(píng)估深化,這些都被存儲(chǔ)為平臺(tái)的“長(zhǎng)期記憶”。之后,在使用過(guò)程中,平臺(tái)會(huì)根據(jù)“聊天習(xí)慣”進(jìn)行個(gè)性化推薦,使用戶(hù)只關(guān)注自己感興趣和符合自己價(jià)值偏向的信息。這種“反饋式”設(shè)計(jì)從算法技術(shù)角度看,可以提供簡(jiǎn)潔準(zhǔn)確的結(jié)論,使其成為人類(lèi)日常生活的得力助手。但是,過(guò)度迎合用戶(hù)的喜好,缺乏廣泛的信息覆蓋和選擇,勢(shì)必會(huì)引發(fā)“同質(zhì)化效應(yīng)”和“回聲式效應(yīng)”,使人們長(zhǎng)期被困在“信息繭房”中。這使得本身存在價(jià)值判斷的數(shù)據(jù)信息會(huì)重復(fù)出現(xiàn),而其他信息被排除在搜索結(jié)果之外,從而影響用戶(hù)對(duì)信息的全面、客觀掌握。
ChatGPT檢索功能引發(fā)法律風(fēng)險(xiǎn)的防控
ChatGPT宣布推出檢索功能,既是一場(chǎng)變革,也是一場(chǎng)挑戰(zhàn),為應(yīng)對(duì)其在數(shù)字時(shí)代信息檢索領(lǐng)域的潛在風(fēng)險(xiǎn),需要采取系統(tǒng)性、針對(duì)性的防控措施。
其一,提示信息源鏈接,注意引用限度。平臺(tái)生成結(jié)論時(shí)應(yīng)以醒目的方式提示信息原始地址鏈接,這可以在很大程度上避免用戶(hù)完全依賴(lài)搜索總結(jié)生成的結(jié)果,減輕信息侵權(quán)的主觀惡性。除此之外,還應(yīng)當(dāng)注意搜索結(jié)果對(duì)原始網(wǎng)頁(yè)信息的引用限度,綜合引用內(nèi)容深度、廣度等要素,重點(diǎn)關(guān)注引用內(nèi)容篇幅、是否引用核心觀點(diǎn)等問(wèn)題,設(shè)計(jì)具體引用指標(biāo),在結(jié)論呈現(xiàn)時(shí)一并生成。對(duì)于引用指數(shù)過(guò)高的結(jié)論,在算法模型中添加攔截機(jī)制,以指示性語(yǔ)言方式呈現(xiàn),引導(dǎo)用戶(hù)通過(guò)點(diǎn)擊原始地址鏈接方式進(jìn)行查詢(xún)。這種分層式呈現(xiàn)思路,可以在一定程度上避免對(duì)原始平臺(tái)和作者的信息侵權(quán),形成良性市場(chǎng)秩序,保護(hù)其合法權(quán)益。
其二,明確告知義務(wù),保護(hù)用戶(hù)隱私。目前,隱私信息的判斷以信息主體是否愿意公開(kāi)為標(biāo)準(zhǔn),信息主體不愿意被他人知曉的信息,即使已經(jīng)公開(kāi)也屬于隱私范疇。同時(shí),一些個(gè)人信息雖然無(wú)法識(shí)別單獨(dú)個(gè)體,但是大量個(gè)人信息的組合往往足以精確定位到私人主體,可識(shí)別性較強(qiáng),未經(jīng)允許收集和使用這類(lèi)信息也侵犯?jìng)€(gè)人隱私權(quán)。因此,針對(duì)用戶(hù)隱私信息面臨的風(fēng)險(xiǎn),檢索系統(tǒng)應(yīng)當(dāng)明確告知收集此類(lèi)數(shù)據(jù)信息的范圍、目的、使用方式、必要性和可能產(chǎn)生的影響,應(yīng)當(dāng)征求用戶(hù)明確且獨(dú)立的允許。同時(shí),采取必要的保護(hù)措施,為用戶(hù)提供嚴(yán)格、完備的隱私和個(gè)性化設(shè)置服務(wù),賦權(quán)用戶(hù)隨時(shí)中斷數(shù)據(jù)關(guān)聯(lián)程序、隱藏相關(guān)檢索信息的權(quán)利。此外,要根據(jù)用戶(hù)需求不斷更新升級(jí)信息保護(hù)組件,以此更好地保護(hù)用戶(hù)隱私。
其三,提升算法透明度,賦能用戶(hù)“破繭”。ChatGPT推出的檢索功能與其他人工智能技術(shù)功能相似,在算法設(shè)計(jì)上都堅(jiān)持高隱秘性,這種“算法黑箱”對(duì)信息收集和處理過(guò)程進(jìn)行高度保密,用戶(hù)只能被動(dòng)接受具有一定價(jià)值傾向的結(jié)論,最終被困于“信息繭房”中。因此,信息檢索系統(tǒng)應(yīng)賦予用戶(hù)更多的知情權(quán)和決定權(quán),提升算法透明度,采用多元化、包容性的數(shù)據(jù)檢索方式,減少數(shù)據(jù)信息單一化價(jià)值傾向帶來(lái)的負(fù)面影響。在向用戶(hù)呈現(xiàn)最終結(jié)論時(shí),要盡可能呈現(xiàn)較為客觀、全面的信息目錄,按照一定標(biāo)準(zhǔn)進(jìn)行關(guān)聯(lián)度排序,以供用戶(hù)自主選擇,增強(qiáng)用戶(hù)的可選擇權(quán)和結(jié)論的可信度。同時(shí),應(yīng)展現(xiàn)信息刪選和排序的依據(jù),并建立用戶(hù)反饋機(jī)制,通過(guò)賦能用戶(hù)實(shí)現(xiàn)算法模型的不斷調(diào)整和完善,減少算法偏見(jiàn),提升軟件的開(kāi)放性。
人工智能與檢索引擎的高度融合,是一場(chǎng)機(jī)遇與挑戰(zhàn)并存的革新。隨著ChatGPT宣布推出檢索功能,信息檢索領(lǐng)域日益呈現(xiàn)出智能化發(fā)展趨勢(shì)。在ChatGPT檢索功能中,人機(jī)交互對(duì)話(huà)式的設(shè)計(jì),使得軟件可以根據(jù)用戶(hù)檢索語(yǔ)言的語(yǔ)境和目的,運(yùn)用算法模型,滿(mǎn)足個(gè)性化需求,提供更加具體、精準(zhǔn)的結(jié)論,且雙向反饋機(jī)制的設(shè)置,有利于持續(xù)優(yōu)化模型,當(dāng)用戶(hù)對(duì)結(jié)論尚有疑問(wèn)時(shí),可以進(jìn)行追問(wèn),提高檢索的動(dòng)態(tài)適應(yīng)性。但就現(xiàn)有技術(shù)來(lái)看,目前,ChatGPT推出的檢索功能的運(yùn)行仍存在一些潛在風(fēng)險(xiǎn),其在數(shù)字經(jīng)濟(jì)發(fā)展下對(duì)其他平臺(tái)和作者可能造成侵權(quán)隱患,影響正常市場(chǎng)競(jìng)爭(zhēng)。比如,用戶(hù)在檢索過(guò)程中暴露的碎片化隱私信息,可能會(huì)給個(gè)人隱私安全帶來(lái)風(fēng)險(xiǎn);個(gè)性化推薦的信息偏見(jiàn),可能會(huì)影響檢索結(jié)果的客觀性和全面性。因此,需要綜合治理,協(xié)同應(yīng)對(duì),推動(dòng)算法模型設(shè)計(jì)和檢索功能不斷升級(jí),明確提示信息源,嚴(yán)格遵守合理使用限度;對(duì)用戶(hù)嚴(yán)格履行告知義務(wù),保護(hù)其個(gè)人隱私安全;提升算法透明度,豐富檢索結(jié)果的呈現(xiàn)種類(lèi)??偠灾q證看待ChatGPT推出的檢索功能,力爭(zhēng)在維護(hù)個(gè)人權(quán)益和推動(dòng)技術(shù)發(fā)展的平衡中,實(shí)現(xiàn)協(xié)調(diào)發(fā)展和有效治理。
(來(lái)源:民主與法制時(shí)報(bào))