本刊唯一投稿渠道:dffxtg@126.com
當前針對數據爬蟲行為的司法實踐與理論發(fā)展已逐步形成權利保護與自我規(guī)制這兩種基本范式。其中,權利保護范式旨在為多元主體賦予標準化法定權利,并通過持續(xù)完善權利體系以應對不足;自我規(guī)制范式則通過信賴行為主體的自我判斷能力和市場調節(jié)機制,借助法律規(guī)范推動談判的積極作用,形成開放式規(guī)制框架以提升效率,并平衡私人權利與公共利益的沖突。由于權利保護范式在實踐中存在技術適配性差、忽視公共利益和多方協作受挫等問題,加之作為公共商品的數據具有非排他性與異質性價值,“搭便車”的批評難以成立,有必要采納自我規(guī)制范式,并對合同法規(guī)范予以重構。為此,需要超越傳統合意框架,轉而以公共利益具體闡釋為目標,依據數據互聯互通原則,充分評估被爬取數據帶來的技術創(chuàng)新能否形成互惠機制,從而形成多元主體參與的規(guī)制框架。
一、問題的提出
隨著互聯網技術的深度普及與數字化基礎設施的全面滲透,數據已經成為驅動現代社會運行的核心要素。不同場景下生成的多元數據呈指數級增長態(tài)勢,而網絡平臺作為數據聚合與分發(fā)的關鍵節(jié)點,既通過開放用戶交互界面實現數據共享,又因數據爬蟲技術的廣泛應用而陷入治理困境。所謂數據爬蟲技術,主要是指開發(fā)者通過自動化程序快速收集網絡平臺上公開發(fā)布的各類數據,并依照其意愿,通過各類算法將爬取的結果加以轉化,從而形成為其所用的結構化數據的技術流程。雖然該技術為數字經濟發(fā)展提供了資源支撐,但是也導致服務器過載、知識產權侵權、隱私泄露等系統性風險不斷提升的問題。這一技術引發(fā)的矛盾的本質在于:數據資源的開放性與平臺控制和用戶權益保障之間的張力已超出了傳統法律規(guī)制范式的應對范疇。
為解決前述問題,當前主流的互聯網服務供應商普遍采用了機器人協議(robotsprotocol)、驗證碼識別、訪問行為分析等技術手段來防范爬蟲行為,并采用“端對端”加密技術保障數據的傳輸安全。但是,技術對抗的“貓鼠游戲”難以根治問題。實踐中,前述技術手段屢遭破解,平臺單方面制定的機器人協議缺乏法律約束力,大量隱私和敏感數據完全未獲保護。
在此背景下,現有研究通過借鑒和完善既有法律框架,提出了兩種解決方案。其中,權利保護范式的支持者主張以保護知識產權和個人信息所牽涉的各項既有法定權利為基準,或擴大解釋前述法定權利的范疇,或參照此類法定權利體系,為網絡服務供應商和數據庫編制者引入新的權利架構,推動相關當事人主動展開交易并在發(fā)生糾紛時依法提起訴訟以獲得救濟。行為規(guī)制范式的支持者則主要依托我國《反不正當競爭法》等法律規(guī)范,將數據爬蟲行為定性為攫取他人競爭優(yōu)勢的不當行為,我國司法實踐中大量判例也采用該范式。
但是,個案優(yōu)勢并沒有轉化為體系效能,前述兩種觀點在實踐中均存在較為嚴重的結構性缺陷:權利保護范式易因其所引入的新興權利逐步泛化而導致數據壟斷和流通受阻;以競爭法為依據的行為規(guī)制范式則過度依賴“損害—救濟”的基本邏輯,難以回應數據要素市場化配置的動態(tài)需求。除此之外,既有規(guī)制范式的局限折射出更深層的理論困境:數據作為非排他性、可復制的生產要素,其價值實現高度依賴流通與再利用,靜態(tài)的財產權劃分無法適應數據生態(tài)的動態(tài)協作需求。因此,當數據爬蟲行為從“是否合法”的二元判斷轉向“如何合法實現利用”的治理命題時,有必要重構“權利本位”的邏輯。此時,以合同為核心的關系型規(guī)制范式便顯現出獨特優(yōu)勢,而如何利用被爬取對象與爬蟲技術使用者之間的合同安排來平衡數據使用者、控制者與社會公眾的利益,便成了值得深入探討的命題。有鑒于此,本文將首先嘗試揭示這一范式轉型的必然性,然后探討其制度建構的可行路徑。
二、權利保護與自我規(guī)制:規(guī)范數據爬蟲的兩種立場
當前,針對數據爬蟲的主要規(guī)制范式可分為權利保護與自我規(guī)制這兩種類型。其中,權利保護范式側重于以既有法定權利為基礎,通過明確權利主體、劃定權利邊界并建立相應的救濟機制,以應對數據爬蟲所引發(fā)的各類法律問題;自我規(guī)制范式則更加強調制度設計的靈活性,注重行為規(guī)范與市場機制之間的互動,嘗試通過行為主體的自主判斷與協作機制,實現對數據爬蟲行為的有效調控。
(一)
權利保護范式的演化
由于數據爬蟲行為會直接影響既有法定權利的行使與保護,遵循權利本位的基本思路,一方面,既有必要理順在先法定權利的實質內容、行使邊界和適用位階;另一方面,也應當為多元主體另行賦予依層次劃分的法定權利。唯有同時展開教義解釋和立法續(xù)造的工作,方能進一步完善權利保護范式指引下的規(guī)范內容,從而驅動行政監(jiān)管與司法監(jiān)督程序的持續(xù)運轉。
第一,數據爬蟲行為可能侵犯知識產權,特別是著作權。具體而言,數據爬蟲行為涉及對既有數據庫的訪問與使用,并在多數情況下會直接復制并傳輸數據庫所收錄的具體數據,而當此類數據庫的主要內容受著作權法等保護時,實施數據爬蟲行為的當事人便可能突破著作權法所規(guī)定的合理使用的限制,構成對既有受保護作品的不當使用,并進而侵犯著作權人所享有的法定權利。與此同時,數據庫的篩選與編制同樣能夠體現出一定程度的獨創(chuàng)性,故而亦有可能落入著作權法的保護范圍。在比較法上,歐盟立法者曾于1996年頒布了《歐盟數據庫法律保護指令》(以下簡稱《數據庫指令》)。根據該指令第3條的規(guī)定,即使不考慮數據庫的內容,當編制者出于自主且致力于形成獨創(chuàng)性智力成果的目標,通過篩選或編排數據庫所含具體內容,從而以原創(chuàng)的方式表達其獨創(chuàng)性能力,并由此形成其“個人風格”時,此類數據庫便因其內容篩選標準或編制方式而滿足獨創(chuàng)性標準,可適用于著作權法的保護。相反,如果此類數據庫的結構是由技術因素、規(guī)則或限制措施所決定的,即其呈現出的內容篩選標準或編排方式受限于無法改變的技術水平,則可以認定這些限制并沒有為數據庫的編制者留下任何自由創(chuàng)作的空間,不受著作權法與《數據庫指令》的保護。
第二,在部分法域,數據庫的內容采集、篩選或編制即使均未落入著作權法的保護范疇,亦可能因法律所構建的“雙軌制”數據庫保護體系而為數據庫提供特殊權利(suigenerisrights)保護。以歐盟為例,根據《數據庫指令》序言所述,編制數據庫所需的人力、技術和財力資源遠超簡單復制或以其他方式使用現有數據庫所需調用的資源,故而未經授權獲取或重復使用既有數據庫的行為可能會給該數據庫的編制者帶來嚴重的經濟損失,亦會減緩該領域的技術進步與革新。因此,《數據庫指令》第7條為數據庫編制者賦予了特殊權利,即當為獲取、驗證或呈現該數據庫所收錄的內容而已經實質性地投入了大量投資時,該數據庫的編制者能夠就此獲得15年的保護。因此,即使數據庫的結構或組織形式并不能具備獨創(chuàng)性特征,數據庫編制者亦有權阻止他人爬取并重復利用其所開發(fā)的數據庫之內容。通過引入這一并行的法定權利架構,歐盟立法者希望能夠為數據庫服務的開發(fā)者提供公平的經濟補償與足額激勵,以刺激其積極圍繞歐盟本土數據,投資、編制和維護相對應的數據庫,從而擴大歐盟在此方面的國際影響力。
但是,為數據庫的編制者所提供的雙軌制保護并未有效轉化為現實。在比較法上,除歐盟外,這一權利體系并未得到其他法域的普遍認同。一方面,盡管前述兩種法定權利并不必然交叉,也不以彼此為成立之條件,但是數據庫特殊權利在保護期限與范圍等方面實質上遠超著作權等傳統知識產權的保護強度。具體而言,由于數據庫編制者所享有的特殊權利因其增添、刪減或修正該數據庫內容的行為而能夠得到持續(xù)展期;同時,與著作權等知識產權不同,《數據庫指令》并未為該等權利規(guī)定基于合理使用原則的例外規(guī)定,這使得數據庫市場趨于集中,數據庫的生產與傳播亦受到極大的限制。歐盟委員會在2005年發(fā)布的該指令實施效果調研評估報告中更是直接點明,引入數據庫特殊權利并未促進歐盟范圍內對數據庫的編制和維護的相關投資。
另一方面,數據庫的編制者所享有的著作權與特殊權利所能觸及的范圍亦存在著較大爭議。實踐中,由于缺乏公開且清晰的權利登記機制,當事人通常無法認定其所享有的權利類型及其范圍,這使得對這一問題的確認需要通過司法程序方能得以明確。同時,數據庫編制者唯有提供其作出實質性投資的定量或定性證據才能受到保護,因此即使特定數據庫的內容由單一來源構成,該數據主體仍并不當然享有對此類數據形成的數據庫之特殊權利。換言之,此類特殊權利的保護對象是數據庫的編制和維護工作,而非數據的形成過程或數據本身。盡管通過對數據來源主體施加一定程度的限制能夠防止有價值的數據歸于壟斷,但是同樣需要考慮的問題是,如若所涉數據庫并不受前述兩種法定權利的保護,則數據庫編制者對于此類數據庫的控制權限度為何;相對而言,對該數據庫進行爬取的當事人應承擔何種義務,或是受到何種限制?對于這一問題,歐盟法院在2015年裁定“ryanair訴praviation”案時僅部分予以回應:只有當涉訴數據庫編制者享有《數據庫指令》所規(guī)定的兩種法定權利時,該指令對法定權利及其保護的強制性規(guī)定方才得以適用;當所涉數據庫并不牽涉上述兩種權利時,除非本國法律另有規(guī)定,數據庫的編制者幾乎享有對其所編制和維護的數據庫的全部控制權,并可以通過隱私政策、合同等方式任意調整該數據庫的使用范圍。但是,歐盟法院對該案的判決并未提供更為詳盡的規(guī)則指引和制度方案。
除此之外,數據處理技術的發(fā)展及其所實現的新興用途亦為規(guī)制數據爬蟲行為帶來了更多挑戰(zhàn)。通常而言,當數據爬蟲行為與數據庫的通常用途相沖突,或不合理地損害數據庫編制者的合法利益時,出于保護法定權利的基本目標,似乎可以推論數據庫編制者得禁止第三方當事人以重復且自動化的方式獲取數據庫所收錄的非實質性內容。但是,隨著人工智能技術的發(fā)展,用于訓練人工智能系統的數據爬取活動,尤其是對數據庫進行全文復制的做法屢見不鮮,由此帶來了以下問題:通過算法對受保護數據庫的挖掘,如對網站或任何其他形式的數據庫的挖掘行為是否屬于重復、系統地獲取該數據庫所包含的內容?換言之,數據庫的編制者是否可以直接依據法定權利而對此類行為加以限制?
盡管這類問題目前尚無定論,但是總體而言,采用權利保護路徑來規(guī)制數據爬蟲行為的做法意味著有必要進一步完善法定權利體系并提升特定權利的保護強度,同時還需要通過引入法定例外和限制措施來逐步完善制定法,從而對既有法定權利的內涵與范疇進行輔助性說明,由此圍繞不同當事人享有的多種權利得以形成相互交織的法律規(guī)范體系。
(二)
自我規(guī)制范式的建構
1.數據爬取行為的社會意義之建構
對于數據的爬取與使用行為而言,另一種較為常見的規(guī)制路徑在于類型化處理當事人的行為,并基于法定權利、公共利益等不同理由而對當事人所實施的各類行為予以評價。對于數據爬蟲行為而言,其行為的社會意涵可以從數據爬取時的環(huán)境性質、數據爬取的具體方式,以及數據的訪問和使用權限的配置這三個層面加以判斷和理解。而基于對行為主體自我判斷的信賴與市場機制在協調不同主體間關系時所發(fā)揮的積極功能,可以提煉出一種自我規(guī)制的基本范式。
首先,同既有財產法規(guī)范與傳統保持一致,數據爬取時的環(huán)境性質對于數據爬蟲行為的性質認定具有重要意義。每一種不同的空間形式及其所孕育的環(huán)境均會提供多元的群體規(guī)范,網絡環(huán)境的開放性是影響認定數據爬取行為法律性質的重要因素,而其去中心化的結構特征亦為不同用戶提供了多元可能。在傳統財產法所處的社會背景中,財產的開放程度已與用戶處置財產的權限之間形成了較為穩(wěn)定且受普遍認同的關聯關系。例如,社會對于商店、公園等開放的公共場所與私人住宅的準入權限所形成的共識截然不同。同理,網絡環(huán)境中的數據在開放的公開網絡和限制訪問的私有網絡中也具有不同的社會意義與價值。在公開網絡中,數據通常被認為是普遍對外開放以供公眾訪問的,而在由具有較高隱私特征的數據所組成的網絡環(huán)境或需要通過身份驗證方能訪問的環(huán)境中,數據則受到更嚴格的控制,未經授權的爬取可能難以獲得數據映射對象、服務供應方及社會公眾的普遍認同。同時,數據的公共性特征也對認定數據爬蟲行為的性質具有一定影響。傳統財產法對于公共財產與私有財產有不同的調控強度標準:通常而言,公眾得以合理使用道路、水利設施等公共財產,而在使用私有財產時則通常需要征得權利人的同意。同樣,網絡上的公共數據在一定程度上也可以受到爬取和使用。對于可能受到影響的主體而言,由于此類公開數據本就旨在向不特定的公眾展示,故而存在相對較低的隱私或受保護之期待。然而,若數據涉及個人隱私、商業(yè)機密或受著作權保護的信息,則爬取行為可能被視為侵犯隱私權或知識產權,這就對互聯網的開放屬性提出了挑戰(zhàn)。
其次,實施數據爬取行為的技術手段對于認定其行為的法律意義同樣重要。一方面,數據爬取的頻率和請求方式是影響法律性質的關鍵因素。若爬蟲技術的開發(fā)者和使用者通過高頻、大量的請求對目標服務器進行抓取,可能對后者的資源產生過度消耗,甚至導致系統癱瘓,這毫無疑問會對遭爬取的系統造成實質損害;相比之下,較低頻率、合理數量的爬取請求則因其不會對服務器的正常運行構成干擾而通常不會遭致否定性評價。另一方面,數據爬取的路徑也會產生直接影響。例如,一些爬蟲程序使用繞過登錄驗證、反機器人驗證等技術手段來獲取受限數據或進入受保護的網絡,這與通過開放且未設防的網頁接口進行爬取的行為形成了較為鮮明的對比。同時,數據爬取手段的隱蔽程度也扮演著重要角色。一些爬蟲技術的開發(fā)者采用技術手段隱藏其來源或模擬真實用戶的瀏覽行為,以規(guī)避被發(fā)現的風險,這比相對透明、公開的爬蟲行為更難被社會所接受。
最后,數據爬蟲行為的性質還取決于目標服務器是否設有較為明確的訪問和使用權限配置方案,這樣的配置方案通常以技術標準和法律規(guī)范這兩種形式加以體現,從而界定數據爬蟲行為的合法性基礎。如果目標服務器通過技術標準設置了清晰的訪問權限,那么爬蟲行為的合法性通常容易界定。爬蟲工具在爬取服務器上所載數據前可以讀取相關配置文件,開發(fā)者亦可以通過閱讀網站的隱私政策等信息來獲取可供爬取的數據范疇,并調試其所開發(fā)的工具,使其能夠遵守網站的要求。因此,當網站明確限制爬取某些數據時,違背這些規(guī)定的爬蟲行為可以被視為一種超越授權的訪問行為。除了技術性限制外,法律規(guī)范也在數據爬蟲的合法性判斷中發(fā)揮重要作用。以著作權法等為代表的知識產權法和保障計算機系統正常運轉的刑法規(guī)范等均會對爬蟲行為予以直接評價。盡管作用方式有所不同,技術標準和法律規(guī)范都能夠更為精準地界分前述空間環(huán)境與技術手段所無法觸及的規(guī)范細節(jié),從而為零散規(guī)則的體系化工作提供基準。
2.針對數據爬取行為的自我規(guī)制范式
在前述三個方面的分析基礎上,圍繞數據的爬取過程,基于對行為主體自我判斷的信賴,并充分利用其對市場調節(jié)機制的主動適應過程,可以形成一種更為靈活、高效且適應性強的自我規(guī)制范式。
具體而言,一方面,數據爬取行為主體通常具有一定的自我判斷能力,能夠根據自身利益和法律規(guī)范作出合理決策。在商業(yè)環(huán)境中,數據爬取者面臨著來自法律規(guī)范、道德聲譽和客戶關系等方面的壓力。為了避免侵權訴訟、聲譽損害及客戶流失,大多數數據爬蟲技術的開發(fā)者和使用者往往會自覺約束自身行為,避免過度爬取、繞過訪問限制措施或侵害他人隱私。這種基于長遠利益的自我判斷能夠在一定程度上規(guī)范數據爬取行為,不僅減輕了外部監(jiān)管的負擔,還提高了監(jiān)管的效率,有助于實現資源的合理分配。另一方面,市場調節(jié)機制在數據爬取的自我規(guī)制范式中具有不可忽視的調節(jié)作用。市場機制通過價格、供需關系及競爭態(tài)勢反映各類行為對市場環(huán)境的影響。例如,當市場對某類數據需求增加,并以價格的提升作為信號加以反映時,爬取者會增加對該數據的爬取行為,而數據持有者則會提高保護措施及相關收費標準。這種供需動態(tài)反映了市場的自我調節(jié)功能,也能在一定程度上減少對外部強制性監(jiān)管的依賴。與此同時,若數據爬取行為損害了數據持有者或其他利益相關者的權益,市場也會對不合規(guī)的爬取行為進行懲戒。比如,部分違背行業(yè)準則并爬取大量敏感數據的主體可能面臨著行業(yè)內禁令、喪失商業(yè)合作機會等市場壓力,這種通過市場調節(jié)機制予以展開的懲戒機制能夠避免爬取行為徹底失范。
在發(fā)展自我規(guī)制范式的過程中,法律的作用并非提供強制性的懲戒措施,而是意在推動當事人就爬取行為展開談判,這意味著客觀的判斷表征比主觀的目的更加重要。唯有通過立法樣例與司法個案認定既有的客觀表征,即可識別的行為主體、具體動作之內容,以及實際或可能產生的實踐后果后,社會才能夠逐步對特定行為的影響及意義形成評價與共識。有關數據爬蟲的法律規(guī)范亦實際上圍繞著這三個方面加以演化,并最終形成以驗證機制為中心的規(guī)范體系。在這一過程中,盡管同樣存在著授權與受權的基本關系,但是對于受權主體而言,其所享有的權利僅能作為參與論辯的理由,并作為界定行為性質的門檻,卻不能構成對特定目的之限制措施的決定性說明。而在法定權利之外,亦有公共利益等其他理由的參與,并需要從更為宏觀的視角平衡損害、風險與收益。因此,自我規(guī)制范式實質上是一種描述與規(guī)范不同當事人基于私人或公共利益等諸多理由而展開談判的開放式結構。
綜上所述,在規(guī)制數據爬蟲行為的過程中,出于不同的法律傳統與實踐現狀,可以分別從保障當事人享有的法定權利與規(guī)范當事人的特定行為這兩種視角設計和調適相關法律制度方案。對這兩種制度體系的建構過程予以觀察,亦可以發(fā)現法律規(guī)范所需發(fā)揮的功能同樣有所不同,并且其發(fā)展趨勢會受到相對應的司法實踐影響而有不同側重,并最終呈現出不同的社會景觀。因此,有必要從理論層面重新考察與反思前述兩種范式的差異,并結合數據爬蟲行為這一具體問題的情境特征綜合考量兩者的利弊。
三、從權利保護到自我規(guī)制:數據爬蟲規(guī)制范式的對比與反思
盡管權利保護范式與自我規(guī)制范式在政策目標上存在一定共識,但是面對數據爬蟲所引發(fā)的復雜社會問題,兩者所提供的解決路徑和制度方案卻存在顯著差異。分析權利保護范式的理論與現實挑戰(zhàn)可以發(fā)現,以“賦權”為前提的規(guī)制路徑正反映出多重局限:這一范式不僅在權利識別成本、邊界劃定及救濟機制構建方面存在技術瓶頸,更可能因激勵結構設計不當而抑制技術創(chuàng)新?;诖?,自我規(guī)制范式因其有能力回應相關批評而成為更優(yōu)的選擇。
(一)
權利保護范式的框架廓清與不足
權利保護范式的基本邏輯在于,通過將數據視作一種財產性權利,能夠將其之上所附著的財產性利益進行有效分割,并賦予各個權利條塊以相對固定的邊界。在這種范式下,數據權利被分解為不同的模塊,每個模塊在統一的法律框架下相對獨立且明確,從而便于權利的分割、流轉和保護。這一做法有助于在具體的法律情境中明確權利人與義務人之間的關系,使數據的歸屬、使用和轉讓具備清晰的法律依據。
1.權利保護范式的理論框架
在權利保護范式的指引下,法律規(guī)范的核心重點在于為特定主體賦予法定權利,并提供相應的保護機制。因此,首先要清楚界定數據權利的具體內容,并對不同種類的權利事項進行歸納與分類,以形成不同的權利條塊,使不同的權利主體明確其所享有的法定權利的內容與范疇。權利條塊的劃分使得數據的各項權利更為明晰,進而為數據的使用、交易和保護提供清晰的法律依據。其次,通過標準化處理權利條塊的邊界,財產性權利保護范式能夠有效應對不同主體間的社會關系。在現實中,數據權利的使用和流轉通常涉及多個主體,如數據的生成者、收集者、使用者和數據主體等。標準化的權利條塊有助于明確不同主體的權利和義務,防止權利邊界過于模糊造成他人識別的困難。例如,數據控制權的條塊可以規(guī)定數據主體對于數據的管理權限,禁止未經許可的訪問;使用權條塊可以限定數據收集者的使用范圍,防止數據濫用。這種權利條塊的邊界設定使得法律在解釋和適用時更具操作性,有助于減少不同主體間的潛在沖突。此外,財產性權利保護范式的邏輯還在于通過對新興權利的界定與分類,實現其與在先權利的順暢銜接。傳統財產法已為不動產、動產等的權利劃分提供了較為穩(wěn)固的法律規(guī)范,而考慮到數據之上所形成的財產性利益與這些在先權利之間存在緊密程度不一的關聯,故有必要在既有法律規(guī)范的基礎之上進一步理順雙方之間的邏輯關系,從而避免在先權利承受較大沖擊。
為解決這些問題,如延續(xù)前述賦權思路繼續(xù)推演,便不難得出以下兩種對現有立法的調整方案:
第一,以向數據主體進行普遍賦權的方式,逐步為多元主體構建起不同層次的法定權利體系,從而進一步完善前述規(guī)范的缺漏與不足。以歐盟為例,近年來其新頒布的《數據治理法案》(datagovernanceact)和《數據法案》(dataact)均重點關注非個人數據的流通和交易過程,并沿用了權利保護范式的基本思路。其中,《數據法案》第二章和第六章分別賦予用戶對物聯網產品所產生數據的知情權和可攜帶權,以及相應需要履行的法定義務。而為避免數據交易過程中當事人濫用強勢談判地位的問題,該法第13條更是明確列舉了被視為不公平和被推定為不公平的合同條款清單,并特別指明在數據交易的合同限度之下,應以促進數據的復制、訪問和使用為判斷標準,限制另一方當事人合理復制、訪問或使用合同約定的數據之條款均應視為不公平條款;此時,制定該條款的當事人需要承擔說明該條款并不構成對另一方當事人的不公平限制的證明責任。此外,無論是《數據治理法案》,還是《數據法案》均以但書條款的方式說明了前述諸項數據使用權與《一般數據保護條例》(generaldataprotectionregulation,以下簡稱gdpr)及知識產權等領域立法的體系關系。由此,多重數據權利立法的“疊床架屋”式構造得以釋明數據爬蟲行為在實踐中所形成的社會意義。
第二,為輔助性地說明不同主體所享有的各項權利,并理順不同權利間的沖突,還需引入法定權利的例外與限制措施。盡管細節(jié)有所差異,但是在著作權法中,多數法域均對著作權人的作品規(guī)定了合理使用制度,準許他人在滿足一定條件的前提下不經著作權人授權便能直接使用其作品。除法定的權利登記簿外,這些例外與限制措施亦有助于說明著作權人享有的法定權利之范圍。例如,為促進包括人工智能系統在內的新技術發(fā)展與應用,歐盟委員會于2016年9月頒布了《數字單一市場版權指令(草案)》,并于2019年經修訂后正式成為歐盟法律的組成部分?!稊底謫我皇袌霭鏅嘀噶睢废到y性地梳理了既有法律規(guī)范中存在的諸多權利沖突,并明確引入了針對文本和數據挖掘(textanddatamining)的特定例外措施。但是,考慮到這一用途的保護范疇相對寬泛,且當事人間規(guī)避前述例外措施的合同的合法性仍有待甄別,現有立法的實施前景尚需進一步通過司法實踐加以探明。相比之下,gdpr則為個人所享有的數據受保護權的限度提供了較為明確的說明,這可以視為進一步完善立法的指向性參考。
2.權利保護范式的不足
權利保護范式的局限性并不僅限于立法方法和技術層面,更深層次地體現在其理論前提,即“賦權于特定當事人”這一基本條件之上。該條件不僅在司法實踐中會遇到諸多問題,而且在理論層面容易面臨諸多挑戰(zhàn),使得權利保護范式無法完全適應當代法律需求。
首先,權利保護范式的核心思想是通過法律賦予個體以明確、獨立的權利地位,使其能主動維護自身權益。然而,在數據爬蟲的具體語境之中,這種賦權機制的有效性幾乎難以實現。一方面,賦權通常需要明確界定權利主體及其范圍,但是在數據共享與流動的背景下,特定當事人的權利界限往往難以明確界定。例如,當個人數據在數字空間中快速流動和頻繁交易時,權利人不僅可能未曾認識到其權利已然受到侵害,實施爬蟲行為的當事人亦可能無法分辨自動化程序爬取所得數據中牽涉的權利人的權屬信息,此時傳統的賦權做法并不足以防止數據濫用和隱私泄露問題,因為當事人根本無從開展有效的談判與磋商。另一方面,賦權范式在技術上往往難以適應復雜的現代技術場景。隨著人工智能、大數據等技術的普及,權利的客體不斷發(fā)生變化,權利保護的對象在信息化社會已不再是單一主體,很多情況下權利會分散在復雜的網絡和平臺環(huán)境中,不再局限于傳統的物理形態(tài),因此單一主體賦權邏輯在面對大規(guī)模微型權益等更為廣泛的公共問題時往往顯得力不從心。數據爬蟲行為所涉及的數據規(guī)模與種類均極為復雜,直接援用既有的登記制度顯然并不可行。同時,即使當前法定權利登記簿的編制和維護成本已有所減低,但是在初始階段的全面登記工作就已面臨著登記成本超出意圖保護的微型權益之價值這一客觀現象,而權利爭議所附隨的訴訟和執(zhí)法成本更是必然高企,難以實現長期維持。因此,賦權范式無法滿足跨領域、多層次的技術場景需求,且可能因過度關注個體權利而忽視整體性的公共利益。
其次,在權利保護范式中,立法通常以某一特定權利或特定主體為中心,忽視了利益相關方之間的復雜關系。例如,知識產權保護的傳統方式是對特定作者或發(fā)明人賦予專屬權利,但是基于數據爬蟲行為而衍生出的機器學習和人工智能系統等產品和服務的創(chuàng)造過程往往涉及多方協作,權利難以明確單一主體。這種單一主體賦權的模式不能充分反映創(chuàng)新生態(tài)系統的多方利益訴求。試圖通過為特定當事人賦權來解決利益分配的問題,更可能導致合作創(chuàng)新者的貢獻無法得到充分肯認,進而陷入專利叢林的問題之中,反而會對創(chuàng)新的效率產生鉗制效應。而權利的排他性特征亦會阻礙知識流通和公共利益發(fā)展,并進一步造成“反公地悲劇”現象,這與保護公共福祉的初衷相悖。
最后,“賦權于特定當事人”的前提性條件在技術和社會快速變化的背景下難以真正實現。一方面,技術進步使得權利的邊界和內容快速變化,傳統的法律框架和賦權方式無法適應動態(tài)變化的需求。以網絡平臺的用戶數據為例,用戶在上傳、生成和公開數據的過程中并不具有對此類數據進行絕對控制的期待,亦不會考慮到其數據對未來的創(chuàng)新用途所能帶來的影響。而若將時間這一維度同時納入考慮范疇,則可以通過著作權一例更進一步認識到法律框架的滯后性所帶來的長遠影響:由于著作權的保護期限通常持續(xù)數十年,這導致眾多長久以來已不被當代社會所知曉的作品之權利人仍可基于其所享有的法定權利而否定新興的特定用途,而這些權利人在創(chuàng)作時顯然無法預見這一點。因此,即使通過立法為數據的來源主體賦予更為廣泛的數據管理權、刪除權和轉移權等權利,當圍繞數據形成新的社會需求時,現有的權利保護范式亦難以及時擴展或變更權利內容加以匹配,導致現有立法在面對新型數據權益時明顯存在回應不足的困難。
另一方面,單一賦權模式通常難以顧及基于數據爬取行為而開發(fā)的技術創(chuàng)新所帶來的正外部性,而外部性的存在通常意味著為數據賦權所產生的市場交易過程不會實現社會福利的最大化。在實踐中,交易成本的存在使得經濟主體間難以通過自愿協商實現帕累托最優(yōu),因而初始產權分配顯得尤為重要。然而,即使承認改進初次分配方案的做法可以在一定程度上提升效率,交易成本始終存在的事實也仍然會對其所能發(fā)揮的制度功能造成限制。具體到數據交易的語境之中,為數據賦權的正當性論證之邏輯前提在于,期待通過明確的權利登記等措施降低交易成本,從而刺激后續(xù)交易以促進資源的最大化利用。但是,市場機制只能反映交易方當事人的支付意愿和偏好,并不能展現圍繞數據所形成的技術創(chuàng)新的全部價值,因此這一進路容易輕視數據開發(fā)這一社會新興活動所帶來的正外部性,并使得數據的價值被低估,此時,后繼創(chuàng)新者自然缺乏足夠激勵投入成本進行開發(fā)。
綜上所述,考慮到外部性問題難以完全通過賦權于特定當事人予以內化并輔以市場機制的形式加以解決,有必要進一步考察其他可能的規(guī)制范式。如若存在同等或更優(yōu)的制度方案,則權利保護范式不應成為規(guī)制數據爬蟲行為的當然選擇。
(二)
自我規(guī)制范式的基本原理與誤解澄清
1.自我規(guī)制范式的基本原理
在權利保護范式之外另尋出路的理論基礎源自數據自身所具備的獨有特征,即其非排他性的公共商品屬性和其基于預測價值或更廣泛的使用價值而體現出的異質性財產價值。
具體而言,一方面,數據因其非排他性的根本特征而需要建構不同于傳統財產法的獨特制度方案。根據法律的經濟學分析,建立私有產權的初衷旨在通過賦予個體明確的權利,從而消除資源利用的外部性問題,以避免“公地悲劇”現象,即在資源缺乏明確權屬界定的情況下因過度使用而導致的枯竭現象。由于多數傳統資源難以迅速再生,故而明確的產權界分能夠促使權利人在使用時考慮長期價值,防止無序使用和浪費。但是,數據本質上具有非排他性特征,可以被多個主體同時使用而不會影響他人的使用,亦不會導致其資源陷入枯竭,更不會因高頻次反復使用而影響其自身質量,這一特征與土地、房屋等傳統私有財產顯著有別。因此,將數據視同傳統資源并為單主體賦權以避免公地悲劇的規(guī)制范式顯然與實踐脫節(jié),存在邏輯層面難以克服的困難。相反,將數據用于共享和廣泛使用可以實現不同應用領域和情境中的組合與創(chuàng)新,從而持續(xù)產生新的價值,并進一步推動技術進步和提升社會福利。此外,還有必要申明,數據財產性價值的異質性使得其權利邊界的劃定更為復雜且具有彈性,無法用單一的所有權結構來管理。這一過程表明,保障數據流通能夠產生較為顯著的正外部性,而權利范式指引下的交易過程無法充分反映這一社會收益。
另一方面,數據的財產性價值主要體現在其預測價值和使用價值上,并呈現出顯著的多元、非線性發(fā)展趨勢。數據的預測價值和使用價值主要體現在其被應用于不同領域和情境中所產生的不同收益。數據本身并沒有太多固有價值,其價值往往依賴于數據的分析和挖掘過程。例如,消費者的購買記錄在商業(yè)領域中可用于市場預測,而在學術研究中則可能用于行為研究和社會心理分析。因此,數據的使用價值高度依賴不同的實踐場景和具體用途,并隨著規(guī)模的增加、種類的多樣化和分析技術的進步而不斷得到提升,大規(guī)模使用和共享數據由此能夠產生增值效應,并能夠貢獻出更多潛在價值。相比之下,由于不動產和動產等傳統財產的價值通常會隨著使用頻次和人數的遞增而逐步遞減,故而傳統財產法的設計邏輯以所有權和用益權為核心,通過經濟效益遞減的權利層級結構來實現對財產之上所涉社會關系的有效管理,并呈現出較為典型的金字塔結構。但是對于數據而言,其財產性價值更符合“喇叭效應”,即隨著數據量的增加和數據類型的多樣化,數據的用途和潛在價值成倍增長。隨著數據內容趨于多元、豐富,不同數據間的相互關聯能夠揭示出單一數據所無法呈現的信息,從而產生更深層次的洞見和預測。這一增值特性在大數據分析、機器學習和人工智能等應用場景中尤為突出。在這些領域,數據量和數據多樣性直接決定了分析的準確性和預測的精度。因此,對于數據而言,能夠以較低的交易成本實現規(guī)模效應便尤為重要。而要實現這一目標,便需要提出一種不同于權利保護范式的全新制度方案。也正因此,數據顯然無法完全適用于傳統的財產權利模型。
2.對“搭便車”之批評的誤解澄清
從當事人行為的視角,沿用自我規(guī)制范式而對權利保護范式提出的反駁亦源于對“搭便車”的錯誤批評的矯正?!按畋丬嚒毙袨橹傅氖莻€體或組織在未承擔應有的成本或義務的情況下,利用他人或社會的資源或成果來獲利。對于傳統財產法體系而言,積極消除“搭便車”行為有其重要意義,這是因為“搭便車”行為不僅容易導致公共資源難以保障持續(xù)供給,還意味著社會資源存在著受權主體難以形成控制的外部性,減損了財產權為其所帶來的激勵效果,導致權利人缺乏足夠的動力以謹慎、積極的態(tài)度使用和開發(fā)其所擁有的財產;而將這一基本邏輯推而廣之,便不難理解,廣泛的“搭便車”行為會對圍繞所有權這一主題而建構的財產法體系帶來嚴重的挑戰(zhàn),因為所有權只會逐步變得有名無實,最終空留形式框架,卻無實質功能。而正是由于數據爬蟲行為實質上是對既有數據庫內容的讀取與復制,故而容易被視為對他人勞動成果的恣意掠奪,并常被冠以“搭便車”加以批評。
但是,著重考察數據的基本特征便不難發(fā)現,參照“搭便車”行為而對數據爬蟲行為所作的批評并不準確,因為這種觀點忽視了數據的獨有特征,對數據爬取行為的評價失之偏頗。
反駁搭便車行為的批評可以從數據所反映出的公共商品特征著手展開。通常而言,既往研究在討論公共商品時常引用國防與公園這兩個樣例作為典型。其中,前者雖然能夠使全體公民受惠,但是顯然不可能轉為私有,亦不可能排他性地適用于任何特定公民,加之維護國防設施和持續(xù)供給國防服務需要投入巨額成本,故常需以國家稅收予以填平;后者則可能因公園本身人滿為患而喪失非排他性特征,使得任何出于觀光、休閑等目的而使用公園的公民無法實現其原初期待,但是將公園轉為私有亦會因公眾不能自由使用而減損其在提升城市建設水平、居民心理健康等方面所帶來的積極效果,且經私有化后公園的權利人亦不可能全然控制公園內景觀為附近居民生活帶來的增益,即私有財產之上溢出的正外部性。這兩個樣例分別反映了界定公共商品特征的兩種典型情境,即公共商品可能因固定成本過于高昂而無法歸于私有,或因權利人俘獲全部收益的邊際成本過高而無法實現。而具體到數據這一具體情境中,由于其開發(fā)過程不僅兼具固定成本極為高昂的屬性,需要投入大量資源進行開發(fā)與維護,而且數據處理過程中的各方利害關系人亦不太可能因其所付出的勞動而俘獲他人享受的全部社會收益,因此,可以認為數據是極為典型的公共商品,此時唯有將其留為公用方能發(fā)揮其最大價值。
從更為一般的視角展開觀察可以發(fā)現,前述兩種典型樣例實質上共同表明,將具備較強公共性特征的商品授予私人所有并任由其處分的做法并非良策。進一步推論可知,對于公共商品而言,在提出可能涉嫌搭便車的批評時,不應以私人利益受損為判斷標準,而需參考系爭資源是否可能導致“公地悲劇”,而造成“公地悲劇”現象的一大主因便是資源的稀缺性。對于公園而言,由于它們均存在總體規(guī)模有限、受益人群所得收益由點及面逐步衰減、無法實現多人同時共享、需不斷補足或更新等特征,監(jiān)管機構不可避免地要長期干預所涉資源的使用秩序,市場聲譽機制此時亦能起到輔助性的管理和協調作用。但是,考慮到單個數據并不會隨著使用者增多而消耗殆盡,且其價值只會因為使用頻次提升和范圍擴張而逐步增加,將其賦予私人所有反而會造成“反公地悲劇”,使得數據完全無法得到充分運用,進而無法實現社會價值的最大化。由此,對其可能構成“搭便車”行為的批評自始便無法成立,對數據的爬取在特定意義上可能構成對數據的合理使用。
四、數據爬蟲的規(guī)制范式重構:以合同為中心
在規(guī)制數據爬蟲的過程中,鑒于權利保護范式面臨諸多制度瓶頸,自我規(guī)制范式逐漸展現出更為顯著的比較優(yōu)勢。與此同時,隨著技術與交易結構的日益復雜,自我規(guī)制范式也迫切需要嵌入一套兼具制度彈性與行為可預測性的實踐框架,以通過具體機制實現和強化其規(guī)范功能。在此背景下,合同機制成為自我規(guī)制范式在復雜數據場景中指導實踐的基點。
(一)
從財產到合同:規(guī)制范式的中心轉移
鑒于數據可在不影響他人的情形下得到充分利用,且其利用過程并不會導致自身歸于滅失,既有關于公共商品的理論框架便必須予以重構,而其上所映射的規(guī)制范式亦有必要予以調整。
在傳統的公共商品規(guī)制與激勵理論中,由于非排他性與非競爭性特征是不可自發(fā)形成的獨特品格,規(guī)制機關必須采取特定手段予以維持,方才能夠實現公共商品的持續(xù)供給和公平取用,這導致公共商品經消耗后的補齊必須充分且及時,“搭便車”的批評實質上也源于這一需求。但是,政府直接供給公共商品和強制性法律規(guī)范支撐下的執(zhí)法行為等均會招致信息不對稱、監(jiān)管俘獲、效率低下等批評,以使用者為中心的賦權思路與市場自由交易機制便不可避免地極具理論吸引力,因為政府規(guī)制行為在這一理論模型中常收到無法平衡成本與收益的負面評價。然而,數據既不能通過賦權私有的形式予以開發(fā)和利用,且其本身即屬于無可爭議的公共商品,加之前述兩個特征無需刻意付出努力便能自我呈現,因此應當從理論層面另謀出路。
重新考慮前述論證過程,可以發(fā)現當事人所負從事社會生產的義務來源始于對其不事勞作的批評,這意味著必須存在可靠的聲譽機制,否則即使特定的群體存在著生存壓力,作為獨立個體的社會成員亦不會朝著同樣的方向努力。更具體而言,對于易遭耗盡但從設計層面必須維持易于取用的公共商品來說,不能及時為其充足供給作出貢獻的當事人往往會受到負面評價,而由此形成的社會壓力會迫使共同體中的每一位成員不斷通過勞動等方式形成受到認可的辛勤成果。此時,聲譽機制所能發(fā)揮的實質功能便是識別未付出勞動的當事人。即使批評的強度不一,但是未通過勞動積累財富而導致的貧窮亦從反面體現出了這一批評的分量。
然而,在數據的語境下,“持續(xù)付出”這一要件似乎有不同的意涵。不同于持續(xù)對公園草木進行修剪、維持道路交通的公共秩序,或是不斷投入資源以提升教育水平等傳統公共商品的供應場景,數據本身并不需要通過持續(xù)維護才能得到利用;相反,每一種圍繞數據所形成的創(chuàng)新用途都是對既有數據的再次編列和整理,而唯有通過匯聚和處理等過程,數據方能取得社會所認可的價值。對于數據來源者來說,這意味著一旦特定數據得以生成,來源者便不再有必要獲得法律制度所賦予的排他性激勵,而俘獲其上所能形成的社會收益便是此類激勵的典型。此時,即使數據來源者的隱私、個人信息等權利同等重要,這也并不意味著應當將數據之上可能牽涉的各項權利分門別類列入財產權等體系框架之中,從而維系原有權利框架不至于坍塌,而是必須從區(qū)分具體場景及其適用各領域立法的行為規(guī)制視角加以理解,因為數據的社會價值本身便是從公共商品的視角得以證成的。
因此,在對待數據所引發(fā)的社會問題時,有必要采納一種非自愿主義的視角重塑相關理論構想與規(guī)范實踐??紤]到社會應當以實現互惠為組成與運轉的基本條件,由此權利與其上所形成的同意理論并不居于首要位置,而應當為持續(xù)的協商與錨定標準的截斷性判定所讓步。由于以數據爬蟲行為為基礎而實現的人工智能等技術進步所帶來的社會收益是無法刻意避免的公共利益,無論是否在主觀層面刻意尋求獲得此類收益,任何既定權利人都會從中受益,這導致既定權利人對其所享有的權利之處分形式所表達的同意不僅難以促進社會合作的形成,還有可能因稟賦效應等因素而遏制技術創(chuàng)新。同時,由于這些社會收益對其所賴以生存的社會之共同體而言不可或缺,因此既有權利人對于促成科技進步的開發(fā)者所負有的寬容義務并非源于既有權利與其上所主觀授予或擬制的同意,而是源于需要對其從社會這一共同事業(yè)之中所獲得的收益予以適當反哺,從而推動科技進步的不斷延續(xù)與發(fā)展。正是因為既有權利人能夠以這種方式受益,所以可以推論出其有義務為供給這些社會收益的社會制度或結構作出貢獻,而要求其承擔與其他貢獻者相當的負擔。具體到數據爬蟲這一具體語境之中,由于復制和傳播數據的邊際成本幾近為零,有必要考慮的重點在于數據貢獻者的規(guī)模是否足夠廣闊,以及數據的來源和內容能否持續(xù)得以更新。同時,由于總會有一部分新用戶成為貢獻者,不斷出現新的“搭便車者”通常反而意味著更寬廣的發(fā)展前景,對于數據與其上所形成的技術行業(yè)而言亦是一件喜事。
此時,基于對公共利益與基本權利的闡釋而形成的侵權法規(guī)范體系能夠輔助性地說明社會行為的基本界限,因為交易過程本身不應由于可能構成侵權而需要全然禁止,而是需要予以保留,再輔以監(jiān)管或訴訟的方式加以事后調整。因此,這一過程從根本上推翻了以不動產為中心建構起來的傳統財產法所塑造的社會基本樣態(tài);相反,對于數據而言,不應以交易成本趨于零為目標,而是應以趨于穩(wěn)定且落入可預計的范疇這兩條軸線予以考量,而唯有持續(xù)且高頻次的交易過程才能清楚界定前述兩條軸線的所及范疇。但是,僅有侵權法規(guī)范作為輔助性說明工具,并不能使數據的流通和交易過程擺脫混沌狀態(tài)而形成有序的社會秩序。因此,考慮到合同法規(guī)范對于當事人之間權利和義務的規(guī)劃具有理清功能,便有必要重新考慮合同法理論,并相應地重構其規(guī)范內容。
當然,仍有必要說明的是,前述說理并不意味著權利保護模式完全無法回應數據爬蟲行為所造成的全部問題。恰恰相反,對這兩種理論范式的比較意在指出,相較于行為規(guī)制范式,數據之上所存在的一部分獨有的特征使得權利保護范式自身存在的困難無法徑直被忽視或予以克服。正是因為可能存在資源消耗殆盡現象,以及必須消除搭便車行為,所以傳統社會中出現私有產權制度;除了知識產權外,過往的財產類型大致也并未超出理論所預設的范圍,這使得直接套用前述邏輯并未置理論于難堪的境地。但是,對于數據而言,反向套用這一基本邏輯,即先創(chuàng)設私有產權、再憑此界定某種行為系搭便車行為的做法并不正確。因此,先交由私人分配、再以公共利益為理由進行干預的邏輯鏈條自始就不適用于數據;相比之下,行為規(guī)制路徑顯然更具合理性,畢竟當一種方案存在難以繞開的嚴峻挑戰(zhàn),另一種方案卻仍能保留一定的靈活空間時,后者顯然是更佳的制度方案。
(二)
在何種語境下重構合同法規(guī)范?
即使脫離數據爬蟲的具體語境,合同法規(guī)范亦并不全然仰仗當事人之間的合意;在如毒品交易、賭博等法律所嚴格禁止的特殊情境中,合同效力亦嚴格受法律約束。因此,“以合意為中心建構的合同常會讓步于公共政策目標”這一看法已成為一般共識,當前我國民事立法業(yè)已普遍接受這一觀點。那么,在回應前述問題時便有必要考慮,合同法規(guī)范為何仍有必要針對數據及包括爬蟲行為在內的具體應用加以調整?對這一問題的回答,在一定程度上也有助于刻畫出圍繞數據而形成的合同法理論與法律規(guī)范的基本樣態(tài)。
鑒于數據的生產和處理活動普遍由私主體完成并發(fā)展,因而即使存在較多法律強制性規(guī)定,對于包括數據爬蟲行為在內的處理行為仍應以私法作為優(yōu)先處置的工具。而正如前文所述,對數據的規(guī)制所欲實現的最終目標并不是圍繞財產權建立登記制度,以便國家和私主體形成對此類財產權強度不一的控制,而是應當盡可能推動以信賴為基礎的社會合作,其在數據領域的具體表征便是數據的流通活動,唯有提升數據流通的頻次才能提升數據之上各類用途所能形成的社會收益。因此,為遏制爬蟲行為而單方面擬定的機器人協議、隱私政策等文件的效力便不能再從允諾與否的立場出發(fā),而是必須從公共利益的整體視角出發(fā)提供新的理論建構。換言之,在數據這一具體領域之中,單個數據主體所能發(fā)揮的私有財產處置與分配作用并不具備基礎性的理論意義,而是成為服務于詮釋公共利益這一目的的衡量標準。因此,在這種預設下重新看待合同法的基本功能,便能夠理解如下判斷的合理之處:無論表現形式為何,顯然不應僅以同意要件及其所反映的雙方共識來看待包括數據爬蟲在內的一系列法律文件的效力,而是應當將其視為公共利益映射到特定主體的過程、方法與內容的載體,分別從不同主體的視角對合同法規(guī)范所能發(fā)揮的多元功能加以闡釋。
其中,對于數據被爬取的當事人而言,應以實現互聯互通作為缺省規(guī)則,準許當事人就數據爬取的數量、頻次和具體內容等通過單方聲明或合同的形式自治,從而形成具有場景和領域特征的自我規(guī)制框架。采用自我規(guī)制范式的原因在于,通過準許數據的持有者和處理者就數據傳輸、處理和交易等社會活動依據場景展開自由協商,能夠最大限度地提升數據的使用頻次和范圍,實現數據價值的最大化。在這一過程中,以合同等形式所呈現出的自治安排不應被理解為是一項靜態(tài)、封閉的商品買賣協議,而更應被視作一項強制數據交易雙方履行交流義務的制度性框架。與單次的商品交易不同,這類合同反映的是交易雙方在長期合作中形成的一種信任結構、預期協調機制與靈活調整空間。
基于此,在數據爬取的語境中,考慮到數據價值的增長路徑,前述當事人通過談判所達成的合同之功能在于確定數據爬取的邊界條件和行為預期,使雙方在不確定的互動中保持利益協調與制度穩(wěn)定。具體而言,對于市場中的數據提供方與數據爬取方而言,由于雙方在合作初期均無法準確知曉另一方對數據的使用意圖、承載能力和安全容忍限度,此時,數據提供方通常擁有關于數據庫構建成本、運營機制、安全邊界等方面的信息,能夠形成一定的驗證方式和技術壁壘,提高未經協商的爬取行為的成本與不確定性。同理,實施爬蟲行為的主體對于行為的預期意圖及社會價值,特別是對所爬取數據能夠實現的功能與替代成本等具有較為良好的判斷。唯有約定一套適應未來調整的機制,方能實現數據高效流通,促進數據的社會價值最大化,從而持續(xù)調整并形成共識基礎。因此,數據持有者雖然并非自愿與所有爬取方建立合同關系,但是,只要數據開放行為能夠為實現數據互聯互通創(chuàng)造普遍且必要的制度條件,持有方就有義務在可接受的條件下維持這一制度運作的基本功能。換言之,在該場景下,當被爬取方明確以聲明或合同形式準許爬取數據時,被爬取方便需要履行技術層面響應特定數據訪問請求、準許他人占用服務器資源、構建部分開放的數據庫結構、準許不特定當事人訪問數據庫內容等積極的容忍義務。同時,抓取方則應當履行合理使用數據、標注數據來源,以及在技術層面遵守爬取頻率限制、安全機制與機器人協議等規(guī)范的義務。
更進一步而言,在這一關系結構中,合同主要起到信號機制的作用。通過在合同中明確安全技術要求、聲明數據用途邊界、制定回應式的治理機制,數據持有方傳遞出“有限開放、可協商”的信號,從而引導爬蟲行為的實施者與其展開有效談判,并營造受控且可持續(xù)的合作秩序,而非采取激進的反爬取策略。同理,實施爬蟲行為的當事人也應當通過明確自身使用目的、提出基于公共利益的訪問請求等方式,展現其合作誠意與對具體用途正當性的判斷能力。這種互動過程使得合同本身成為制度性博弈與合作關系生成的基礎。而當數據爬取行為產生爭議時,雙方可依托先前建立的行為預期、機制性安排與合作慣例,通過對合同條款作回溯訂立背景的解釋與協商更新,實現對分歧的制度性吸收與轉化,避免因一方違約或濫用爬蟲機制而引發(fā)的極端對抗。此時,前述數據交易合同的正當性源自持續(xù)的合作過程,而非初始的一次性要約與承諾。
而對于行政機關等公共規(guī)制主體而言,應當以“任意當事人對數據互聯互通的基本現狀所做的改變,會致使其背負致力于確保他者不會因此而陷入更糟糕境地的義務”作為監(jiān)管數據爬蟲行為的分析主軸。具體而言,由于任何圍繞數據爬蟲等獲取和處理行為的合同或單方聲明均實質上是對公共利益的特定闡釋,作出闡釋的主體便有必要超越合同或單方聲明所牽涉的主體,通過確保全體社會成員能夠受益來實現互助,這一要求對于爬蟲行為的實施主體和爬取對象均應適用。而在規(guī)制的過程中,有必要充分尊重具體技術場景下的行業(yè)慣例與通行做法,從而為不同領域的數據開發(fā)標準和利用限度劃定基準。
在考察爬蟲行為時,公共規(guī)制主體有必要以事中和事后視角介入評估與衡量此類數據處理者在獲取數據后所能實現的數據傳播頻次、范疇和技術創(chuàng)新價值,從而實現事后的效率最優(yōu)(ex-postefficiency)。在事中的評估過程中,需要深入分析數據處理者在獲取數據時所采取的技術手段和實現路徑,進而衡量數據被獲取后的傳播頻次與范疇,以及數據利用過程中可能帶來的技術創(chuàng)新價值。如果部分數據處理者利用爬蟲技術高效地獲取了大量數據,但這些數據并未得到充分應用,即未能進一步提供市場分析、趨勢預測或技術創(chuàng)新等方面的支持,則此類爬蟲行為應當被禁止,被爬取對象所采取的較為嚴苛的驗證措施、保密機制等技術手段亦具備一定合理性。此時,公共規(guī)制主體應參考我國《民法典》等對合同內容的合法性、公平性與公序良俗等評價標準,對隱私政策、機器人協議等所載內容和實施此類文件中所列事項的技術手段作實質性審查。同時,還應當重點關注爬蟲行為對數據持有者及其數據庫內容的潛在影響,特別是對包括知識產權、國家安全和市場競爭等其他法律規(guī)范目的造成的影響,以及編制和維護數據庫內容的固定成本、驗證訪問權限的邊際成本、數據庫所處市場環(huán)境和當事人的市場地位等因素。在商業(yè)競爭環(huán)境中,不同數據持有者所采取的限制和保護措施強度參差不齊,舉報和起訴頻次亦有所差別,由此逐步形成了行業(yè)慣例的譜系,這對數據爬蟲實施主體和監(jiān)管機構而言均可成為參考;如果要使此類聲譽機制發(fā)揮最大效用,便應在實踐中允許當事人就技術措施展開合理攻防,從而避免“虛空打靶”的規(guī)制錯誤。此外,公共規(guī)制機構亦應對數據庫所處的市場環(huán)境進行評估。對于高度競爭或壟斷的行業(yè)而言,數據的獲取和利用可能直接影響到市場的公平性和競爭態(tài)勢,因此,公共規(guī)制機構有必要權衡數據持有者的市場地位、該數據的商業(yè)價值,以及爬蟲行為對行業(yè)整體創(chuàng)新和競爭的長遠影響,從而圍繞數據爬蟲行為形成較為綜合的考量框架。
而從事后的視角來看,有必要優(yōu)先采用形式判斷的方法,重點評估爬蟲行為與機器人協議等文件所載內容的異同。對于通過爬蟲方式獲取并傳播受其他法律規(guī)范所保護的數據之行為,應當以當事人所發(fā)布的隱私政策、機器人協議等文件內容作為基準;對于超出前述文件所載明的爬蟲行為限度及其所獲內容,則應當衡量“嚴守前述文件所列可供爬取的數據范疇、頻次等”之判斷是否有助于促進數據互聯互通,而非對實施爬蟲行為的當事人是否能夠真正實現技術創(chuàng)新徑直作出判斷。當這一規(guī)范目的無法實現時,應準許爬取方通過申訴舉報和司法訴訟的方式取消相應限制;對于前述文件并未列明的數據庫內容,仍應以數據的互聯互通作為執(zhí)法原則,并可準許當事人依據既有法律部門之中所規(guī)定的其他侵權法規(guī)范,以個案執(zhí)法和司法審判的方式尋求救濟,防止數據互聯互通的社會價值對法律所保障的其他公共利益造成傾軋。
結語
盡管圍繞財產權所形成的權利保護范式在保障傳統財產與其上所能實現的各類功用方面發(fā)揮了較為重要的作用,但考慮到數據的獨有特征,以自我規(guī)制范式予以調控的做法能夠在理論層面實現較強的彈性。這種范式不僅從整體視角為社會接納和包容新興技術發(fā)展預留了空間,而且對于數據爬蟲這類后果較為隨機的行為而言,亦具有“避免因財產權稟賦效應引發(fā)交易障礙”這一獨特價值。
在實踐發(fā)展的過程中,通過保障數據的互聯互通,數據之上所牽涉的各方主體均能夠以互惠為基準實現較為有效的團結與分工,從而使得公共利益這一寬泛的概念獲得了較為具象的闡釋。從這個角度來看,從財產到合同的規(guī)制范式轉移并非對法律實踐的描述性觀察結果,而是一種理論發(fā)展的必然。
馬春曉|論行政犯的行刑反向銜接
毛逸瀟|金融犯罪外圍式立法的危機與應對
目錄|《東方法學》2025年第4期(數字化???)
雷磊|完美的效率還是負責任的正義?——大語言模型時代數字司法的價值反思
白云鋒|數字體行政組織法地位的審查框架
劉云|網絡數據爬取合法性判定的三階層認定標準
上海市法學會官網
http://www.sls.org.cn
上觀號作者:上海市法學會
地表最強生物?可在太空生活?我們獲得它的基因會統治宇宙么
挪威“末日種子庫”收集樣本超125萬,每年只開3次,可抗核彈
讓讀者奉為經典的五本末世進化必讀小說,不做炮灰