IT之家7月21日消息,據(jù)外媒AppleInsider今晚報(bào)道,蘋(píng)果公司在一篇新的研究論文中再次強(qiáng)調(diào),蘋(píng)果智能模型的訓(xùn)練并未使用任何非法從網(wǎng)絡(luò)抓取的數(shù)據(jù)。
蘋(píng)果在新發(fā)布的研究論文中表示,如果出版商不同意其數(shù)據(jù)被抓取用于訓(xùn)練,蘋(píng)果公司將不會(huì)抓取這些數(shù)據(jù)?!拔覀兿嘈?,使用多樣且高質(zhì)量的數(shù)據(jù)來(lái)訓(xùn)練我們的模型是必要的。這些數(shù)據(jù)包括我們從出版商那里獲得授權(quán)的數(shù)據(jù)、公開(kāi)可用或開(kāi)源數(shù)據(jù)集中的數(shù)據(jù),以及通過(guò)我們的網(wǎng)絡(luò)爬蟲(chóng)Applebot抓取的公開(kāi)信息?!?/p>
蘋(píng)果公司補(bǔ)充道:“我們不會(huì)在訓(xùn)練基礎(chǔ)模型時(shí)使用用戶(hù)的私人數(shù)據(jù)或用戶(hù)交互信息。我們還采取措施應(yīng)用過(guò)濾器,去除個(gè)人身份信息,排除粗俗和不安全的內(nèi)容?!?/p>
論文的重點(diǎn)在于蘋(píng)果如何執(zhí)行這一抓取過(guò)程,特別是Applebot系統(tǒng)如何在“網(wǎng)絡(luò)雜亂無(wú)章的環(huán)境”中確保能夠獲取有效信息。然而,蘋(píng)果也回應(yīng)了有關(guān)版權(quán)的問(wèn)題,每次都重申蘋(píng)果始終尊重版權(quán)持有者的權(quán)益。
IT之家從論文中獲悉,蘋(píng)果公司表示:“我們將繼續(xù)遵循最佳的倫理抓取實(shí)踐,包括遵守廣泛采用的robots.txt協(xié)議,允許網(wǎng)頁(yè)出版商選擇是否讓他們的內(nèi)容被用于訓(xùn)練蘋(píng)果的生成式基礎(chǔ)模型。網(wǎng)頁(yè)出版商對(duì)Applebot可以訪問(wèn)哪些頁(yè)面以及如何使用這些頁(yè)面擁有細(xì)致的控制,同時(shí)這些頁(yè)面仍然能出現(xiàn)在Siri和Spotlight的搜索結(jié)果中?!?/p>
這些“精細(xì)控制”顯然是基于長(zhǎng)期使用的robots.txt系統(tǒng)。其并非標(biāo)準(zhǔn)的隱私保護(hù)機(jī)制,不過(guò)仍被廣泛采用,網(wǎng)頁(yè)出版商通常會(huì)在網(wǎng)站上放置一個(gè)名為robots.txt的文本文件。
如果AI系統(tǒng)看到該文件,它就應(yīng)該避免抓取該站點(diǎn)或文件中列出的特定頁(yè)面。“遵守robots.txt協(xié)議很容易,而OpenAI也曾表示它會(huì)遵守這一協(xié)議?!?/p>
論文地址
成了反派大佬的白月光之后,她喚醒他的真心!
今日推薦:《成了反派大佬的白月光之后》作者:天星異客。點(diǎn)擊文末超鏈接開(kāi)始觀看吧~第68章萬(wàn)千尸骨中尋到他她找來(lái)了一點(diǎn)干草,拾了些枯柴細(xì)枝,生了火——。晫身上的盔甲已經(jīng)卸掉,瑤將他微微向火堆拉近了些?!肮?,有沒(méi)有感覺(jué)好點(diǎn)?”她摸了摸晫的手,依然冰涼,不禁又加了些木柴——。為什么還是冰的?瑤呆呆的看著晫?zhuān)念澋膮柡。 第三本:《成了反派大佬的白月光之后》作者:天星異客簡(jiǎn)介:可甜可咸能撩,異能深沉男V嬌軟腹黑女,天星異客這本小說(shuō)必看。只想努力賺錢(qián),將來(lái)做大佬,卻因一則神秘的招聘廣告,在劫難逃_。臉相怪異可怖的少年、擺鐘一樣搖晃的女仆、拉便不埋時(shí)隱時(shí)現(xiàn)的黑貓……一座遠(yuǎn)離城市燈火,隱匿在深山密林中的莊園,到是什么。