免責聲明
歡迎您使用群益社群平台所提供的各項金融資訊服務,為維護您的權益,使用網站請閱讀以下聲明,使用者將視為同意本網站各項聲明:
群益社群平台及其資料提供者、合作結盟廠商與相關電信業者網路系統因硬體設備之故障、失靈或人為操作上之疏失導致傳輸無法使用、遲延、或造成任何資料內容(包括文字、數字、圖片、聲音、影像)遺失中斷、暫時、缺漏、更新延誤或儲存上之錯誤,群益社群平台均不負任何責任。
群益社群平台站上所提供之投資建議及參考資料內容,不得作為任何交易行為之依據,使用者依建議或資料內容進行任何投資行為所產生之風險及盈虧,均需完全自行負擔,群益社群平台不對使用者之投資決策負任何責任。
群益社群平台中之所有鏈結可能連結到其他個人、公司或組織之網站,對被鏈結之該等個人、公司或組織之網站上所提供之產品、服務或資訊,群益社群平台概不擔保其真實性、即時性、正確性及完整性。
群益社群平台對於第三人透過本網站銷售的任何商品,或提供之各種商品促銷資訊及廣告,群益社群平台均不對其交易安全、商品及服務內容負任何擔保責任,其間之所有交易、擔保、賠償責任及售後服務皆係存在於使用者與商品或勞務提供者之間,使用者應事先詳讀各項規格與活動說明,交易期間如因商品或服務提供者發生任何變故或產生糾紛,群益社群平台不負任何責任。
使用者同意群益社群平台保留修改本聲明之權利,修改後之聲明將公佈於群益社群平台上,不另行個別通知使用者。
使用者之發言不能涉及招攬、投顧行為、抬價、點位等內容(涉及個別期貨交易契約未來交易價位之研判、建議或提供交易策略之建議),若有發現此行為本網站對其留言不負任何責任,並將會刪除相關資料如文字、圖片或檔案以及會員身分。
Cloudflare(NET.N),這家上市的雲服務提供商,推出了一款新的免費工具,旨在阻止機器人對其平臺託管的網站進行數據爬取,用於訓練AI模型。
一些AI供應商,包括谷歌(GOOGL.O)、OpenAI和蘋果(AAPL.O),允許網站所有者通過修改其網站的robots.txt文件來阻止他們用於數據爬取和模型訓練的機器人。但正如Cloudflare在其宣佈防止機器人的工具的帖子中指出的那樣,並非所有的AI爬蟲都遵守這一規則。
公司在其官方博客上寫道:“客戶不希望AI機器人訪問他們的網站,尤其是那些不誠實的機器人。我們擔心,一些企圖規避規則獲取內容的AI公司將持續調整以逃避機器人檢測。”
因此,爲了解決這個問題,Cloudflare分析了AI機器人和網絡爬蟲的流量,優化了自動機器人檢測模型。這些模型考慮了多種因素,包括AI機器人是否試圖通過模仿使用Web瀏覽器的外觀和行爲來規避檢測。
Cloudflare表示:“當惡意行爲者試圖大規模爬取網站時,他們通常使用我們可以指紋識別的工具和框架。基於這些信號,我們的模型能夠適當地標記來自規避型AI機器人的流量。”
Cloudflare已設置了一個表單,供主機報告涉嫌的AI機器人和網絡爬蟲,並表示將繼續逐步加入黑名單。
隨著生成式AI的繁榮推動模型訓練數據的需求,AI機器人的問題變得尤爲突出。
許多網站對AI供應商未經通知或補償就對其內容進行模型訓練感到警惕,選擇封鎖AI爬蟲和網絡爬蟲。據一項研究顯示,全球排名前1000的網站中約有26%封鎖了OpenAI的機器人;另一項研究發現,超過600家新聞出版商已封鎖了這種機器人。
然而,封鎖並非百分之百有效的保護措施。正如前文所述,一些供應商似乎在忽略標準的機器人排除規則,以在AI競賽中獲得競爭優勢。AI搜索引擎Perplexity最近被指控冒充合法訪問者從網站爬取內容,而OpenAI和Anthropic據稱有時也忽略robots.txt規則。
在上個月寫給出版商的一封信中,內容許可創業公司TollBit表示,事實上,他們看到“許多AI代理”都在無視robots.txt標準。
像Cloudflare這樣的工具可能會有所幫助,但前提是它們能夠準確檢測祕密操作的AI機器人。它們並不能解決發佈者面臨的更難解決的問題,即如果封鎖了特定的AI爬蟲,可能會犧牲來自像谷歌AI概覽這樣的工具的轉介流量。