商业动态

一键禁用 AI 模型爬虫机器人,Cloudflare 推出 「Bot Fight Mode」 防火墙服务

7 月 5 日消息,网络服务商 Cloudflare 近日推出一款名为 「Bot Fight Mode」 的防火墙工具,站长们可以在控制台开启相关服务,从而防止自己网站的内容被用于训练 AI 的机器人爬虫扒取。

注:爬虫是一种自动化的程序,可以在互联网上搜索和获取信息,目前许多厂商使用相关爬虫扒取各大网站信息用于训练 AI 模型,相关爬虫容易导致被扒网站产生大量异常流量,为此站长需支付高昂的网络带宽费用,同时也容易导致网站上大量原创 / 隐私内容泄露

据悉,Cloudflare 推出的相关工具主要利用签名比对、启发式算法、机器学习和行为分析技术来辨别爬虫,站长还可以按照需要放行 「好的 AI 机器人」 抓取信息(此类 「好的 AI 机器人」 主要寻找网站的 robots.txt 来获取信息,通常不会对网站本身产生异常流量,也不会将网页所有数据直接用于全盘训练模型)。

互联网为许多大语言模型 (如 OpenAI 的 GPT 模型和谷歌的 Bard) 提供了大部分的训练数据,如今许多厂商为了刷自家 AI 模型分数,大肆通过网络爬虫 「拿来式」 地获取训练数据,从而让本应你情我愿的行为变得 「污名化」,各大网络商直接推出此类禁用 AI 爬虫的服务也在意料之中。

广告声明:文内含有的对外跳转链接 (包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

推荐阅读

外资正在疯狂抢购印度资产,债券、股票,他们全都要

admin

跟特朗普闹翻了?马斯克 「百日维新」 狼狈收场

admin

「特朗普交易」 热度渐起,一波限购又来了

admin