GPTBot是什么?网络爬虫工具 GPTBot

OpenAI 昨日发布了旗下网络爬虫工具 GPTBot。该 GPTBot 工具能够在注重版权的基础上,使用透明的方式收集网页信息,来训练 OpenAI 旗下的各 AI 模型

GPTBot 使用专有网页 UA 表示其爬虫身份,完整 UA 字符串为(Mozilla / 5.0 AppleWebKit / 537.36 / KHTML, like Gecko; compatible; GPTBot / 1.0; + https://openai.com/ gptbot),任何网站管理者都可以自由允许或阻止该爬虫工具进行数据采集。

a942ba15-f22c-4081-b14a-486712001c59

850dfb7d-6e46-46e1-814b-3f3e775b0650

OpenAI 声称,若网站管理员不希望被爬虫搜集资料,管理员可以在网站服务器的 robots.txt 文件中完全禁止 GPTBot 抓取信息,或自行决定 GPTBot 抓取网站上的指定信息

未经允许不得转载:统信UOS之家 » GPTBot是什么?网络爬虫工具 GPTBot

相关文章