GitHub实施更严格的风控规则阻止中文用户访问 疑似是为了反爬虫和反抓取
早前 GitHub 因为失误部署了屏蔽所有中国 IP 地址的规则,中国 IP 地址访问时会出现禁止访问提示,随后 GitHub 更新规则并解释是部署错误,更新规则后中国 IP 地址可以重新访问。
如果之前是失误那现在肯定就是故意的了,GitHub 部署的新规则会对用户语言进行检查,如果用户使用的是中文 (仅限 zh_CN) 则可能会触发限制而被限制访问,不过从情况来看 GitHub 应该是为了反爬虫的 (例如某 SDN 无差别拉取 GitHub 上的项目搬到自家平台)。
从测试情况来看 GitHub 将多个条件整合用来触发限制,例如首先检查 GitHub 的常规规则 (包括黑名单 IP 和 UA),然后检测 IP 地址质量,以上两个条件全部通过后再检查第三个条件,也就是浏览器请求头的语言部分是否包含 zh_CN,如果检测到用户使用的中文则会返回错误。
也就是说 GitHub 并没有针对特定区域的 IP 进行封禁,如果用户 IP 质量没问题的话则不会触发语言检测,因此如果用户使用企业代理软件访问 GitHub 的话就可能因为 IP 地址质量差 (脏 IP) 而触发语言检测。
从这些情况来看 GitHub 大概率是为了反爬虫和反抓取,目前大量 AI 爬虫对 GitHub 疯狂抓取用来训练模型,这种抓取行为不仅会给 GitHub 服务器造成负担,也会浪费大量流量造成 GitHub 成本增加。
如果用户并非爬虫并且访问受到影响,那也可以进行针对性的解决:
1. 简单方法就是直接修改请求头将语言修改为 en_US 等其他未被限制的语言
2. 更换质量更好的 IP 地址避免触发风控,当然更换 IP 地址可能会增加潜在使用成本
不过针对语言的检测很容易被绕过,接下来 GitHub 很有可能会观察情况并对修改语言的行为进行检测,毕竟反爬虫是个长期工作,GitHub 也只能根据爬虫的情况进行针对性的策略调整实现封禁。
-
谷歌搜索称AI概览不会导致网站流量下降 但前提是用户提出的问题更多
目前已经有多个 SEO 网站和站长分享数据表明谷歌搜索在推出 AI 概览后导致网站流量下降,原因在于谷歌搜索 AI 爬虫会自动检索网站内容并生成回答,因此用户并不需要点击网站就可以知道答案。按照这种情
-
埃隆马斯克计划在xAI Grok聊天机器人中添加广告 允许营销人员投放付费内容
据英国金融时报发布的消息,埃隆马斯克本周通过 X/Twitter 直播与广告网络进行讨论,埃隆马斯克称将允许营销人员在 xAI Grok AI 聊天机器人里投放广告。埃隆马斯克称他的团队致力于使 Gr
-
GPT-5发布后ChatGPT Plus用户权限被缩减引起用户抗议 萨姆奥特曼亲自道歉
本周五 OpenAI 发布大家期待已久的 GPT-5 系列模型,该模型在推理、编码和工具调用等方面取得重大进步,而且所有用户都可以免费通过 ChatGPT 使用 GPT-5 模型。然而根据 ChatG
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩
- 最高检发布《未成年人检察工作白皮书(2024)》
- 雷佳音和岳云鹏主演:《长安的荔枝》今晚开播
- TikTok正式在美国停止服务!字节跳动旗下剪映海外版CapCut、Lemon8等应用均在美国停服
- 导演陆川回应《749局》口碑崩盘:演员和主创是最好的 有事冲我来
- 卢布汇率人民币2024年1月29日
- 合付通app v1.6.1最新版本2022下载地址
- 啥都印 1.0.0.0最新版本2022下载地址
- 易胜宝app v2.4.3最新版本2022下载地址
- 进程终结者 1最新版本2022下载地址
- 华亿乐购app V2.7最新版本2022下载地址
- 聪明派AI数学 v1.2.0最新版本2022下载地址
- 爱拍 2.4.0.0最新版本2022下载地址