关注全球
专注海外

通过搜索引擎打开知乎页面,用户可能会看到乱码

知乎正在加强反爬措施,除了百度和搜狗,其他搜索引擎已无法抓取其内容。通过搜索引擎打开知乎页面时,用户可能会看到乱码,需要刷新才能正常显示 (知乎是有目的性的拦截搜索引擎或其他爬虫,这些爬虫使用的通常是无头浏览器,用户使用的浏览器则是正常版本,因此在刷新时可以通过知乎的反爬策略)。这一措施旨在保护数据免被用于 AI 训练。此外,知乎还强制用户登录才能查看完整内容,以防止爬虫批量抓取 (解决知乎强制登录的方案)。用户可通过安装 uBlacklist 扩展程序屏蔽知乎链接,避免搜索结果中出现知乎内容。

-=||=-收藏赞 (1)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《通过搜索引擎打开知乎页面,用户可能会看到乱码》
文章链接:https://topstip.com/open-the-zhihu-page-via-search-engine-and-see-garbled-code/
转载说明:请注明来自“TopsTip”并加入转载内容页的超链接。
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

评论前必须登录!

立即登录   注册