以下选项中,爬虫可能遇到的反爬虫策略以及解决措施正确的是:( )
选项:
A:通过headers反爬虫:伪造headers获取内容
B:基于用户行为反爬虫:动态变化去爬取数据,模拟普通用户的行为,使用IP代理池爬取或者降低抓取频率,或通过动态更改代理IP来反爬虫。
C:基于动态页面的反爬虫:跟踪服务器发送的ajax请求,模拟ajax请求
D:数据加密:对部分数据进行加密的,可以使用selenium进行截图,使用python自带的pytesseract库进行识别,但是比较慢最直接的方法是找到加密的方法进行逆向推理。
发布时间:2024-06-13 09:46:33