博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python爬虫学习之页面登陆
阅读量:4640 次
发布时间:2019-06-09

本文共 321 字,大约阅读时间需要 1 分钟。

爬虫学习的一点心得

登陆主要有3种方法:使用selenium,cookies,模拟表单登陆

个人对于一般情况使用cookies登陆

可以实现一次手动,长期自动,可以绕过登陆(登陆的相关信息密码,账号等会存于cookies中)

注意:get网页信息时候最好是先建立一个session,不要直接requests.get(),否则对服务器而言相当于每次新开一个浏览器来访问容易被识别,不符合用户行为

先创建一个session,然后每次都用同一个session去访问,注意对于HTTPS的网站,需要带上参数verify=False,否则爬虫会报错!

转载于:https://www.cnblogs.com/tian2B/p/10914672.html

你可能感兴趣的文章
反射的所有api
查看>>
Js 判断网页窗口是否滚动到底部
查看>>
上传文件
查看>>
css 定位及遮罩层小技巧
查看>>
用java向mysql数据库中插入数据为空
查看>>
项目中非常有用并且常见的ES6语法
查看>>
mac 端口转发方案
查看>>
[2017.02.23] Java8 函数式编程
查看>>
loadrunner支持https协议的操作方法-经验总结
查看>>
Knowledge Point 20180305 数据在计算机中的表示
查看>>
谈谈对web标准的理解
查看>>
DIV+CSS规范命名大全集合
查看>>
求二进制中1的个数(编程之美2.1)
查看>>
hdu 4289 网络流拆点,类似最小割(可做模板)邻接矩阵实现
查看>>
58前端内推笔试2017(含答案)
查看>>
写给自己的web开发资源
查看>>
Java学习笔记
查看>>
sprintf 和strcpy 的差别
查看>>
打表打表何谓打表?
查看>>
MPEG4与.mp4
查看>>