查看一下网页的编码,比如是gbk的话,就rencoding=#39gbk#39一下内容摘自requests文档 requests会自动解码来自服务器的内容大多数unicode字符集都能被无缝地解码请求发出后,requests会基于。
这个可以通过浏览器自带的f12 ,或者通过鼠标右键,审计元素获得当前html源代码 答题不易,互相理解,您的采纳是我前进的动力 如果我的回答没能帮助您,请继续追问 您也可以向我们团队发出请求,会有更专业的人来为您解答。
print responsetext 原始内容在 responsecontent 里,bytes,自己想怎么处理就怎么处理单个请求完全没必要用 Session直接 requestsgetxxx 就可以了最后,弄不明白怎么处理编码错误的字符串就仔细想想,或者用 Python。
可以去了解下python如何调用webkit的引擎,你说的那种不是用js加密,只是用js动态加载页面内容必须用webkit之类的浏览器引擎去渲染。
这里简单介绍一下吧,以抓取网站静态动态2种数据为例,实验环境win10+python36+pycharm50,主要内容如下抓取网站静态数据数据在网页源码中以糗事百科网站数据为例 1这里假设我们抓取的数据如下,主要包括用户。