2026/1/11 4:07:44
网站建设
项目流程
网站开发费用报价表,网站制作需要多少钱品牌,做电影方面的网站怎么做,网站实时推送怎么做这个代码短且简单#xff0c;主要就是展示一下pyquery的用法 代码就这么长#xff0c;连三十行都不到#xff0c;虽然简单#xff0c;但我还是巨详细的说说
一、发送请求
第一步依然是发送请求#xff0c;但在发送请求之前#xff0c;我们爬取的这个小说网站有好多页小…这个代码短且简单主要就是展示一下pyquery的用法代码就这么长连三十行都不到虽然简单但我还是巨详细的说说一、发送请求第一步依然是发送请求但在发送请求之前我们爬取的这个小说网站有好多页小说所以限制一下就爬取前5页的于是就需要for循环就是下面这句for i inrange(1, 6): url fhttps://b.faloo.com/y_0_0_0_0_6_1_{i}.html接着那句时伪装头这句伪装头也可以放在for循环外边主要是把python解释器伪装成浏览器然后发送请求不然服务器那边识别到你是python解释器发送的请求就不给你响应下面这句就是发送请求response requests.get(url,headersheaders)然后获得响应(response)话是这样说的但你发送请求后人家服务器那边到底有没有给你响应你是不是需要验证一下就是下面这句if response.status_code200:二、解析网页如果服务器那边给你回应了那状态码就是200接着就可以拿这pyquer对响应的HTML进行解析html pq(response.text)三、定位解析后就可以对小说名称的位置进行定位就是下面这句items html(div div div h1).items()依旧用的是CSS选择器后面的items()方法时让items,变成一个可迭代对象方便后面获取文档四、获取内容并输出foritem in items: # 小说名print(item.text())既然上面已经说到items已经变成可迭代对象那就进行遍历遍历后的内容还不是需要的文档还是HTML需要用到text()方法获取文档然后输出就行了五、结果展示当然五页的内容不止这些这只是截了一部分