关于爬虫解析页面时的一些有意思的坑-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

关于爬虫解析页面时的一些有意思的坑

阅读量：5303 次

发布时间：2019-06-14

本文共 211 字，大约阅读时间需要 1 分钟。

爬虫比较关键的一步就是解析下载后的网页，我这几天在用的是requests-html库自带的xpath方法，但是我在爬取一个小说页面的时候遇到了困难，这是一个静态页面，我通过右键检查复制xpath路径，但是却得到了一个空对象，打开源代码，对比右键检查的代码，我发现两者之间居然不相同。有点意思的坑

右键检查得到的html

网页源代码的html

记录一下，免得再踩坑。

转载于:https://www.cnblogs.com/yfc0818/p/11072677.html

你可能感兴趣的文章

VMware中CentOS设置静态IP

剑指Offer_编程题_7

js 变量大小写

Linux系统的启动原理

JDesktopPane JInternalFrames

错误The request sent by the client was syntactically incorrect ()的解决

Java基础知识学习（九）

redis在windows下总是报错，就是下面的错误，这是哪里出错了

Asp.net窄屏页面手机端新闻列表

Linux 密钥验证

windows下UDP服务器和客户端的实现

MySQL各版本的区别

[poj1006]Biorhythms

elasticsearch type类型创建时注意项目，最新的elasticsearch已经不建议一个索引下多个type...

jQury 跳出each循环的方法

spring AOP 之五：Spring MVC通过AOP切面编程来拦截controller

在编译安装程序时候遇到/usr/bin/ld: cannot find -lxxx的时候的解决办法。

使用 INSERT 和 SELECT 子查询插入行

ubuntu重装mysql

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-27 05:35:30 当前IP: 18.188.223.120 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我