宇宙主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

欧基零壹微头条IP归属甄别会员请立即修改密码
查看: 1358|回复: 3

有用神箭手的吗,问个正则问题?

[复制链接]
发表于 2018-1-24 11:51:58 | 显示全部楼层 |阅读模式
我想采集1-45页的内容,
helperUrlRegexes: ["http://***\/page\/^([1-9]|[1-3][0-9]|[4][0-5])$"], //列表页

这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导
发表于 2018-1-24 12:17:50 | 显示全部楼层
本帖最后由 Carseason 于 2018-1-24 12:19 编辑

http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试
 楼主| 发表于 2018-1-24 12:48:53 | 显示全部楼层
Carseason 发表于 2018-1-24 12:17
http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试

多谢!
按照你的方式测试了下,果然OK..
只要不带^的起始符就好了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|兜哪儿主机交流论坛

GMT+8, 2024-9-22 23:25 , Processed in 0.056587 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表