python-爬虫(最后附爬取数据的源码)
操作符 | 说明 | 实例 |
---|
. | 表示任何单个字符 | |
[ ] | 字符集,对单个字符给出取值范围 | [abc] 表示a、b、c,[a-z]表示a到z单个字符 |
[^ ] | 非字符集,对单个字符u给出排除范围 | [^abc] 非a或b或c的单个字符 |
* | 前一个字符0次或无限次扩展 | abc* 表示 ab、abc、abcc、abccc等 |
+ | 前一个字符1次或无限次扩展 | abc+ 表示abc、abcc、abccc等 |
? | 前一个字符0次或1次扩展 | abc? 表示ab、abc |
丨 | 左右表达式任意一个 | abd丨def 表示abc、def |
“左闭右开”是指区间不包括左边的内容,但是涵盖右边的内容。 | | |
操作符 | 说明 | 实例 |
– | – | – |
{m} | 扩展前一个字符m次 | ab{2}c 表示abbc,ab{3}c 表示abbbc |
{m,n} | 扩展前一个字符m至n次(含n) | ab{1,2} c 表示abc、abbc |
^ | 匹配字符串开头 | ^abc 表示abc且在一个字符串的开头 |
$ | 匹配字符串结尾 | abc$ 表示abc且在一个字符串的结尾 |
( ) | 分组标记,内部只能使用丨操作符 | (abc)表示abc,(abc丨def)表示abc、def |
d | 数字,等价于[0-9] | |
w | 单词字符,等价于[A-Za-z0-9] | 表示A到Z,a到z,数字0到9 |
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。