如下所示:
p1 = r'(?<=)(.*?)(?=)' #这样采集html时出错,采集不到数据,正则中.是不能匹配 换行符,改成如下: p1 = r'(?<=)([\s\S]*?)(?=)' # 这是我们写的正则表达式规则[\s\S]
\s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S
匹配任何非空白字符。等价于[^ \f\n\r\t\v]。
热门推荐
查看更多
- Python 测试框架:掌握软件开发的关键
- 499 2024-04-23
- 解放 Python 并发编程潜能: 打破 GIL 的桎梏
- 499 2024-05-03
- 探索 Python 元组:掌握不可变序列的技巧
- 497 2024-04-15
- Python Logging 模块的扩展:增加个性化特性
- 497 2024-04-24
- 揭秘 Python 并发性的关键秘诀:解读 GIL
- 497 2024-04-29
- Python 包管理器的奥秘:洞悉其本质
- 495 2024-04-28