扫码阅读
手机扫码阅读

我与正则有个约会

11 2024-10-18

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:我与正则有个约会
文章来源:
光荣之路
扫码关注公众号
文章摘要

本文由夜鸣猪撰写,讲述了作者在帮助一位同学使用正则表达式解决爬虫多行注释问题的经历。作者本身并不擅长正则表达式,但把这次经历当作学习的机会。

问题出现在同学想用正则表达式移除多行字符串中的注释部分,尽管尝试了但没有成功。作者采用了python re模块的多行匹配模式进行匹配,然后替换成空字符串的方法(方法1)。提供的代码达到了目标效果,移除了注释。

同学原来尝试的方法(方法2)并没有成功,作者一开始以为是函数调用方式不对,但经过测试发现该写法也可以进行替换。进一步调查re.sub的参数后,发现同学的代码中将re.S误用于count参数位置,导致多行匹配标志没有生效。

作者指出,通过明确指定flag参数为re.S,方法2的问题得到了解决。同时,作者还扩展了一个场景:如果需要在结果中保留注释符号,应该怎么写正则。解决方案是通过分组并在替换时将需要保留的分组内容添加到替换字符串中。

文章最后,夜鸣猪提供了测试开发试听课链接,并提出要想在测试领域取得成果,需要每天至少投入两小时学习时间,坚持写代码,并强调至少需要一年以上的努力才能实现显著的薪资增长。

想要了解更多内容?

查看原文:我与正则有个约会
文章来源:
光荣之路
扫码关注公众号