怎么使用python提取字符串的中英文
导读:本文共2131字符,通常情况下阅读需要7分钟。同时您也可以点击右侧朗读,来听本文内容。按键盘←(左) →(右) 方向键可以翻页。
摘要: 一. re中的sub函数使用Python 的re模块,re模块提供了re.sub用于替换字符串中的匹配项。re.sub(pattern, repl, string, count=0)参数说明:pattern:正则重的模式字符串repl:被拿来替换的字符串string:要被用于替换的原始字符串count:模式匹配后替换的最大次数,省略则默认为0,表示替换所有的匹配... ...
目录
(为您整理了一些要点),点击可以直达。使用Python 的re模块,re模块提供了re.sub用于替换字符串中的匹配项。
re.sub(pattern, repl, string, count=0)
参数说明:
pattern:正则重的模式字符串
repl:被拿来替换的字符串
string:要被用于替换的原始字符串
count:模式匹配后替换的最大次数,省略则默认为0,表示替换所有的匹配
1.1 提取中文
可以这样想:我们可以通过将不是中文的字符替换为空不就可以了
例如
1.2 提取英文
1.3 提取数字
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
语法格式为:
findall(string[, pos[, endpos]])
参数:
string : 待匹配的字符串。
pos : 可选参数,指定字符串的起始位置,默认为 0。
endpos :可选参数,指定字符串的结束位置,默认为字符串的长度。 查找字符串中的所有数字:
扩展:正则中有match 和 search ,它们是是匹配一次,findall
匹配所有,具体了解可以到菜鸟教程查看
2.2 提取英文
通俗写法
正则
2.3 提取数字
compile函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供其他函数使用。
语法格式为:
re.compile(pattern[, flags])
参数:
pattern : 一个字符串形式的正则表达式
flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L 表示特殊字符集 w, W, , B, s, S 依赖于当前环境
re.M 多行模式
re.S即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
re.U 表示特殊字符集 w, W, , B, d, D, s,S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和 # 后面的注释
怎么使用python提取字符串的中英文的详细内容,希望对您有所帮助,信息来源于网络。