中文字符的编码范围是:

u4e00-u9fa5

使用正则匹配中文

# -*- coding:utf-8 -*-

import re

'''
python 3.5版本
正则匹配中文,固定形式:u4E00-u9FA5
'''

words = 'study in 山海大学'
regex_str = ".*?([u4E00-u9FA5]+大学)"
match_obj = re.match(regex_str, words)
if match_obj:
    print(match_obj.group(1))


结果:山海大学

来源:PY学习网:原文地址:https://www.py.cn/article.html

hmoban主题是根据ripro二开的主题,极致后台体验,无插件,集成会员系统
自学咖网 » python如何匹配中文