当前位置：自学咖网 > 技术教程 > Pyhton常见问题 > python3如何提取汉字

hmoban Pyhton常见问题 2023-11-20

python3如何提取汉字

采用正则表达式的方法对字符串进行处理。

str1 = "｛我%$是，《速$@.度发》中 /国、人"

相关推荐：《Python教程》

（1）提取汉字

汉字的范围为”u4e00-u9fa5“，这个是用Unicode表示的。

import re
res1 = ''.join(re.findall('[u4e00-u9fa5]',str1))
print(res1)

输出为：

‘我是速度发中国人’

（2）去除所有符号。采用清理数据，仅保留字母、数字、中文的方法。

import re
res1 = re.sub("[^a-zA-Z0-9u4e00-u9fa5]", '', str1) 
print(res1)

输出为：

‘我是速度发中国人’

来源：PY学习网：原文地址：https://www.py.cn/article.html

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » python3如何提取汉字

分享到：

Python中的类方法，指的是在类中定义的函数，函数在类的内部称为方法，变量在类的内部，称为属性。 Python类方法和静态方法都可以被类和类实例调用，类实例方法仅可以被类实例调用。类方法的隐含调用参数是类，而类实例方法...

原因其实很简单了，因为只装了server和client两个包，但是对于平常的使用，这已经足够了，但对于要在Linux下进行数据库的开发，则还需要安装devel开发包，并且该开发包的版本应该和我之前所安装的server和c...

python的字符串就是表示一串字符，字符可以是中文，英文或者数字，或者混合的文本。python字符串的几种表达方式 1 使用单引号扩起来字符串 >>> 'my pytho...

1、检查一下注册表是否存在python其它版本的信息方法：（1）在命令行中输入regedit打开注册表（2）在HKEY_CURRENT_USERSoftware中找一下是否存在python注册信息，如果存在，检查一...

Docopt。抛弃optparse和argparse吧，使用docstrings来构建优雅的，可读性强的，并且复杂（如果你需要的话）的命令行界面。IMO2013年创建的最好的库。

1. 变量值互换题目描述：在不使用第三个变量的前提下使用二进制的方式互换两个整型变量的值。解题代码： >>> a = 1234 >>> b = 5678 >>> a...