喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。
前期基础教程:
「Python3.11.0」手把手教你安装最新版Python运行环境
讲讲Python环境使用Pip命令快速下载各类库的方法
Python启航:30天编程速成之旅(第2天)-IDE安装
【Python教程】JupyterLab 开发环境安装
Python启航:30天编程速成之旅(第24天)- 实用程序片段
使用Python提取中文字符和中文标点符号
在这个教程中,我们将学习如何使用Python从字符串中提取中文字符和中文标点符号。我们将使用正则表达式库 re 来完成这个任务。以下是完整的代码示例,并附有详细注释和解释。
1. 导入re库
首先,我们需要导入 Python 的正则表达式库 re。这个库提供了强大的功能来处理字符串中的模式匹配。
import re
2. 定义函数
extract_chinese_and_punctuation
我们定义一个名为
extract_chinese_and_punctuation 的函数,该函数接受一个字符串参数 text,并返回一个新的字符串,其中只包含中文字符和中文标点符号。
def extract_chinese_and_punctuation(text):
3. 创建正则表达式模式combined_pattern
接下来,我们创建一个正则表达式模式 combined_pattern,用于匹配中文字符和常见的中文标点符号。
- 中文字符范围: \u4e00-\u9fff中文字符的 Unicode 编码范围是从 \u4e00 到 \u9fff。
- 常见中文标点符号:逗号:, (U+FF0C)句号:。 (U+3002)感叹号:! (U+FF01)问号:? (U+FF1F)分号:; (U+FF1B)冒号:: (U+FF1A)引号:“”‘’ (U+201C, U+201D, U+2018, U+2019)圆括号:() (U+FF08, U+FF09)方括号:【】 (U+3010, U+3011)角括号:《》 (U+300A, U+300B)顿号:、 (U+3001)
将这些字符合并到一个字符类中:
combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'
4. 使用re.findall查找所有匹配的字符
我们使用 re.findall 函数来查找所有符合 combined_pattern 的字符。re.findall 返回一个列表,其中包含所有匹配的子串。
result = ''.join(re.findall(combined_pattern, text))
- re.findall(pattern, string):在字符串 string 中查找所有与 pattern 匹配的子串,并返回一个列表。
- ''.join(...):将列表中的所有元素连接成一个字符串。
5. 返回结果
最后,我们返回处理后的字符串 result。
return result
6. 示例用法
我们提供一个示例字符串 text,并调用
extract_chinese_and_punctuation 函数来提取其中的中文字符和中文标点符号。
# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result) # 输出: 你好!这是一个测试。
7.完整代码
import re
def extract_chinese_and_punctuation(text):
# 中文字符和常见中文标点符号的范围
combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'
# 查找所有匹配的字符
result = ''.join(re.findall(combined_pattern, text))
return result
# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result)
运行结果
使用Python将长文本按指定长度分段
在这个教程中,我们将学习如何使用Python将长文本按指定的长度分段。我们将编写一个函数 split_text,该函数接受一个字符串和一个整数参数,并返回一个包含多个子字符串的列表,每个子字符串的长度不超过指定的长度。
详细步骤解析
1. 定义函数split_text
我们定义一个名为 split_text 的函数,该函数接受两个参数:
- text: 要分割的长文本。
- length: 每个子字符串的最大长度,默认值为20。
def split_text(text, length=20):
"""将长文本按指定长度分段"""
2. 使用列表推导式进行分段
在函数内部,我们使用列表推导式来生成一个包含多个子字符串的列表。每个子字符串的长度不超过指定的 length。
return [text[i:i+length] for i in range(0, len(text), length)]
解释列表推导式
- range(0, len(text), length): 生成一个从0开始到 len(text) 结束的序列,步长为 length。例如,如果 text 的长度为50,length 为20,则生成的序列为 [0, 20, 40]。
- text[i:i+length]: 从 text 中切片,从索引 i 开始,到索引 i+length 结束(不包括 i+length)。例如,当 i 为0时,切片为 text[0:20];当 i 为20时,切片为 text[20:40]。
- [...]: 将所有切片结果收集到一个列表中。
3. 示例用法
我们提供一个示例字符串 text,并调用 split_text 函数来将其按指定长度分段。
text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"
print(split_text(text))
输出结果
运行上述代码后,输出将是:
['通过本教程,你已经学会', '了如何使用Python的正则表', '达式库 re 来提取字', '符串中的中文字符', '和中文标点符号。这种方', '法不仅高效,而且易', '于理解。希望这个教', '程对你有所帮助!']
每个子字符串的长度不超过20个字符。
4.完整代码
def split_text(text, length=20):
"""将长文本按指定长度分段"""
return [text[i:i+length] for i in range(0, len(text), length)]
text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"
print(split_text(text))
运行结果
使用Python根据出生日期计算年龄
在这个教程中,我们将学习如何使用Python根据出生日期计算一个人的年龄。我们将编写一个函数 calculate_age,该函数接受一个字符串形式的出生日期,并返回相应的年龄。
详细步骤解析
1. 导入datetime模块
首先,我们需要导入 Python 的 datetime 模块。这个模块提供了处理日期和时间的功能。
from datetime import datetime
2. 定义函数calculate_age
我们定义一个名为 calculate_age 的函数,该函数接受一个参数:
- birth_date: 字符串形式的出生日期,格式为 'YYYY-MM-DD'。
def calculate_age(birth_date):
"""根据出生日期计算年龄"""
3. 获取当前日期
使用 datetime.now() 方法获取当前的日期和时间。
today = datetime.now()
解释
- datetime.now(): 返回当前的本地日期和时间。
4. 将出生日期字符串转换为datetime对象
使用 datetime.strptime 方法将字符串形式的出生日期转换为 datetime 对象。
birth = datetime.strptime(birth_date, '%Y-%m-%d')
解释
- datetime.strptime(date_string, format): 根据指定的格式将字符串解析为 datetime 对象。
- '%Y-%m-%d': 表示日期格式为四位数的年份、两位数的月份和两位数的日期,例如 '1979-03-26'。
5. 计算初步年龄
通过减去出生年份和当前年份来计算初步的年龄。
age = today.year - birth.year
解释
- today.year: 当前年的年份。
- birth.year: 出生年的年份。
- age = today.year - birth.year: 初步计算年龄,假设今天已经是生日过了。
6. 调整年龄以考虑月份和日期
如果当前月份小于出生月份,或者当前月份等于出生月份但当前日期小于出生日期,则需要将年龄减一。
if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
age -= 1
解释
- today.month < birth.month: 如果当前月份小于出生月份。
- today.month == birth.month and today.day < birth.day: 如果当前月份等于出生月份且当前日期小于出生日期。
- age -= 1: 如果上述条件之一为真,则年龄减一。
7. 返回计算得到的年龄
最后,返回计算得到的年龄。
return age
8. 示例用法
我们提供一个示例出生日期 '1979-03-26',并调用 calculate_age 函数来计算相应的年龄。
print(calculate_age('1980-01-01'))
输出结果
运行上述代码后,输出将是当前日期对应的年龄。例如,如果当前日期是2024年12月10日,则输出可能是:
44
9.完整代码
from datetime import datetime
def calculate_age(birth_date):
"""根据出生日期计算年龄"""
today = datetime.now()
birth = datetime.strptime(birth_date, '%Y-%m-%d')
age = today.year - birth.year
if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
age -= 1
return age
print(calculate_age('1980-01-01'))
运行结果
喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。