百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Python启航:30天编程速成之旅(第24天)- 实用程序片段

wptr33 2025-03-29 23:05 7 浏览

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

前期基础教程:

「Python3.11.0」手把手教你安装最新版Python运行环境

讲讲Python环境使用Pip命令快速下载各类库的方法

Python启航:30天编程速成之旅(第2天)-IDE安装

【Python教程】JupyterLab 开发环境安装


Python启航:30天编程速成之旅(第24天)- 实用程序片段

使用Python提取中文字符和中文标点符号

在这个教程中,我们将学习如何使用Python从字符串中提取中文字符和中文标点符号。我们将使用正则表达式库 re 来完成这个任务。以下是完整的代码示例,并附有详细注释和解释。

1. 导入re库

首先,我们需要导入 Python 的正则表达式库 re。这个库提供了强大的功能来处理字符串中的模式匹配。

import re

2. 定义函数
extract_chinese_and_punctuation

我们定义一个名为
extract_chinese_and_punctuation 的函数,该函数接受一个字符串参数 text,并返回一个新的字符串,其中只包含中文字符和中文标点符号。

def extract_chinese_and_punctuation(text):

3. 创建正则表达式模式combined_pattern

接下来,我们创建一个正则表达式模式 combined_pattern,用于匹配中文字符和常见的中文标点符号。

  • 中文字符范围: \u4e00-\u9fff中文字符的 Unicode 编码范围是从 \u4e00 到 \u9fff。
  • 常见中文标点符号:逗号:, (U+FF0C)句号:。 (U+3002)感叹号:! (U+FF01)问号:? (U+FF1F)分号:; (U+FF1B)冒号:: (U+FF1A)引号:“”‘’ (U+201C, U+201D, U+2018, U+2019)圆括号:() (U+FF08, U+FF09)方括号:【】 (U+3010, U+3011)角括号:《》 (U+300A, U+300B)顿号:、 (U+3001)

将这些字符合并到一个字符类中:

    combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'

4. 使用re.findall查找所有匹配的字符

我们使用 re.findall 函数来查找所有符合 combined_pattern 的字符。re.findall 返回一个列表,其中包含所有匹配的子串。

    result = ''.join(re.findall(combined_pattern, text))
  • re.findall(pattern, string):在字符串 string 中查找所有与 pattern 匹配的子串,并返回一个列表。
  • ''.join(...):将列表中的所有元素连接成一个字符串。

5. 返回结果

最后,我们返回处理后的字符串 result。

    return result

6. 示例用法

我们提供一个示例字符串 text,并调用
extract_chinese_and_punctuation 函数来提取其中的中文字符和中文标点符号。

# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result)  # 输出: 你好!这是一个测试。

7.完整代码

import re

def extract_chinese_and_punctuation(text):
    # 中文字符和常见中文标点符号的范围
    combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'
    
    # 查找所有匹配的字符
    result = ''.join(re.findall(combined_pattern, text))
    return result

# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result)

运行结果

使用Python将长文本按指定长度分段

在这个教程中,我们将学习如何使用Python将长文本按指定的长度分段。我们将编写一个函数 split_text,该函数接受一个字符串和一个整数参数,并返回一个包含多个子字符串的列表,每个子字符串的长度不超过指定的长度。

详细步骤解析

1. 定义函数split_text

我们定义一个名为 split_text 的函数,该函数接受两个参数:

  • text: 要分割的长文本。
  • length: 每个子字符串的最大长度,默认值为20。
def split_text(text, length=20):
    """将长文本按指定长度分段"""

2. 使用列表推导式进行分段

在函数内部,我们使用列表推导式来生成一个包含多个子字符串的列表。每个子字符串的长度不超过指定的 length。

    return [text[i:i+length] for i in range(0, len(text), length)]

解释列表推导式

  • range(0, len(text), length): 生成一个从0开始到 len(text) 结束的序列,步长为 length。例如,如果 text 的长度为50,length 为20,则生成的序列为 [0, 20, 40]。
  • text[i:i+length]: 从 text 中切片,从索引 i 开始,到索引 i+length 结束(不包括 i+length)。例如,当 i 为0时,切片为 text[0:20];当 i 为20时,切片为 text[20:40]。
  • [...]: 将所有切片结果收集到一个列表中。

3. 示例用法

我们提供一个示例字符串 text,并调用 split_text 函数来将其按指定长度分段。

text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
    中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"

print(split_text(text))

输出结果

运行上述代码后,输出将是:

['通过本教程,你已经学会', '了如何使用Python的正则表', '达式库 re 来提取字', '符串中的中文字符', '和中文标点符号。这种方', '法不仅高效,而且易', '于理解。希望这个教', '程对你有所帮助!']

每个子字符串的长度不超过20个字符。

4.完整代码

def split_text(text, length=20):
    """将长文本按指定长度分段"""
    return [text[i:i+length] for i in range(0, len(text), length)]

text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
    中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"

print(split_text(text))

运行结果

使用Python根据出生日期计算年龄

在这个教程中,我们将学习如何使用Python根据出生日期计算一个人的年龄。我们将编写一个函数 calculate_age,该函数接受一个字符串形式的出生日期,并返回相应的年龄。

详细步骤解析

1. 导入datetime模块

首先,我们需要导入 Python 的 datetime 模块。这个模块提供了处理日期和时间的功能。

from datetime import datetime

2. 定义函数calculate_age

我们定义一个名为 calculate_age 的函数,该函数接受一个参数:

  • birth_date: 字符串形式的出生日期,格式为 'YYYY-MM-DD'。
def calculate_age(birth_date):
    """根据出生日期计算年龄"""

3. 获取当前日期

使用 datetime.now() 方法获取当前的日期和时间。

    today = datetime.now()

解释

  • datetime.now(): 返回当前的本地日期和时间。

4. 将出生日期字符串转换为datetime对象

使用 datetime.strptime 方法将字符串形式的出生日期转换为 datetime 对象。

    birth = datetime.strptime(birth_date, '%Y-%m-%d')

解释

  • datetime.strptime(date_string, format): 根据指定的格式将字符串解析为 datetime 对象。
  • '%Y-%m-%d': 表示日期格式为四位数的年份、两位数的月份和两位数的日期,例如 '1979-03-26'。

5. 计算初步年龄

通过减去出生年份和当前年份来计算初步的年龄。

    age = today.year - birth.year

解释

  • today.year: 当前年的年份。
  • birth.year: 出生年的年份。
  • age = today.year - birth.year: 初步计算年龄,假设今天已经是生日过了。

6. 调整年龄以考虑月份和日期

如果当前月份小于出生月份,或者当前月份等于出生月份但当前日期小于出生日期,则需要将年龄减一。

    if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
        age -= 1

解释

  • today.month < birth.month: 如果当前月份小于出生月份。
  • today.month == birth.month and today.day < birth.day: 如果当前月份等于出生月份且当前日期小于出生日期。
  • age -= 1: 如果上述条件之一为真,则年龄减一。

7. 返回计算得到的年龄

最后,返回计算得到的年龄。

    return age

8. 示例用法

我们提供一个示例出生日期 '1979-03-26',并调用 calculate_age 函数来计算相应的年龄。

print(calculate_age('1980-01-01'))

输出结果

运行上述代码后,输出将是当前日期对应的年龄。例如,如果当前日期是2024年12月10日,则输出可能是:

44

9.完整代码

from datetime import datetime

def calculate_age(birth_date):
    """根据出生日期计算年龄"""
    today = datetime.now()
    birth = datetime.strptime(birth_date, '%Y-%m-%d')
    age = today.year - birth.year
    if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
        age -= 1
    return age

print(calculate_age('1980-01-01'))

运行结果

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

相关推荐

【推荐】一款开源免费、美观实用的后台管理系统模版

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!项目介绍...

Android架构组件-App架构指南,你还不收藏嘛

本指南适用于那些已经拥有开发Android应用基础知识的开发人员,现在想了解能够开发出更加健壮、优质的应用程序架构。首先需要说明的是:AndroidArchitectureComponents翻...

高德地图经纬度坐标批量拾取(高德地图批量查询经纬度)

使用方法在桌面上新建一个index.txt文件,把下面的代码复制进去保存,再把文件名改成index.html保存,双击运行打开即可...

flutter系列之:UI layout简介(flutter ui设计)

简介对于一个前端框架来说,除了各个组件之外,最重要的就是将这些组件进行连接的布局了。布局的英文名叫做layout,就是用来描述如何将组件进行摆放的一个约束。...

Android开发基础入门(一):UI与基础控件

Android基础入门前言:...

iOS的布局体系-流式布局MyFlowLayout

iOS布局体系的概览在我的CSDN博客中的几篇文章分别介绍MyLayout布局体系中的视图从一个方向依次排列的线性布局(MyLinearLayout)、视图层叠且停靠于父布局视图某个位置的框架布局(M...

TDesign企业级开源设计系统越发成熟稳定,支持 Vue3 / 小程序

TDesing发展越来越好了,出了好几套组件库,很成熟稳定了,新项目完全可以考虑使用。...

WinForm实现窗体自适应缩放(winform窗口缩放)

众所周知,...

winform项目——仿QQ即时通讯程序03:搭建登录界面

上两篇文章已经对CIM仿QQ即时通讯项目进行了需求分析和数据库设计。winform项目——仿QQ即时通讯程序01:原理及项目分析...

App自动化测试|原生app元素定位方法

元素定位方法介绍及应用Appium方法定位原生app元素...

61.C# TableLayoutPanel控件(c# tabcontrol)

摘要TableLayoutPanel在网格中排列内容,提供类似于HTML元素的功能。TableLayoutPanel控件允许你将控件放在网格布局中,而无需精确指定每个控件的位置。其单元格...

想要深入学习Android性能优化?看完这篇直接让你一步到位

...

12个python数据处理常用内置函数(python 的内置函数)

在python数据分析中,经常需要对字符串进行各种处理,例如拼接字符串、检索字符串等。下面我将对python中常用的内置字符串操作函数进行介绍。1.计算字符串的长度-len()函数str1='我爱py...

如何用Python程序将几十个PDF文件合并成一个PDF?其实只要这四步

假定你有一个很无聊的任务,需要将几十个PDF文件合并成一个PDF文件。每一个文件都有一个封面作为第一页,但你不希望合并后的文件中重复出现这些封面。即使有许多免费的程序可以合并PDF,很多也只是简单的将...

Python入门知识点总结,Python三大数据类型、数据结构、控制流

Python基础的重要性不言而喻,是每一个入门Python学习者所必备的知识点,作为Python入门,这部分知识点显得很庞杂,内容分支很多,大部分同学在刚刚学习时一头雾水。...