`

python正则表达式中的中文匹配例子

阅读更多
#coding=utf-8 
import re 
from urllib2 import urlopen 

webpage = urlopen('http://www.baidu.com')       #获取百度页面的信息
text = webpage.read()                           #读取为文本
tmp = text.decode('utf8')                       #对原文本进行utf8转码, 此处要跟代码的编码格式一致
pat = '<title>(.*)?([\u4e00-\u9fa5]*)?</title>' #对中文进行匹配
re.escape(pat)                                  #对匹配模式中需要转义的符号进行转义
pat = re.compile(pat)                           #compile一下
m = re.search(pat,tmp) 
title = m.group(1) 
print title 
webpage.close()

 在unicode中, 中文是\u4e00-\u9fa5

分享到:
评论

相关推荐

    python正则表达式及使用正则表达式的例子

    正则表达式匹配过程 依次拿出表达式和文本中的字符串进行比价 如果每个字符都能匹配,则匹配成功;一旦有匹配不成功的字符,则匹配失败 如果有量词和边界,则匹配过程稍微有些不同 正则表达式语法规则 语法 ...

    PHP常用正则表达式汇总

    PHP常用正则表达式汇总,平时做网站经常要用正则表达式,下面是一些讲解和例子,仅供大家参考和修改使用

    正则表达式完整高清版

    《正则指引》针对作者在开发中遇到的实际问题,以及其他开发人员咨询的问题,总结出一套使用正则表达式解题的办法,并通过具体的例子指导读者拆解、分析问题。全书分为三大部分:第一部分主要讲解正则表达式的基础...

    python利用正则表达式搜索单词示例代码

    正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。 比如下面的例子,就是用来从一段文字里查找一个单词,如下: 示例代码 import re pattern = 'this' text = '...

    python如何使用正则表达式的前向、后向搜索及前向搜索否定模式详解

    因此,在正则表达式里也有一致性的判断,要么两个尖括号一起出现,要么一个也不要出现。怎么样来实现这种判断呢?针对这种情况得引入新的正则表达式的语法:(?=pattern),这个语法它会向前搜索或者向后搜索相关内容...

    Python正则表达式教程之二:捕获篇

    在上一篇文中,我们介绍了关于Python正则表达式的基础,那么在这一篇文章里,我们将总结一下正则表达式关于捕获的用法。下面话不多说,来看看详细的介绍吧。  捕获 捕获和分组在正则表达式中有着密切的联系,一般...

    Python 正则表达式的高级用法

    该对象拥有一系列方法用于正则表达式匹配和替换。用法上略有区别,举个例子, 匹配一个字符串可用如下方式: 如果使用compile,将变成: 为什么要这么用呢?其实就是为了提高正则匹配的速度,重复利用正则表达式对象...

    jhao104#memory-notes#Python正则表达式:最短匹配1

    例子代码str = 'this is first labelthe second label')', str) # 最短匹配['this is first la

    精通正则表达式~~~

    使用正则表达式匹配文本... 38 向更实用的程序前进... 40 成功匹配的副作用... 40 错综复杂的正则表达式... 43 暂停片刻... 49 使用正则表达式修改文本... 50 例子:公函生成程序... 50 举例:修整股票价格....

    详解python里使用正则表达式的全匹配功能

    详解python里使用正则表达式的全匹配功能 python中很多匹配,比如搜索任意位置的search()函数,搜索边界的match()函数,现在还需要学习一个全匹配函数,就是搜索的字符与内容全部匹配,它就是fullmatch()函数。 例子...

    [精通正则表达式(第三版)]

    使用正则表达式匹配文本 66 向更实用的程序前进 68 成功匹配的副作用 68 错综复杂的正则表达式 71 暂停片刻 77 使用正则表达式修改文本 78 例子:公函生成程序 78 举例:修整股票价格 79 自动的编辑

    Python松散正则表达式用法分析

    在松散正则表达式中的注释和在普通Python代码中的一样:开始于一个#符号,结束于行尾。这种情况下,采用在一个多行字符串中注释,而不是在源代码中注释,他们以相同的方式工作。 下面是一个松散正则表达式的例子,直

    零基础写python爬虫之神器正则表达式

    但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。 一、 正则表达式基础 1.1.概念介绍 正则表达式是用于...

    Python正则表达式和元字符详解

    正则表达式是一个例子,SQL(用于数据库操作)是另一个例子。 私有领域特定语言通常用于特定的工业目的。 Python 的正则表达式可以使用 re 模块访问,re 模块是标准库的一部分。 当你定义一个正则表达式,可以使用 ...

    Python正则表达式学习小例子

    但是,Python中的正则表达式在实际使用过程中还是有一些细小的差别。 (1)匹配1-100之间的数 import re s = '100' # 1-100内的任意数字 ret = re.match(r'(100|[1-9]\d{0,1})$',s) print(ret.group()) (100|[1-9]\d...

    学会Python正则表达式,就看这20个例子(脚本之家修正版)

    正则表达式是处理字符串的强大工具。作为一个概念而言,正则表达式对于Python来说并不是...该对象拥有一系列方法用于正则表达式匹配和替换。 re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串

    正则表达式性能优化方法(高效正则表达式书写)

    这里说的正则表达式优化,主要是针对目前常用的NFA模式正则表达式,详细可以参考:正则表达式匹配解析过程探讨分析(正则表达式匹配原理)。从上面例子,我们可以推断出,影响NFA类正则表达式(常见语言:GNU Emacs,...

Global site tag (gtag.js) - Google Analytics