正则表达式

我们要解析一个HTML文档时可利用正则表达式取得标签内容
例子：
以从字符串中取出所有A标签的 id号和内容为例：
<a id="1" target="_blank">aaaaaaaaaa</a>
正则表达式：
<a[^<]*id[^<]*=[^<]*"(?<ID>[^<]*)"[^<]*target[^<]*=[^<]*"[^<]*_blank[^<]*" [^<]*>(?<content>[^<]*)</a>
正则分解：
[^<]*　是一个很有用的组合,能定位到下一个查询关键字
(?<ID>[^<]*)  用于取得一个或者多个值直到遇到下一个关键字
<ID>　类似一个正则的变量，给用()号取得的内容进行标识，以便于程序的调用
C#调用的例子：
string strRegex=@"<a[^<]*id[^<]*=[^<]*"(?<ID>[^<]*)"[^<]*target[^<]*=[^<]*"[^<]*_blank[^<]*" [^<]*>(?<CONTENT>[^<]*)</a>";
string strSource="<a id=\"1\" target=\"_blank\">aaaaaaaaaa</a>"
System.Text.RegularExpressions.Regex r;
                System.Text.RegularExpressions.MatchCollection m;
                mc= new System.Text.RegularExpressions.Regex(strRegex, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
               ro = mc.Matches(strSource);
if (ro.Count >= 0)
{
   for (int i = 0; i < m.Count; i++)
    {
        //取出ID和内容
         string id = ro[i].Groups["ID"].Value;
         string topic = ro[i].Groups["CONTENT"].Value;
    }
}

《正则表达式.doc》

下载本文的Word格式文档，以方便收藏与打印。

相关推荐

Linux grep 命令中的正则表达式详解

在 Linux 、类 Unix 系统中我该如何使用 Grep 命令的正则表达式呢？ Linux 附带有 GNU grep 命令工具，它支持扩展正则表达式（extended regular expressions），而且 GNU grep 在所有的 Linux 系统中都是默认有的...
2023-07-29编程代码命令,正则表达式,详解
C语言调用正则表达式

标准的C和C++都不支持正则表达式，但有一些函数库可以辅助C/C++程序员完成这一功能，其中最著名的当数Philip Hazel的Perl-Compatible Regular Expression库，许多Linux发行版本都带有这个函数库。 C语言处理正则...
2023-07-29编程代码正则表达式,语言,调用
C语言使用正则表达式

http://blog.chinaunix.net/uid-479984-id-2114941.html C语言使用正则表达式据说一个好的程序员是会使用DB和Regular Expression的程序员，可见两者是多么重要。正则表达式是能极大地提高工作效率的工具，使用过...
2023-07-29编程代码正则表达式,语言
linux C语言处理正则表达式

Linux下C语言处理正则表达式——regex.h 具体函数介绍编译正则表达式函数 int regcomp(regex_t *preg, const char *regex, int cflags); 其中preg用于保存编译后的正则表达式，regex是我们写的正则表...
2023-07-29编程代码Linux,正则表达式,语言
Python正则表达式汇总

判断是否是整数或小数，在网上看到一个方法： type(eval("")) == int type(eval("123.23")) == float 后来又看到《Python:eval的妙用和滥用》 ,一试果然会列出当前目录的所有文件,觉得还是用正则表达式实...
2023-07-29编程代码python,正则表达式,汇总
[Python笔记][第四章Python正则表达式]

2016/1/28学习内容第四章 Python字符串与正则表达式之正则表达式正则表达式是字符串处理的有力工具和技术，正则表达式使用预定义的特定模式去匹配一类具有共同特征的字符串，主要用于字符串处理，可以快速，准...
2023-07-29编程代码正则表达式,笔记,第四章
搞懂Python正则表达式，这一篇就够了

本文代码基于Python3.11解释器,除了第一次示例，代码将省略 import re 这个语句所有示例代码均可以在我的github仓库中的 code.py文件内查看 [我的仓库](PythonLearinig/正则表达式 at main · saopigqwq233/Pytho...
2023-07-11编程代码就够了,正则表达式,这一
如何使用正则表达式匹配路由

本篇文章为大家展示了如何使用正则表达式匹配路由，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。具体实现步骤为：导入转换器基类：在 Flask 中，所有的路由的匹...
2023-06-26编程教程正则表达式