[JAVA-初级] :偶识【正则表达式】 -编程开发技术
[JAVA•初级] :偶识【正则表达式】
原文出处吴士龙
简介
正则表达式的“祖先”可以一直上溯至对人类神经系统如何工作的早期研究。 WarrenMcCulloch和Walter Pitts这两位神经生理学家研究出一种数学方式来描述这些神经网络。
1956年一位叫StephenKleene的美国数学家在McCulloch和Pitts早期工作的基础上发表了一篇标题为“神经网事件的表示法”的论文引入了正则表达式的概念。正则表达式就是用来描述他称为“正则集的代数”的表达式因此采用“正则表达式”这个术语。
随后发现可以将这一工作应用于使用Ken Thompson的计算搜索算法的一些早期研究Ken Thompson是Unix的主要发明人。正则表达式的第一个实用应用程序就是Unix中的qcd编辑器。
如他们所说剩下的就是众所周知的历史了。从那时起直至现在正则表达式都是基于文木的编辑器和搜索工具中的一个重要部分。止如他的名字一样是描述了一个规则通过这个规则可以匹配一类字符串。
如果原來没冇使用过正则表达式那么可能对这个术语和概念会不太熟悉。不过,它们并不是您想象的那么新奇。
请回想一下在硕盘上是如何查找文件的。大家肯定会使用和*字符来帮助查找正寻找的文件。 字符匹配文件名中的单个字符而*则匹配一个或多个字符。一个如Mata?.datJ的模式可以找到下述文件data 1. datdata2 ・ datdatax. datdataN. dat
如果使用*字符代替字符则将扩大找到的文件数量。 'data*, dat'可以匹配下述所有文件名
data. dat datal.datdata2. dat datal2. dat datax. dat dataXYZ ・ dat
尽管这种搜索文件的方法肯定很冇用但也十分冇限。 和*通配符的冇限能力可以使你对正则表达式能做什么冇一个概念文本的复杂处理不过正则表达式的功能更强大也更灵活。
优势
在典型的搜索和替换操作小必须提供要查找的确切文字。这种技术对于静态文本屮的简单搜索和替换任务可能足够了但是由于它缺乏灵活性因此在搜索动态文木时就有困难了甚至是不可能的。
使用正则表达式就可以
1 •测试字符串的某个模式。例如可以对一个输入字符串进行测试看在该字符吊是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证
2.替换文本。可以在文档屮使用一个止则表达式来标识特定文字然后可以全部将其删除或者替换为别的文字
3.根据模式匹配从字符串屮提取一个子字符串。可以用来在文本或输入字段小查找特定文字。
例如如果需要搜索整个web站点來删除某些过时的材料并替换某些IITML格式化标记则可以使用正则表达式对每个文件进行测试看在该文件屮是否存在所要查找的材料或HTML格式化标记。用这个方法就可以将受影响的文件范围缩小到包含要删除或更改的材料的那些文件。然后可以使用正则表达式来删除过时的材料最后可以再次使用正则表达式來查找并替换那些需要替换的标记。
另一个说明正则表达式非常有用的示例是一种其字符串处理能力述不为人所知的语言。VBScript是Visual Basic的一个子集具有丰富的字符串处理功能。与C类似的Jscript则没有这一能力。止则表达式给JScript的字符串处理能力带来了明显改善。不过可能还是在VBScdpt中使用正则表达式的效率史高它允许在单个表达式中执行多个字符申操作。
一个止则表达式就是由普通字符(例如字符a到z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板将某个字符模式与所搜索的字符串进行匹配。
这里有一些可能会遇到的正则农达式示例:
位数字一个连字符以及一
卜 •表是元字符及其在止则表达式上下文中的行为的一个完整列表:
正则表达式文本 -source
只读布尔值•是否有修饰符g・global只读布尔值,是否有修饰符i - ignoreCase只读布尔值r是否有修饰符m-multi l ine下一次检索开始的位适 用于exec()和test 。 - lastindex
类似Stringmatch,全局匹配无效匹配同时修改lastindex值为紧挨着匹配子串的字符位置 exec
匹配第n个匹配正则表达式中的圆括号子表达式文本 -Sn
返回布尔值・可以使用lastindex属性-test
返回由匹配结果组成的数组 match
Demo
JAVA程序中使用止则表达式
相关类位于 java. util, regex包下面
类Pattern
正则表达式的编译表示形式。
Patternp = Pattern, compile(r, int) ;? //建立正则表达式,并启用相应模式类Matcher
通过解释Pattern对charactersequence执行匹配操作的引擎
Matcherm二p. matcher (str) ; //匹配str字符串
编程中使用止则表达式常见情况
验证表达式是否匹配整个字符串
验证表达式是否可以匹配字符串的子字符串
返回给定字符串屮匹配给定正则表达式所有子字符串
替换给定字符串中匹配正则表达式的子字符串
根据止则表达式定义规则截取字符吊
<span style二"font-size: 18px;">package test;import java.util. ArrayList;import java. util. List;import java, uti1. regex. Matcher;import java.util, regex .Pattern;public class TestReg {
/**
*验证传入的字符吊是否整个匹配止表达式
* @param regex:正则表达式
* ©param decStr 要匹配的字符串
* @return :若匹配,则返冋true;否则,返冋false;
*/publicstatic boolcan v31id3tc(String regex, String decStr)
//表达式对象
Patternp =
Pattern, compile(regex, Pattern. CASE INSENSITIVE) ;
//创建Matcher对象
Matcherm二p. matcher(decStr) ;
//是否完全匹配booleanyesorno = m. matches () ; //该方法尝试将整个
输入序列与该模式匹配returnyesorno;
/**
*验证传入的字符串是否有子字符串匹配正表达式
* @param regex:正则表达式
* ©param decStr 要匹配的字符串
* @rcturn :若匹配则返回true;否则返回false;
*/publicstatic boolean validate2(String regex, String decStr) { 〃表达式对象
Patternp二Pattern, compi1e(regex,
Pattern. CASE_INSENSITIVE) ;
//创建Matcher对彖Matcherm = p. matcher(decStr) ;//是否完全匹配booleanyesorno二m. find() ; //该方法扫描输入序列以
杳找与该模式匹配的下一个了序列。returnyesorno;
/**
*给定字符串中是否有符合给定止则表达式的了字符串返回匹配的第一个子字符串
* @param regex 正则表达式
* @param decStr 要匹配的字符串
* @return :返回匹配的第一个字符串若不匹配则null
*/ publicstatic String search (String regex, String decStr) {Patternp = Pattern, compile(regex,
Pattern.CASE_INSENSITIVE) ;
Matcherm二p.matcher(decStr) ;
//是否找到匹配booleanfound = m. find() ; //该方法扫描输入序列以查找与该模式匹配的下一个子序列。
String foundstring二〃 “
v5.net一直做独立服务器这块儿的,自从推出云服务器(VPS)以来站长一直还没有关注过,在网友的提醒下弄了个6G内存、2核、100G SSD的美国云服务器来写测评,主机测评给大家趟雷,让你知道v5.net的美国云服务器效果怎么样。本次测评数据仅供参考,有兴趣的还是亲自测试吧! 官方网站:https://v5.net/cloud.html 从显示来看CPU是e5-2660(2.2GHz主频),...
企鹅小屋:垃圾服务商有跑路风险!企鹅不允许你二次工单的,二次提交工单直接关服务器,再严重就封号,意思是你提交工单要小心,别因为提交工单被干了账号!前段时间,就有站长说企鹅小屋要跑路了,站长不太相信,本站平台已经为企鹅小屋推荐了几千元的业绩,CPS返利达182.67CNY。然后,站长通过企鹅小屋后台申请提现,提现申请至今已经有20几天,企鹅小屋也没有转账。然后,搞笑的一幕出现了:平台账号登录不上提示...
螢光云官網萤光云成立于2002年,是一家自有IDC的云厂商,主打高防云服务器产品。在国内有福州、北京、上海、台湾、香港CN2节点,还有华盛顿、河内、曼谷等海外节点。萤光云的高防云服务器自带50G防御,适合高防建站、游戏高防等业务。本次萤光云中秋云活动简单无套路,直接在原有价格上砍了一大刀,最低价格16元/月,而且有没有账户限制,新老客户都可以买,就是直接满满的诚意给大家送优惠了!官网首页:www....