Thursday, July 19, 2007

常用正则表达式

正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新。

匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

匹配空行的正则表达式:\n[\s ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1><(.*) \/>/
匹配首尾空格的正则表达式:(^\s*)(\s*$)

应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:

String.prototype.trim = function()
{
return this.replace(/(^\s*)(\s*$)/g, "");
}

利用正则表达式分解和转换IP地址:

下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:

function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见本贴回复]

var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //结果为:abcefgi

我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。

得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1

s="http://www.9499.Net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)

利用正则表达式限制网页表单里的文本框输入内容:

用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正则表达式限制只能输入数字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正则表达式限制只能输入数字和英文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

正则表达式,相关链接
http://blog.csdn.Net/laily/category/19548.Aspx
http://blog.csdn.Net/laily/archive/2004/06/30/30525.Aspx 微软的正则表达式教程(五):选择/编组和后向引用

http://blog.csdn.Net/laily/archive/2004/06/30/30522.Aspx 微软的正则表达式教程(四):限定符和定位符

http://blog.csdn.Net/laily/archive/2004/06/30/30517.Aspx 微软的正则表达式教程(三):字符匹配

http://blog.csdn.Net/laily/archive/2004/06/30/30514.Aspx 微软的正则表达式教程(二):正则表达式语法和优先权顺序

http://blog.csdn.Net/laily/archive/2004/06/30/30511.Aspx 微软的正则表达式教程(一):正则表达式简介

http://blog.csdn.Net/laily/archive/2004/06/30/30360.Aspx 小程序大作为:高级查找/替换、正则表达式练习器、Javascript脚本程序调试器

http://blog.csdn.Net/laily/archive/2004/06/24/25872.Aspx 经典正则表达式

正则表达式,正规表达式,正则表达式匹配,正则表达式语法,模式匹配,正规表达式匹配 javascript正则表达式 Asp正则表达式 Asp.Net正则表达式 C#正则表达式 JSP正则表达式 Php正则表达式 VB.Net正则表达式 VBSCript正则表达式编程 delphi正则表达式 jscript

正则表达式 regular expression
正则表达式 RegExp
模式 pattern
匹配 Match
.Net命名空间: System.Text.RegularExpression

补充:
^\d+$  //匹配非负整数(正整数 + 0)
^[0-9]*[1-9][0-9]*$  //匹配正整数
^((-\d+)(0+))$  //匹配非正整数(负整数 + 0)
^-[0-9]*[1-9][0-9]*$  //匹配负整数
^-?\d+$    //匹配整数
^\d+(\.\d+)?$  //匹配非负浮点数(正浮点数 + 0)
^(([0-9]+\.[0-9]*[1-9][0-9]*)([0-9]*[1-9][0-9]*\.[0-9]+)([0-9]*[1-9][0-9]*))$  //匹配正浮点数
^((-\d+(\.\d+)?)(0+(\.0+)?))$  //匹配非正浮点数(负浮点数 + 0)
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)([0-9]*[1-9][0-9]*\.[0-9]+)([0-9]*[1-9][0-9]*)))$  //匹配负浮点数
^(-?\d+)(\.\d+)?$  //匹配浮点数
^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
^\w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$    //匹配email地址
^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$  //匹配url

利用正则表达式去除字串中重复的字符的算法程序:

var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //结果为:abcefgi
===============================
如果var s = "abacabefggeeii"
结果就不对了,结果为:abeicfgg
正则表达式的能力有限

1.确认有效电子邮件格式
下面的代码示例使用静态 Regex.IsMatch 方法验证一个字符串是否为有效电子邮件格式。如果字符串包含一个有效的电子邮件地址,则 IsValidEmail 方法返回 true,否则返回 false,但不采取其他任何操作。您可以使用 IsValidEmail,在应用程序将地址存储在数据库中或显示在 Asp.Net 页中之前,筛选出包含无效字符的电子邮件地址。

[Visual Basic]
Function IsValidEmail(strIn As String) As Boolean
' Return true if strIn is in valid e-mail format.
Return Regex.IsMatch(strIn, ("^([\w-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)(([\w-]+\.)+))([a-zA-Z]{2,4}[0-9]{1,3})(\]?)$")
End Function
[C#]
bool IsValidEmail(string strIn)
{
// Return true if strIn is in valid e-mail format.
return Regex.IsMatch(strIn, @"^([\w-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)(([\w-]+\.)+))([a-zA-Z]{2,4}[0-9]{1,3})(\]?)$");
}

2.清理输入字符串
下面的代码示例使用静态 Regex.Replace 方法从字符串中抽出无效字符。您可以使用这里定义的 CleanInput 方法,清除掉在接受用户输入的窗体的文本字段中输入的可能有害的字符。CleanInput 在清除掉除 @、-(连字符)和 .(句点)以外的所有非字母数字字符后返回一个字符串。

[Visual Basic]
Function CleanInput(strIn As String) As String
' Replace invalid characters with empty strings.
Return Regex.Replace(strIn, "[^\w\.@-]", "")
End Function
[C#]
String CleanInput(string strIn)
{
// Replace invalid characters with empty strings.
return Regex.Replace(strIn, @"[^\w\.@-]", "");
}

3.更改日期格式
以下代码示例使用 Regex.Replace 方法来用 dd-mm-yy 的日期形式代替 mm/dd/yy 的日期形式。

[Visual Basic]
Function MDYToDMY(input As String) As String
Return Regex.Replace(input, _
"\b(?\d{1,2})/(?\d{1,2})/(?\d{2,4})\b", _
"${day}-${month}-${year}")
End Function
[C#]
String MDYToDMY(String input)
{
return Regex.Replace(input,
"\\b(?\\d{1,2})/(?\\d{1,2})/(?\\d{2,4})\\b",
"${day}-${month}-${year}");
}
Regex 替换模式
本示例说明如何在 Regex.Replace 的替换模式中使用命名的反向引用。其中,替换表达式 ${day} 插入由 (?...) 组捕获的子字符串。

有几种静态函数使您可以在使用正则表达式操作时无需创建显式正则表达式对象,而 Regex.Replace 函数正是其中之一。如果您不想保留编译的正则表达式,这将给您带来方便

4.提取 URL 信息
以下代码示例使用 Match.Result 来从 URL 提取协议和端口号。例如,“http://www.contoso.com:8080/letters/readme.html”将返回“http:8080”。

[Visual Basic]
Function Extension(url As String) As String
Dim r As New Regex("^(?\w+)://[^/]+?(?:\d+)?/", _
RegexOptions.Compiled)
Return r.Match(url).Result("${proto}${port}")
End Function
[C#]
String Extension(String url)
{
Regex r = new Regex(@"^(?\w+)://[^/]+?(?:\d+)?/",
RegexOptions.Compiled);
return r.Match(url).Result("${proto}${port}");
}

如何用正则表达式表示要么是数字要么是字母 是字母的话只能是一个字母 数字则无所谓?
^[a-zA-Z]$^\d+$

No comments:

You are visitor:

---------------------------------------------

---------------------------------------------

007 (1) 1957 (1) 2016 (1) 2018 (4) 916变天 (1) 921 (1) 9R65 (1) ADA (4) AEONCR (17) AFFIN (5) AGM (1) Airasia (1) ALAQAR (4) Alor Setar (1) Ambank (1) ANA (1) AP (2) ASB (2) ASP (3) Assunta (2) Astrazeneca (1) ASTRO (1) bb58 (1) BEA (1) Belive (1) Bersih (2) Bigpay (2) Binance (1) BIPORT (4) BIT (1) bitcoin (2) Block (1) BNB (2) Boustead (8) Breguet (1) Breitling (3) Brickheadz (1) BrogaHill (1) BTC (7) Bucherer (1) Buenos Aires (1) Bukit Bintang (1) BURSA (38) Byakudan-nuri (1) Cardano (2) Carl F. Bucherer (3) Cartier (3) CashLite (1) Casio (2) CEX (1) Cheonggyecheon (1) CIMB (74) CIMBT (1) cityplusfm (1) ck2998 (4) Clubmed (1) Company Act (1) covid19 (17) Credor (3) CRO (1) Cruise (3) CTOS (6) cyrptocurrency (2) Damai Laut (1) Dannok (1) DAX (1) DBS (9) DCI (1) DEX (1) Disneyland (1) DOT (1) DPulze (1) DRP (1) DSLR (7) eGIA (2) EKOVEST (12) ELC (1) ETF (3) ETH (6) ethereum (4) eToro (1) Europcar (1) Filippo Loreti (3) Forbes (2) Forex (2) Fortuner (2) Frederick Constant (1) GADANG (13) Gaysorn Village (1) GCLP999 (1) Genting (3) Ginzanso (1) GKENT (1) GMT (1) GMWB5000D (1) GOLDETF (5) GOOGL (1) Grand Seiko (18) GS (1) GShock (1) GST (2) GutterUncensored (1) GyongBukGong (1) H1N1 (1) HAPSENG (1) Hatyai (4) Hibiscs (14) HKEX (1) HSBC (1) HSI (1) ICBC (2) Insadong (1) IPO (1) Isetan (3) James Bond (1) JAVA (1) JR (4) JTrust (1) KAREX (32) KAWAN (5) KAWANFOOD (4) KBANK (1) Kemi (2) Kenanga (1) Kickstarter (1) KIPREIT (59) KLCCP (1) KLCI (1) KLIA Ekspress (1) KPJ (1) KWSP (3) L&G (12) Laurel (1) LCTITAN (16) Lego (3) lhdn (1) LITRAK (11) Lotte (2) LTC (1) LUNA (1) LUNO (2) MACC (1) MALAKOF (6) Mastercard (1) Maxis (5) Maybank (83) MBPJ (1) MBSB (1) MCO (8) Mechanical (2) Merchantrade (1) META (2) MFCB (10) MISC (1) Miyota (1) MMCCORP (14) Mont Kiara (2) Mont Residences (3) Mortgage (1) MSM (1) MYEG (4) mystartr (1) N21U (1) Namsan Tower (1) Narita (1) Nato (1) navitimer. 1959 (1) NCB (5) NEAR (2) Nestle (13) NFT (1) Nirvana (1) OCBC (1) Omega (10) OPCOM (8) P&O (1) Panerai (1) Patek Philippes (1) Pattaya (1) PAYPAL (7) PBBank (40) PCR (1) Perth (5) Phuket (1) Plintas (4) Polkadot (2) PortDickson (1) POS (1) Poslaju (1) Presage (2) Prince Court (3) Propertise (1) PRS (1) PRU15 (1) Pulau Redang (2) python (2) Quartz (2) Ranua (1) REIT (15) REVENUE (11) RHB (1) Richard Mille (1) Ripple (1) Rolex (7) RPGT (1) RSV (1) RTK (1) S9+ (1) Saito (1) Samsung (1) Santos (1) SAW (1) SBGA211 (1) SBGA391 (2) sbgc231 (1) sbge245 (1) SBGH255 (1) sbgh269 (1) sbgm235 (4) SBGN003 (2) SBGP015 (1) sbgr311 (1) sbgw255 (1) SCB (6) Seamaster (1) Seiko (14) SET (2) SGX (4) SHL (28) SIRI (3) snowflake (1) SOL (1) Solana (2) Solidity (1) speedmaster (9) Spring Drive (2) SSPN (1) SST (1) Star Cruise (3) Stareit (2) STARHILLREIT (1) STI (1) Submariner (1) SUNCITY (3) SUNCON (1) SUNREIT (2) Sunway (40) SUPERMX (1) SWAB (1) Swiss Garden (1) TENAGA (24) Thongsia (1) Time (1) TM (1) TOPGLOV (7) Triang (1) Tudor (5) TUNEPRO (2) Uber (1) Ueno (3) Unit Trust (1) UOAREIT (5) Urushi (1) VBS (2) VISA (2) wifibaby (1) Withholding Tax (1) Xiaomi (1) XRP (2) youtuber (2) YTL (3) YTLPower (30) Zika (1) 上海 (1) 上野 (1) 东亚银行 (2) 东京 (11) 东堤小筑 (2) 东照宫 (1) 中东 (5) 中国 (31) 中社花市 (1) 丹麦 (6) 乐天 (2) 京都 (1) 仁寺洞 (1) 以太坊 (3) 以太币 (1) 伦敦 (1) 你的答案 (1) 俄罗斯 (1) 保险 (3) 信用卡 (1) 借贷 (1) 假期 (122) 光头党 (1) 克罗地亚 (1) 公司运作 (66) 公积金 (1) 公链 (1) 冠蓝狮 (5) 冬季 (14) 函馆 (2) 加密货币 (11) 匈牙利 (2) 北京 (11) 北欧 (26) 北海道 (23) 区块链 (1) 十月合唱团 (1) 千叶火锅 (1) 华为 (1) 卑尔根 (2) 卡罗维发利 (1) 印尼 (4) 原油 (1) 反贪会 (1) 另类音乐人 (1) 台中 (2) 台北 (2) 台场 (1) 台湾 (6) 合艾 (5) 吧生 (1) 哥本哈根 (6) 器官捐献 (1) 国阵 (1) 土耳其 (1) 圣彼得堡 (1) 圣诞 (1) 圣诞老人村 (3) 城隍庙 (1) 基金 (2) 塔林 (1) 外汇 (1) 大仓山 (1) 大选 (8) 大阪 (1) 大马交易所 (1) 天津 (1) 奥地利 (4) 奥斯陆 (3) 奥运会 (2) 婚宴 (4) 孩子 (1) 安华 (1) 家协 (1) 富士 (5) 富爸爸穷爸爸 (4) 寮国 (1) 对冲 (1) 小樽 (2) 崇文 (8) 工商银行 (3) 布拉格 (2) 布拉迪斯拉发 (1) 布达佩斯 (2) 希盟 (1) 建筑 (1) 微软 (1) 德国 (1) 意大利 (1) 慈善活动 (2) 慕尼黑 (1) 成都 (4) 房地产 (6) 房贷 (1) 手表 (29) 投资分享 (223) 拉斯维加斯 (1) 拉曼 (1) 拉萨 (4) 拔牙 (1) 挪威 (6) 捷克 (3) 搬家 (3) 政坛评论 (13) 教总 (1) 教育 (1) 数字营销 (1) 斯德哥尔摩 (2) 斯洛伐克 (1) 斯洛文尼亚 (1) 新书介绍 (1) 新交所 (1) 新冠肺炎 (18) 新加坡 (5) 新宿 (3) 新干线 (1) 新西兰 (1) 日光 (3) 日喀则 (4) 日本 (48) 普吉岛 (3) 景福宫 (1) 曼谷 (7) 有感而发 (83) 札幌 (13) 机械 (3) 杭州 (1) 柬埔寨 (2) 校友会 (4) 桃园 (1) 森吉山 (1) 槟城 (3) 欧债危机 (5) 欧洲 (33) 歌曲 (12) 武汉肺炎 (2) 母亲 (2) 比尔森 (1) 比特币 (5) 汇率 (1) 河口湖 (2) 法庭 (1) 波黑 (1) 泰国 (20) 泰国股市 (5) 洛杉矶 (1) 浅草 (1) 海信 (1) 消费 (3) 涉谷 (1) 清溪川 (1) 温泉 (5) 港交所 (1) 港口 (3) 游山玩水 (150) 澳洲 (5) 烧炭 (1) 爱后余生 (1) 爱沙尼亚 (1) 父亲 (2) 独中 (1) 猪仔 (1) 琅玡台 (1) 瑞典 (3) 瑞士 (2) 瑞峰菇场 (1) 瑞波币 (2) 生活小品 (110) 登别 (3) 白银 (1) 百万组合 (1) 神桥 (1) 离婚 (2) 秋田 (3) 种族主义 (2) 税务 (1) 精工 (2) 纽西兰 (1) 统考 (1) 维也纳 (3) 编程方案 (7) 网盟 (1) 网赌 (1) 罗瓦涅米 (8) 美元 (1) 美国 (6) 美国债务 (1) 胜兴车站 (1) 胡志明市 (1) 脚车 (1) 腾讯 (2) 自助游 (119) 自驾游 (6) 艾达币 (1) 芬兰 (16) 苗栗 (1) 范蠡 (1) 茉莉花革命 (1) 莫斯哥 (1) 莱特币 (1) 董总 (1) 虚拟货币 (1) 西宁 (2) 西班牙大流感 (1) 西藏 (9) 西门町 (2) 角馆 (3) 谢霆锋 (1) 警察 (1) 谷歌 (1) 财政预算案 (2) 货币 (2) 贵朵 (1) 资本奇迹 (1) 资源分享 (64) 赌球 (1) 赫尔辛基 (7) 越南 (2) 转校 (1) 运动会 (1) 迪士尼 (1) 迪拜 (5) 退休 (1) 退税 (1) 通城 (1) 钟贵发 (2) 银山 (2) 银山庄 (1) 银座 (2) 银行 (25) 锦里 (1) 长和 (3) 长实 (5) 长洲 (3) 阿冗 (1) 阿拉伯 (5) 阿斯利康 (1) 阿根廷 (1) 阿联酋 (5) 阿里健康 (1) 阿里巴巴 (1) 雅加达 (3) 霖記甕缸雞创始店 (1) 青岛 (1) 韩国 (7) 首尔 (6) 首尔塔 (1) 香港 (12) 马哈迪 (1) 马来西亚 (7) 马来西亚半岛 (3) 骨痛热症 (1) 骨骼疏松症 (1) 高雄 (1) 鬼怒川 (3) 鹿港 (1) 黄金 (6) 黑社会 (1)