SQL语句与正则表达式社会保险

今日个才精通SQL语句还是能搭配正则说明式作为查询条件,至极有用。

REGEXP_LIKE(匹配)
REGEXP_INSTR (包含)
REGEXP_REPLACE(替换)
REGEXP_SUBSTR(提取)

表 1:定位元字符

元字符 说明
^ 使表达式定位至一行的开头
$ 使表达式定位至一行的末尾

表 2:量词或重新操作符

量词 说明
* 匹配 0 次或更多次
? 匹配 0 次或 1 次
+ 匹配 1 次或更多次
{m} 正好匹配 m 次
{m,} 至少匹配 m 次
{m, n} 至少匹配 m 次但不超过 n 次

表 3:预订义的 POSIX 字符类

字符类 说明
[:alpha:] 字母字符
[:lower:] 小写字母字符
[:upper:] 大写字母字符
[:digit:] 数字
[:alnum:] 字母数字字符
[:space:] 空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符
[:punct:] 标点字符
[:cntrl:] 控制字符(禁止打印)
[:print:] 可打印字符

表 4:表达式的轮换匹配和分组

元字符

说明

|

替换

相隔替换选项,寻常与分组操作符 () 一起利用

( )

分组

将子表明式分组为一个替换单元、量词单元或后向引用单元(参见“后向引用”部分)

[char]

字符列表

意味着一个字符列表;一个字符列表中的绝半数以上元字符(除字符类、^ 和 – 元字符之外)被明白为文字

表 5:REGEXP_LIKE 操作符

语法 说明
REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。

表 6:REGEXP_INSTR 函数

语法 说明
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。

表 7: 5 位数字加 4 位邮编表达式的认证

语法 说明
必须匹配的空白
[:digit:] POSIX 数字类
] 字符列表的结尾
{5} 字符列表正好重复出现 5 次
( 子表达式的开头
一个文字连字符,因为它不是一个字符列表内的范围元字符
[ 字符列表的开头
[:digit:] POSIX [:digit:]类
[ 字符列表的开头
] 字符列表的结尾
{4} 字符列表正好重复出现 4 次
) 结束圆括号,结束子表达式
? ? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选
$ 定位元字符,指示行尾

表 8:REGEXP_SUBSTR 函数

语法 说明
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函数返回匹配模式的子字符串。

表 9: REGEXP_REPLACE 函数

语法 说明
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的“搜索并替换”操作。

表 10:后向引用元字符

元字符

说明

\社会保险,digit

反斜线

尾随一个 1 到 9 之间的数字,反斜线匹配从前的用括号括起来的第 digit
个子表明式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能意味着
Escape 字符。

表 11:方式调换正则表达式的表明

正则表达式项目 说明
( 第一个子表达式的开头
. 匹配除换行符之外的任意单字符
* 重复操作符,匹配之前的 . 元字符 0 到 n 次
) 第一个子表达式的结尾;匹配结果在 \1
中获取(在这个例子中,结果为 Ellen。)
必须存在的空白
( 第二个子表达式的开头
. 匹配除换行符之外的任意单个字符
* 重复操作符,匹配之前的 . 元字符 0 到 n 次
) 第二个子表达式的结尾;匹配结果在 \2
中获取(在这个例子中,结果为 Hildi。)
空白
( 第三个子表达式的开头
. 匹配除换行符之外的任意单字符
* 重复操作符,匹配之前的 . 元字符 0 到 n 次
) 第三个子表达式的结尾;匹配结果在 \3
中获取(在这个例子中,结果为 Smith。)

表 12:社会保障号码正则表达式的求证

正则表达式项目 说明
^ 行首字符(正则表达式在匹配之前不能有任何前导字符。)
( 开始子表达式并列出用 | 元字符分开的可替换选项
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{3} 字符列表正好重复出现 3 次
连字符
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{2} 字符列表正好重复出现 2 次
另一个连字符
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{4} 字符列表正好重复出现 4 次
| 替换元字符;结束第一个选项并开始下一个替换表达式
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{9} 字符列表正好重复出现 9 次
) 结束圆括号,结束用于替换的子表达式组
$ 定位元字符,指示行尾;没有额外的字符能够符合模式

SELECT
* FORM. tKHXX where REGEXP_LIKE(SJHM,
‘^[1]{1}[35]{1}[[:digit:]]{9}$’
本着那么些表明式解释一下
^
代表初始
$
表示为止
[]个中为同盟范围
{}里的始末表时个数,有几位

手机编号的风味是以
1开首接着是3或5再加9位的数字 所以这么理解
1初叶 表达式为 ^[1]{1} 意为 初叶1位里含有1
3或5 表明式为 [35]{1}
9位数字截至 为: [[:digit:]]{9}$
这里[:digit:]为相当写法,代表为数字 再加个竣事符$

 转摘:http://blog.itpub.net/352988/viewspace-702052/

发表评论

电子邮件地址不会被公开。 必填项已用*标注