0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

快速入门IPv6和正则表达式

8nfr_ZTEdevelop 来源:未知 作者:李倩 2018-03-30 09:31 次阅读

【摘要】

多个市场要求无线4G网管全面支持IPv6,在开发过程中,遇到大量需要做IPv6校验的地方,本文通过正则表达式解决IPv6校验的问题,来介绍正则表达式最基本的用法,帮助大家入门,打消对正则表达式的心理恐惧。

【关键词】

IPv6,正则表达式

1背景

在学习正则表达式时,有一个美式笑话:

“Some people, when confronted with a problem, think“I know, I’ll use regular expressions.”Now they have two problems.”

当你意识到一个问题可以用正则表达式来解决时,你就有两个问题了,因为正则表达式本身就是一个big problem。2012年6月6日,全球范围内的IPv6网络正式启动,IPv6的应用已经是大势所趋。本文通过正则表达式解决IPv6校验的问题,来介绍正则表达式最基本的用法,帮助大家入门。

正则表达式(Regular expressions)本质上是一个微小的且高度专业化的编程语言,它被嵌入到高级语言中供程序员使用。正则表达式通过指定一些规则来描述那些你希望匹配的字符串集合,比如Email地址,IP地址。正则表达式的强大之处在于一些特殊符号的应用,特殊符号定义了字符集合、子组匹配、模式重复次数。如果没有这些特殊字符,正则表达式就和大多数文本编辑器中的Ctrl+F一样平庸,仅仅只是匹配纯字符而已。

2实践情况

2.1正则表达式特殊字符说明

正则字符包括保留字(. ^ $ * + ? { } [ ] ( ) \ |)和其它字符,下面列出最常用的正则表达式特殊字符的详细含义:

下边列举了由字符'\'和另一个字符组成的特殊含义。注意,'\' +元字符的组合可以解除元字符的特殊功能

2.2正则表达式特殊字符的4个角色

为方便记忆,可以按字符的功能,分为4个角色:

2.3常用正则表达式

2.4正则表达式在高级语言中的应用

python中的re模块和java中的java.util.regex为例,做一个对比,展示正则表达式在高级语言中的一些常用用法。

2.5IPv4表示法

IP地址的长度为32b(bit),分为4段,每段8位,用十进制数字表示,每段数字范围为0~255,段与段之间用英文句点“.”隔开。例如:某台计算机IP地址为111.22.33.4。

分析IP地址的组成特点:250-255、200-249、0-199。这三种情况可以分开考虑:

250-255:三位数,百位是2,十位是5,个位是0~5,用正则表达式可以写成:25[0-5]

200-249:三位数,百位是2,十位是0~4,个位是0~9,用正则表达式可以写成:2[0-4]\d

0-199:这个可以继续分拆:

l0-9: 一位数,个位是0~9,用正则表达式可以写成:\d

l10-99:二位数,十位是1~9,个位是0~9,用正则表达式可以写成:[1-9]\d

l100-199:三位数,百位是1,十位是0~9,个位是0~9,用正则表达式可以写成:1\d{2}

于是0-99的正则表达式可以合写为[1-9]?\d,那么0-199用正则表达式就可以写成(1\d{2})|([1-9]?\d),这样0~255的正则表达式就可以写成(25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d)))

最后,后面3段加上句点.可以使用{3}重复得到,得到IP地址的正则表达式,可以写成如下形式,2种均可:

2.6IPv6表示法

IPv6的地址长度为128b(bit),是IPv4地址长度的4倍。采用十六进制表示。IPv6有3种表示方法:

分析IPv6地址的特点,可以归纳如下:

标准十六进制表示法(包括前导0省略) 纯数字格式: ([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:)
2001:0008:0009:0023:0008:0800:8888:9999
纯字母格式:
ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:ABCD
数字和字母混合格式:
ABCD:EF01:2345:6789:ABCD:EF01:2345:6789
格式中前面带0:
2001:0DB8:0000:0023:0008:0800:200C:417A
格式中前面每一位为0:
0001:0DB8:0000:0023:0008:0800:000C:017A
全0:
0000:0000:0000:0000:0000:0000:0000:0000
多位0在中间:如fec0:1:0:0:0:0:0:1234
多位0在前面:如0:0:0:0:0:1234:fec0:1
多位0在最后:如1234:fec0:1:0:0:0:0:0
全0:0:0:0:0:0:0:0:0
全0:0:000:0:0:0:0:0:0
全0:0:00:0:0:0:0:0:0
全0:0:0000:0:0:0:0:0:0
前导0省略位置遍历
1个位置前导0省略:
ABCD:EF01:2345:6789:ABCD:EF01:2345:1
ABCD:EF01:2345:6789:ABCD:EF01:2:9999
ABCD:EF01:2345:6789:ABCD:2:EF01:9999
ABCD:EF01:2345:6789:2:ABCD:EF01:9999
ABCD:EF01:2345:2:6789:ABCD:EF01:9999
ABCD:EF01:2:2345:6789:ABCD:EF01:9999
ABCD:2:EF01:2345:6789:ABCD:EF01:9999
2:ABCD:EF01:2345:6789:ABCD:EF01:9999
其他前导0省略情况:
89:DB8:0:23:8:800:C:417
89:DB8:0:23:8:800:0C:417
89:DB8:0:23:8:800:00C:417
89:DB8:0:23:8:800:000C:417
2001:DB8:0:23:8:800:000C:417A
0位压缩表示法 ABCD:EF01:2345:6789:ABCD:EF01:8.8.8.9 (([0-9A-Fa-f]{1,4}:){6}(((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:[0-9A-Fa-f]{1,4}|:))
(左起有6个位置用标准16进制表示) ABCD:EF01:2345:6789:ABCD:EF01::EF01
ABCD:EF01:2345:6789:ABCD:EF01::
0位压缩表示法 ABCD:EF01:2345:6789:ABCD::8.8.8.9 (([0-9A-Fa-f]{1,4}:){5}(:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|((:[0-9A-Fa-f]{1,4}){1,2})|:))
(左起有5个位置用标准16进制表示) ABCD:EF01:2345:6789:ABCD::EF01
ABCD:EF01:2345:6789:ABCD::EF01:EF01
ABCD:EF01:2345:6789:ABCD::
0位压缩表示法 ABCD:EF01:2345:6789::EF01:8.8.8.9 (([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,3})|:))
(左起有4个位置用标准16进制表示) ABCD:EF01:2345:6789::8.8.8.9
ABCD:EF01:2345:6789::EF01
ABCD:EF01:2345:6789::EF01:EF01
ABCD:EF01:2345:6789::EF01:EF01:EF01
ABCD:EF01:2345:6789::
0位压缩表示法 ABCD:EF01:2345::8.8.8.9 (([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,4})|:))
(左起有3个位置用标准16进制表示) ABCD:EF01:2345::EF01:8.8.8.9
ABCD:EF01:2345::EF01:EF01:8.8.8.9
ABCD:EF01:2345::EF01
ABCD:EF01:2345::EF01:EF01
ABCD:EF01:2345::EF01:EF01:EF01
ABCD:EF01:2345::EF01:EF01:EF01:EF01
ABCD:EF01:2345::
0位压缩表示法 ABCD:EF01::8.8.8.9 (([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,5})|:))
(左起有2个位置用标准16进制表示) ABCD:EF01::EF01:8.8.8.9
ABCD:EF01::EF01:EF01:8.8.8.9
ABCD:EF01::EF01:EF01:EF01:8.8.8.9
ABCD:EF01::EF01
ABCD:EF01::EF01:EF01
ABCD:EF01::EF01:EF01:EF01
ABCD:EF01::EF01:EF01:EF01:EF01
ABCD:EF01::EF01:EF01:EF01:EF01:EF01
ABCD:EF01::
0位压缩表示法 ABCD::8.8.8.9 (([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,6})|:))
(左起有1个位置用标准16进制表示) ABCD::EF01:8.8.8.9
ABCD::EF01:EF01:8.8.8.9
ABCD::EF01:EF01:EF01:8.8.8.9
ABCD::EF01:EF01:EF01:EF01:8.8.8.9
ABCD::EF01
ABCD::EF01:EF01
ABCD::EF01:EF01:EF01
ABCD::EF01:EF01:EF01:EF01
ABCD::EF01:EF01:EF01:EF01:EF01
ABCD::EF01:EF01:EF01:EF01:EF01:EF01
ABCD::
0位压缩表示法 ::8.8.8.9 (:(((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,7})|:))
(左起开始压缩) ::EF01:8.8.8.9
::EF01:EF01:8.8.8.9
::EF01:EF01:EF01:8.8.8.9
::EF01:EF01:EF01:EF01:8.8.8.9
::EF01:EF01:EF01:EF01:EF01:8.8.8.9
::EF01
::EF01:EF01
::EF01:EF01:EF01
::EF01:EF01:EF01:EF01
::EF01:EF01:EF01:EF01:EF01
::EF01:EF01:EF01:EF01:EF01:EF01
::EF01:EF01:EF01:EF01:EF01:EF01:EF01
::

综上,得出IPv6地址的完整正则表达式为:

3效果评价

对于日常开发中只接触IPv4,并没有深入研究过正则表达式的开发者,面对IPv6和正则表达式,容易产生畏惧心理,觉得是两座难以翻越的大山。本文通过一些表格整理对IPv6的表示方法,以及正则表达式的特殊符号进行了分类和说明,带领大家快速入门IPv6和正则表达式。

4推广建议

本文所述IPv6正则表达式已经过测试,可以直接拿到各个高级语言中应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IPv6
    +关注

    关注

    6

    文章

    618

    浏览量

    58949
  • 编程语言
    +关注

    关注

    9

    文章

    1878

    浏览量

    33060

原文标题:干货 | IPv6正则表达式攻略

文章出处:【微信号:ZTEdeveloper,微信公众号:中兴开发者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是正则表达式正则表达式如何工作?哪些语法规则适用正则表达式

    正则表达式又称规则表达式(Regular Expression,在代码中常简写为 regex、regexp 或 RE),是一种用于匹配、查找、替换文本的强大工具。它能够以特定的模式匹配字符串,从而
    的头像 发表于 11-03 14:41 549次阅读
    什么是<b class='flag-5'>正则表达式</b>?<b class='flag-5'>正则表达式</b>如何工作?哪些语法规则适用<b class='flag-5'>正则表达式</b>?

    shell正则表达式学习

    正则表达式在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多
    发表于 07-25 17:18

    浅析正则表达式

    正则表达式与django
    发表于 08-29 11:09

    正则表达式运用解析

    正则表达式的运用二
    发表于 09-11 08:59

    初识 Python 正则表达式

    正则表达式是一个特殊的字符序列,用于判断一个字符串是否与我们所设定的字符序列是否匹配,也就是说检查一个字符串是否与某种模式匹配。Python 自 1.5 版本起增加了re 模块,它提供 Perl
    发表于 03-17 16:44

    深入浅出boost正则表达式

    什么是正则表达式正则表达式是一种用来描述一定数量文本的模式。Regex代表Regular Express. 如果您不知道什么是正则表达式,请看这篇文章:深入浅出之正则表达式
    发表于 09-08 18:09 9次下载

    PHP正则表达式

    PHP正则表达式,PHP建设必备的的工具,初学者简单易懂快速入门,高手进阶手册。
    发表于 04-18 10:46 0次下载

    精通正则表达式

    详细的快速正则表达式的查询电子书,简单而丰富
    发表于 05-16 18:04 5次下载

    Python正则表达式的学习指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化
    发表于 09-15 08:00 0次下载
    Python<b class='flag-5'>正则表达式</b>的学习指南

    Python正则表达式指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化
    发表于 03-26 09:13 10次下载
    Python<b class='flag-5'>正则表达式</b>指南

    C语言如何使用正则表达式

    C语言的正则表达式规则,特此跟大家分享。
    的头像 发表于 03-16 08:41 4284次阅读

    python正则表达式中的常用函数

    编译正则表达式模式,返回一个正则对象的模式。(可以把那些常用的正则表达式编译成正则表达式对象,这样可以提高一点效率。)
    的头像 发表于 03-18 16:12 1554次阅读

    Linux入门正则表达式

    正则表达式是用来表达字符串匹配模式的方法,利用正则表达式,可以让我们轻易地实现对目标字符串的**查找**、**删除**、**替换**等操作。 正则表达式并不复杂,它并不包含难以理
    的头像 发表于 05-12 15:31 564次阅读
    Linux<b class='flag-5'>入门</b>之<b class='flag-5'>正则表达式</b>

    shell脚本基础:正则表达式grep

    在Linux上有许多命令可以使用正则表达式,其中最常见的是grep命令和sed命令。正则表达式有多种类型,每种类型中可以使用的元字符类型不同。最常见的是基本正则表达式和扩展正则表达式
    的头像 发表于 05-29 09:29 766次阅读
    shell脚本基础:<b class='flag-5'>正则表达式</b>grep

    Python中的正则表达式

    字符串的特征,这样我们就可以快速、高效地处理大量的文本数据。 基础语法 在Python中,使用re模块来操作正则表达式。re模块提供了很多函数,用于对字符串进行正则匹配和替换。以下是一些常用的
    的头像 发表于 06-21 16:52 708次阅读