更新时间:2021年07月09日12时01分 来源:传智教育 浏览次数:
正则表示“规则的、极好的”,正则表达式实际上就是规定了一组文本模式匹配规则的符号语言,一条正则表达式也称为一个模式,使用这些模式,用户可匹配指定文本中与表达式模式相同的字符串。
正则表达式也可理解为描述字符串结构模式的形式化表达“方法”或“思想”,它与一些特定工具搭配使用,可以实现包括添加、删除、分离、插入、选择等各种文本分析功能。
正则表达式的起源:
正则表达式(regular expression)起源于两位神经生理方面的科学家——美国新泽西州的Warren McCulloch和出生在美国底特律的Walter Pitts——研究出的一种用数学方式来描述神经网络的新方法,他们创造性地将神经系统中的神经元描述成了小而简单的自动控制元。
1951年,数学科学家Stephen Kleene在他们工作的基础上,发表了一篇题为《神经网事件的表示法》的论文,该论文中利用称为正则集合的数学符号来描述此模型,引入了正则表达式的概念。之后的一段时间,人们逐渐将正则表达式应用于包括生物、数学以及计算机科学等的各个领域。
在计算机领域中,正则表达式最先应用于搜索算法的一些早期研究,Unix之父Ken Thompson将其引入编辑器QED,然后是Unix上的编辑器ed,并最终引入grep。自此之后,正则表达式被广泛地应用到了各种Unix或类Unix工具中。
随着正则表达式的广泛应用,正则表达式逐渐从模糊而深奥的数学概念,发展成为计算机各类工具和软件包应用中的主要功能,亦有越来越多的编程语言,包括PHP、C#、Java等实现了对正则表达式的支持,并提供了与其操作相关的接口,Python也不例外。