SQL Server 2005: 正则表达式使模式匹配和数据提取变得更容易
2009-02-10 10:20:07 来源:WEB开发网我经常查看 MSDN® 论坛中有关如何将一列值传递到存储过程的问题。我见过各种复杂的方法,它们将这类列表解析为实际列表以确定相关记录。RegexMatches 函数提供了更简洁的方法。
declare @pattern nvarchar(max), @list nvarchar(max)
select @pattern = N'[^,]+', @list = N'2,4,6'
select d.* from [Data] d
inner join dbo.RegexMatches( @list, @pattern ) re
on d.[ID] = re.[Text]
此模式与任何不包含逗号的字符组匹配。如果给定一个名为 Data 的表和一个名为 ID 的整数列,此查询将返回列表中标识的每个记录。鉴于 SQL Server 中的隐式转换功能,这样会更有用。同一查询还可用于整数、日期/时间、GUID 或浮点数据类型。处理一列值的其他方法需要使用多个函数或存储过程才能达到这种灵活程度。此函数还可用于未以逗号分隔的列表。也可处理以空格、分号、制表符、回车或任何其他可识别字符分隔的列表。
在匹配项中进行数据提取
类似于返回匹配项,我们还可以从每个匹配项中提取数据。尝试使用 SQL 来进行这种操作是非常困难的。通常,这类任务将在应用程序而不是数据库中实现,这样会产生问题,因为使用该数据库的每个应用程序都必须实现所需过程。在此情况下,合理的方法是在存储过程中实现此功能。
同 RegexMatches 实现一样,我喜欢使用自定义的可枚举对象来返回组信息。由于我们还必须在每个匹配项中循环访问组,因此分组是唯一略微复杂的操作。在图 4 中,GroupNode 类与 MatchNode 类一样,除了它还包括其所代表的组的名称。GroupIterator 类与 MatchIterator 类类似,除了它还包括返回每个组的额外循环。由于拥有可枚举对象,因此我定义表值函数的过程与定义 RegexMatches 函数的过程一样。
更多精彩
赞助商链接