Lua 学习 chapter10
目录
- 正则表达式
- 模式匹配相关的函数
- URL编码
- 制表符的展开
- 诀窍
Just be handsome.
正则表达式
- . 任意字符
- %a 字母
- %c 控制字符
- %d 数字
- %g 除空格外的可打印字符
- %l 小写字母
- %p标点符号
- %s 空白字符
- %u 大写字母
- %w 字母和数字
- %x 十六进制数字
还有一些魔法字符,也可以称之为元字符。 其中与其他的语言不同的是在lua中%是转义字符而不是’'。
- + 重复一次或多次
- * 重复零次或者多次(最大匹配)
- - 重复零次或者多次(最小匹配)位于[]中中间表示范围
- ? 可选
- ^ 位于模式的开头 从头开始匹配 位于[]中开头表示非
- $ 位于模式的结尾 从尾部向前匹配
在lua中可以使用()来对匹配到的结果进行返回
1
2
3
4
5
6
pair = "name = Anna"
key, value = string.match(pair, "(%a+)%s*=%s*(%a+)")
print(key, value) -- name Anna
s = [[then he said: "it's al right"!]]
q, quotedPart = string.match(s, "(["'](.-)%1")
print(quotedPart) -- it's al right
模式匹配相关的函数
- string.find(ste,reg) –返回开始和结束的index
- string.match – 返回匹配到的内容
- string.gmatch –返回一个函数,通过函数可以遍历一个字符串出现的指定模式
- string.sub
string.sub 有三个参数,它的第三个参数不仅仅可以是字符串还可以是函数或者表。 当时函数的时候每次匹配到合适的字符串的时候就调用函数参数为匹配到的值,用函数的返回值来替换字符串;当是表的时候,将匹配到的字符串作为key值来得到 用来替换的字符串。
1
2
3
4
5
6
7
8
9
10
s = "some string"
local words = {}
for w in string.gmatch(s, "%a+") do
print(w)
table.insert(words, w)
end -- some string
name = "Lua"
status = "great"
print(expend("$name is $status")) –Lua is great 2 其中2表示匹配成功的字符串
url编码
这种编码方式会将特殊字符编码为”%xx”的形式(=、&、+),会将空格转换为加号”+”。例如字符串”a+b = c”,就会别编码成”a%2Bb+%3D+c”。
1
2
3
4
5
6
function unescape(s)
s = string.gsub(s, "+", " ")
s = string.gsub(s, "%%(%x%x"),function(h)
return string.char(tonumber(h, 16)
end)
end
制表符的展开
在lua语言中,像”()”这样的空白捕捉具有特殊的含义,表示捕捉模式在目标字符串中的位置。
1
2
3
4
5
6
7
8
9
10
11
print*string.match("hell0", "()ll()") -->3 5
--输出的是匹配的第一个字符的位置和输出最后一个字符之后的那个字符的位置
function expandTabs(s, tab)
tab = tab or 8
local corr = 0
s = string.gsub(s, "()t",function(p)
local sp = tab - (p - 1 + corr) % tab
corr = corr - 1 + sp
return string.rep(" ", sp)
end)
return s
诀窍
- ”(.-)%$” 和 “^(.-)%$” –前面一种模式的匹配会导致当没有’$’符号时,模式匹配算法会从字符串的第一个位置开始匹配,到尾之后从第二个位置再次匹配,算法的复杂度为n的二次方。
- “%a*” 会导致空字符串 所以在使用 “.-“的时候注意会匹配到空字符串。
<hr style="visibility: hidden;"/>
<hr style="visibility: hidden;"/>