亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 開發 > 綜合 > 正文

深入探究Lua中的解析表達式

2024-07-21 23:04:57
字體:
來源:轉載
供稿:網友

 使用一個模式

這個例子顯示了一個建立和使用模式的程序,它非常簡單但很完整:

 

復制代碼 代碼如下:
local lpeg = require "lpeg"

 

-- matches a word followed by end-of-string
p = lpeg.R"az"^1 * -1

print(p:match("hello"))        --> 6
print(lpeg.match(p, "hello"))  --> 6
print(p:match("1 hello"))      --> nil

 

模式是簡單的一個或多個小寫字符并在尾端以(-1)結束的序列。該程序調用match來當作一個方法和函數。在以上成功案例,匹配函數返回成功 匹配的第一個字符的索引,為其字符串長度加1。

 

復制代碼 代碼如下:
Name-value lists

 

這個例子解析一個名稱 - 值配對的列表,并返回那些配對的表:

 

復制代碼 代碼如下:
lpeg.locale(lpeg)   -- adds locale entries into 'lpeg' table

 

local space = lpeg.space^0
local name = lpeg.C(lpeg.alpha^1) * space
local sep = lpeg.S(",;") * space
local pair = lpeg.Cg(name * "=" * space * name) * sep^-1
local list = lpeg.Cf(lpeg.Ct("") * pair^0, rawset)
t = list:match("a=b, c = hi; next = pi")  --> { a = "b", c = "hi", next = "pi" }

 

每一配對都有  formatname =namefollowed 的一個可選的分離器(用逗號或分號)。  配對模式(Thepairpattern)在一個組模式里形成閉包,那么那些名稱就可以成為單個捕獲的值。 列表模式 (Thelistpattern)然后折疊這些捕獲。 它以空列表開始,通過創建列表捕獲匹配一個空字符串,然后為每個捕獲(一名稱對)appliesrawsetover累加器(表)和捕捉值(對名稱)。rawsetreturns((未初始化的集合)返回表本身,所以累加器總是表中執行。


以下代碼創建了一個模式,該模式使用給定的分隔模式sep作為分隔器來來拆分字符串:

 

復制代碼 代碼如下:
function split (s, sep)
  sep = lpeg.P(sep)
  local elem = lpeg.C((1 - sep)^0)
  local p = elem * (sep * elem)^0
  return lpeg.match(p, s)
end

 

首先,該函數確保sep一個合適的模式。只要沒有匹配分隔器,該模式的elem 是重復的零個或多個任意字符。它還捕捉其匹配值。模式p匹配由sep拆分的一組元素.

如果拆分產生的結果值太多,可能會溢出由一個Lua函數返回的最大數目的值。在這種情況下,我們可以將這些值放到一個表中:

 

復制代碼 代碼如下:
function split (s, sep)
  sep = lpeg.P(sep)
  local elem = lpeg.C((1 - sep)^0)
  local p = lpeg.Ct(elem * (sep * elem)^0)   -- make a table capture
  return lpeg.match(p, s)
end

 

模式搜索

基本的匹配僅僅工作在錨定模式下。如果我們打算查找匹配字符串中任何地方的模式,那么我們必須寫一個匹配任何地方的模式。

因為模式是可以編寫的,所以我們可以編寫一個函數,它給定一個任意的模式p,返回一個搜索p的新模式,以匹配字符串的任何位置。執行這種搜索有幾種方法。一種方法如下:

 

復制代碼 代碼如下:
function anywhere (p)
  return lpeg.P{ p + 1 * lpeg.V(1) }
end

 

這個語法的直接解讀:匹配p或者跳過一個字符,然后試圖再次匹配。

如果我們想知道這個模式在字符串的所有匹配位置(而不僅僅知道它在字符串的某個位置),那么我們可以給這個模式添加位置捕捉:

 

復制代碼 代碼如下:
local I = lpeg.Cp()
function anywhere (p)
  return lpeg.P{ I * p * I + 1 * lpeg.V(1) }
end

 

print(anywhere("world"):match("hello world!"))   -> 7   12

這種搜索的另一個方法如下:

 

復制代碼 代碼如下:
local I = lpeg.Cp()
function anywhere (p)
  return (1 - lpeg.P(p))^0 * I * p * I
end

 

再次說明,這個模式的直接解讀:當不匹配p時,它跳過盡可能多的字符,然后對p進行匹配(外加正確的位置捕捉)。

如果我們打算查找僅僅匹配單詞邊界的模式的話,那么我們可以使用以下轉換:

 

復制代碼 代碼如下:
local t = lpeg.locale()

 

function atwordboundary (p)
  return lpeg.P{
    [1] = p + t.alpha^0 * (1 - t.alpha)^1 * lpeg.V(1)
  }
end

 

平衡的括號

以下模式只匹配帶有平衡括號的字符串::

 

復制代碼 代碼如下:
b = lpeg.P{ "(" * ((1 - lpeg.S"()") + lpeg.V(1))^0 * ")" }

 

閱讀第一個(也是唯一的)所給語法規則,所謂平衡字符串,就是一個開括號,后跟零個或多個非括號字符或者平衡字符串(LPFG.V(1)),最后跟著與開括號能夠閉合的結束括號。
全局替換

下面的例子和tostring.gsub所做工作類似。它接收一個母串和一個模式以及一個替換值,然后替代所傳入的母串中所有與指定模式匹配的子串為指定的替換值::

 

復制代碼 代碼如下:
function gsub (s, patt, repl)
  patt = lpeg.P(patt)
  patt = lpeg.Cs((patt / repl + 1)^0)
  return lpeg.match(patt, s)
end

 

作為instring.gsub,替換值可以是一個字串、函數,或者一個表.

逗號分隔值(CSV)

下面的例子將字符串轉換成逗號分隔的值,并返回所有的字段:

 

復制代碼 代碼如下:
local field = '"' * lpeg.Cs(((lpeg.P(1) - '"') + lpeg.P'""' / '"')^0) * '"' +
                    lpeg.C((1 - lpeg.S',/n"')^0)

 

local record = field * (',' * field)^0 * (lpeg.P'/n' + -1)

function csv (s)
  return lpeg.match(record, s)
end

 

一個字段或是一個引用的字段(一族可能包含任何字符除單引號,或雙引號)或是一個未被引用的字段(不包含逗號,換行符或引號)。一個記錄就是一個用逗號分隔的字段列表(以換行符或以字符串結尾)。

就像這樣,前面的匹配返回的每個字段都是獨立返回的。若我們添加一個列表截取定義的記錄。返回的將不再是一個獨立的包含所有字段的列表。

 

復制代碼 代碼如下:
local record = lpeg.Ct(field * (',' * field)^0) * (lpeg.P'/n' + -1)

 


UTF-8 和 Latin 1

使用LPeg來將一字符串從UTF-8編碼轉換成Latin 1(ISO 88590-1),這并不困難:

 

復制代碼 代碼如下:
-- convert a two-byte UTF-8 sequence to a Latin 1 character
local function f2 (s)
  local c1, c2 = string.byte(s, 1, 2)
  return string.char(c1 * 64 + c2 - 12416)
end

 

local utf8 = lpeg.R("/0/127")
           + lpeg.R("/194/195") * lpeg.R("/128/191") / f2

local decode_pattern = lpeg.Cs(utf8^0) * -1

 

這些代碼中,UTF-8定義已經為Latin 1的編碼范圍(從0到255)。所有不在該范圍內的編碼(以及任何無效的編碼)將不匹配該模式。

正如decode_pattern所要求的,這個模式匹配所有的輸入(因為-1在它的結尾處),任何無效字符串會匹配失敗,而無任何關于此問題的有用信息。我們可以通過重定義如下decode_pattern來改善這種情況:

 

復制代碼 代碼如下:
local function er (_, i) error("invalid encoding at position " .. i) end

 

local decode_pattern = lpeg.Cs(utf8^0) * (-1 + lpeg.P(er))

 

現在,如果模式utf8^0  在字符串尾部之前停止,會調用一個適用的出錯函數。

UTF-8 和 Unicode

我們可以擴展以前的模式來處理所有的Unicdoe代碼片段,當然, 我們不能把它們翻譯阿拉伯數字1或其他任何一個字節編碼。相反,我們的翻譯序列結果中的數字表示的代碼片段。這里完整的代碼:
 

復制代碼 代碼如下:
-- decode a two-byte UTF-8 sequence
local function f2 (s)
  local c1, c2 = string.byte(s, 1, 2)
  return c1 * 64 + c2 - 12416
end
 
-- decode a three-byte UTF-8 sequence
local function f3 (s)
  local c1, c2, c3 = string.byte(s, 1, 3)
  return (c1 * 64 + c2) * 64 + c3 - 925824
end
 
-- decode a four-byte UTF-8 sequence
local function f4 (s)
  local c1, c2, c3, c4 = string.byte(s, 1, 4)
  return ((c1 * 64 + c2) * 64 + c3) * 64 + c4 - 63447168
end
 
local cont = lpeg.R("/128/191")   -- continuation byte
 
local utf8 = lpeg.R("/0/127") / string.byte
           + lpeg.R("/194/223") * cont / f2

 

 
-- decode a two-byte UTF-8 sequence
local function f2 (s)
  local c1, c2 = string.byte(s, 1, 2)
  return c1 * 64 + c2 - 12416
end
 
-- decode a three-byte UTF-8 sequence
local function f3 (s)
  local c1, c2, c3 = string.byte(s, 1, 3)
  return (c1 * 64 + c2) * 64 + c3 - 925824
end
 
-- decode a four-byte UTF-8 sequence
local function f4 (s)
  local c1, c2, c3, c4 = string.byte(s, 1, 4)
  return ((c1 * 64 + c2) * 64 + c3) * 64 + c4 - 63447168
end
 
local cont = lpeg.R("/128/191")   -- continuation byte
 
local utf8 = lpeg.R("/0/127") / string.byte
           + lpeg.R("/194/223") * cont / f2

 

Lua的長字符串

Lua中的長字符串由模式 [= *[ 開始,到第一次出現的帶有完全相同數量的等號的 ] =*] 結束。如果開括號后跟一個換行符,換行符將被丟棄(即,不會把它當作字符串的一部分)。

在Lua中想要匹配一個長字符串,模式必須捕捉第一次重復的等號,然后,只需找到有關閉字符串的候選項,檢查其是否具有相同數量的等號。

 

復制代碼 代碼如下:
equals = lpeg.P"="^0
open = "[" * lpeg.Cg(equals, "init") * "[" * lpeg.P"/n"^-1
close = "]" * lpeg.C(equals) * "]"
closeeq = lpeg.Cmt(close * lpeg.Cb("init"), function (s, i, a, b) return a == b end)
string = open * lpeg.C((lpeg.P(1) - closeeq)^0) * close / 1

 

open 模式匹配 [=*[,在一個名為 init 的組中捕獲重復的等號;它也會丟棄一個可選的換行符(如果它存在的話)。close 模式匹配 ]= *],也是捕捉重復的等號。closeeq模式首先匹配 close,然后它采用逆向捕捉來恢復先前由 open 捕捉并命名為 init 的內容,最后,用 match-time 捕捉來檢查兩個捕獲是否相同。字符串模式從 open 開始之后,它會一直包含到匹配了 closeeq 為止,然后匹配最終的 close。最后的數字捕獲簡單地丟棄由 close 產生的捕獲。

算術表達式

本例對簡單的算術表達式進行完整的解析和求值。而且我們用兩種風格來書寫。

第一種途徑首先建立一個語法樹,然后遍歷這棵樹來計算表達式的值:

 

復制代碼 代碼如下:
-- 詞典元素
[code]local Space = lpeg.S(" /n/t")^0
local Number = lpeg.C(lpeg.P"-"^-1 * lpeg.R("09")^1) * Space
local TermOp = lpeg.C(lpeg.S("+-")) * Space
local FactorOp = lpeg.C(lpeg.S("*/")) * Space
local Open = "(" * Space
local Close = ")" * Space

 

-- 語法
local Exp, Term, Factor = lpeg.V"Exp", lpeg.V"Term", lpeg.V"Factor"
G = lpeg.P{ Exp,
  Exp = lpeg.Ct(Term * (TermOp * Term)^0);
  Term = lpeg.Ct(Factor * (FactorOp * Factor)^0);
  Factor = Number + Open * Exp * Close;
}

G = Space * G * -1

-- 求值器
function eval (x)
  if type(x) == "string" then
    return tonumber(x)
  else
    local op1 = eval(x[1])
    for i = 2, #x, 2 do
      local op = x[i]
      local op2 = eval(x[i + 1])
      if (op == "+") then op1 = op1 + op2
      elseif (op == "-") then op1 = op1 - op2
      elseif (op == "*") then op1 = op1 * op2
      elseif (op == "/") then op1 = op1 / op2
      end
    end
    return op1
  end
end

-- 解析/求值
function evalExp (s)
  local t = lpeg.match(G, s)
  if not t then error("syntax error", 2) end
  return eval(t)
end

-- 使用例子
print(evalExp"3 + 5*9 / (1+1) - 12")   --> 13.5

 

第二種風格不用建立語法樹,直接求值。下面代碼就按此種途徑(假定和上面有相同的詞典元素):

 

復制代碼 代碼如下:
-- 輔助函數
function eval (v1, op, v2)
  if (op == "+") then return v1 + v2
  elseif (op == "-") then return v1 - v2
  elseif (op == "*") then return v1 * v2
  elseif (op == "/") then return v1 / v2
  end
end

 

-- 語法
local V = lpeg.V
G = lpeg.P{ "Exp",
  Exp = lpeg.Cf(V"Term" * lpeg.Cg(TermOp * V"Term")^0, eval);
  Term = lpeg.Cf(V"Factor" * lpeg.Cg(FactorOp * V"Factor")^0, eval);
  Factor = Number / tonumber + Open * V"Exp" * Close;
}

-- 使用例子
print(lpeg.match(G, "3 + 5*9 / (1+1) - 12"))   --> 13.5

 

注意 fold (收集器) 捕獲的用法。 要計算一個表達式的值,收集器從第一個術語的值開始,為每個副本應用進化收集器,操作符,和新術語。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产日产久久高清欧美一区| 欧美日韩国产丝袜美女| 亚洲qvod图片区电影| 久久久久久久久电影| 亚洲欧美激情一区| 日韩va亚洲va欧洲va国产| 九九精品视频在线| 8x拔播拔播x8国产精品| 午夜欧美不卡精品aaaaa| 国产精品久久久久久搜索| 在线精品国产成人综合| 欧美日本啪啪无遮挡网站| 91国产美女在线观看| 欧美夜福利tv在线| 伦伦影院午夜日韩欧美限制| 国产精品91久久久久久| 亚洲精品综合久久中文字幕| 免费91麻豆精品国产自产在线观看| 亚洲福利视频专区| 亚洲精品自在久久| 久久黄色av网站| 久久精品中文字幕免费mv| 全球成人中文在线| 日韩在线视频免费观看高清中文| 8050国产精品久久久久久| 亚洲天堂av在线播放| 国产美女高潮久久白浆| 国产精品99蜜臀久久不卡二区| 欧美激情精品久久久久久大尺度| 国产视频999| 欧美亚洲另类激情另类| 亚洲最大成人免费视频| 久久久久久久久中文字幕| 国产精品福利网站| 最新91在线视频| 欧美激情免费视频| 91美女片黄在线观| 久久伊人免费视频| 亚洲www永久成人夜色| 国产成人综合一区二区三区| 精品国产一区二区三区久久狼黑人| 亚洲国产古装精品网站| 久久久久久网址| 国产精品美女www| 国产91免费观看| 国产亚洲人成a一在线v站| 97不卡在线视频| 91夜夜未满十八勿入爽爽影院| 欧美激情一区二区三区高清视频| 亚洲最大福利视频| 亚洲www在线观看| 狠狠躁18三区二区一区| 国产精品视频资源| 国产精品精品视频| 精品国内亚洲在观看18黄| 日韩大片免费观看视频播放| 亚洲无限av看| 国产成人精品av在线| 欧美美女操人视频| 成人a级免费视频| 国产精品电影久久久久电影网| 91精品免费久久久久久久久| 在线亚洲男人天堂| 欧美成人亚洲成人日韩成人| 欧美黑人极品猛少妇色xxxxx| 在线日韩日本国产亚洲| 亚洲国产天堂久久国产91| 国产精品一区电影| 欧美一区二区三区艳史| 26uuu亚洲伊人春色| 韩剧1988免费观看全集| 中文字幕国产亚洲2019| 日韩成人激情在线| 久久久久久网址| 国产欧美日韩精品丝袜高跟鞋| 欧美一级大胆视频| 91精品国产自产91精品| 国产在线久久久| 欧美专区第一页| 欧美日韩亚洲天堂| 永久免费看mv网站入口亚洲| 久久久亚洲影院| 欧美日韩亚洲成人| 欧美乱妇高清无乱码| 欧美激情视频在线观看| 亚洲影院在线看| 日韩久久免费电影| 色综合91久久精品中文字幕| 一区二区欧美激情| 成人精品久久av网站| 国产精品午夜一区二区欲梦| www.欧美精品一二三区| 97人人爽人人喊人人模波多| 91日本在线观看| 国产精品一区二区久久久久| 欧美日韩成人网| 亚洲一区二区三区777| 亚洲人高潮女人毛茸茸| 亚洲欧美激情精品一区二区| 国产在线精品成人一区二区三区| 国产精品免费一区豆花| 国产精品久久中文| 精品少妇v888av| 亚洲精品小视频| 国产欧美日韩免费| 51ⅴ精品国产91久久久久久| 日韩免费高清在线观看| 91网在线免费观看| 国产婷婷97碰碰久久人人蜜臀| 久久天天躁狠狠躁老女人| 国内精品久久影院| 国产亚洲视频在线| 伊人久久男人天堂| 日韩经典中文字幕在线观看| 91九色视频导航| 久久天堂av综合合色| 丝袜亚洲欧美日韩综合| 日本成人在线视频网址| 亚洲www永久成人夜色| 亚洲成人动漫在线播放| 亚洲另类xxxx| 成人免费在线网址| 大伊人狠狠躁夜夜躁av一区| 国产精品最新在线观看| 亚洲第一视频网| 国产偷国产偷亚洲清高网站| 91豆花精品一区| 午夜精品一区二区三区在线播放| 久久99亚洲热视| 在线观看欧美日韩国产| 91精品久久久久久久久久入口| 国产日韩欧美夫妻视频在线观看| 夜色77av精品影院| 国产日韩欧美成人| 26uuu日韩精品一区二区| 中文日韩在线视频| 成人国产精品免费视频| 亚洲精品不卡在线| 中文字幕久久久| 一级做a爰片久久毛片美女图片| 日本亚洲欧洲色| 久久国产一区二区三区| 91精品国产自产在线老师啪| 日韩一区在线视频| 欧美日韩色婷婷| 国产精品r级在线| 久久影视电视剧免费网站| 中文字幕欧美专区| 日韩一二三在线视频播| 国产aⅴ夜夜欢一区二区三区| 亚洲bt欧美bt日本bt| 亚洲日本中文字幕免费在线不卡| 欧美国产激情18| 国产精品成人播放| 精品国产一区二区三区四区在线观看| 91精品国产九九九久久久亚洲| 国产一区二区三区欧美| 黑人巨大精品欧美一区二区一视频| 国产日韩中文在线| 91国内揄拍国内精品对白| 久久男人av资源网站| 伊人亚洲福利一区二区三区| 亚洲精品国产精品自产a区红杏吧| 日韩电影第一页|