mirror of
https://github.com/bjc/prosody.git
synced 2025-04-03 21:27:38 +03:00
fallbacks/lxp.lua: Pure Lua pseudo-XML parser. Implements the same API as LuaExpat.
This commit is contained in:
parent
b577225611
commit
cbc6221771
1 changed files with 149 additions and 0 deletions
149
fallbacks/lxp.lua
Normal file
149
fallbacks/lxp.lua
Normal file
|
@ -0,0 +1,149 @@
|
|||
|
||||
local coroutine = coroutine;
|
||||
local tonumber = tonumber;
|
||||
local string = string;
|
||||
local setmetatable, getmetatable = setmetatable, getmetatable;
|
||||
local pairs = pairs;
|
||||
|
||||
local deadroutine = coroutine.create(function() end);
|
||||
coroutine.resume(deadroutine);
|
||||
|
||||
module("lxp")
|
||||
|
||||
local entity_map = setmetatable({
|
||||
["amp"] = "&";
|
||||
["gt"] = ">";
|
||||
["lt"] = "<";
|
||||
["apos"] = "'";
|
||||
["quot"] = "\"";
|
||||
}, {__index = function(_, s)
|
||||
if s:sub(1,1) == "#" then
|
||||
if s:sub(2,2) == "x" then
|
||||
return string.char(tonumber(s:sub(3), 16));
|
||||
else
|
||||
return string.char(tonumber(s:sub(2)));
|
||||
end
|
||||
end
|
||||
end
|
||||
});
|
||||
local function xml_unescape(str)
|
||||
return (str:gsub("&(.-);", entity_map));
|
||||
end
|
||||
local function parse_tag(s)
|
||||
local name,sattr=(s):gmatch("([^%s]+)(.*)")();
|
||||
local attr = {};
|
||||
for a,b in (sattr):gmatch("([^=%s]+)=['\"]([^'\"]*)['\"]") do attr[a] = xml_unescape(b); end
|
||||
return name, attr;
|
||||
end
|
||||
|
||||
local function parser(data, handlers, ns_separator)
|
||||
local function read_until(str)
|
||||
local pos = data:find(str, nil, true);
|
||||
while not pos do
|
||||
data = data..coroutine.yield();
|
||||
pos = data:find(str, nil, true);
|
||||
end
|
||||
local r = data:sub(1, pos);
|
||||
data = data:sub(pos+1);
|
||||
return r;
|
||||
end
|
||||
local function read_before(str)
|
||||
local pos = data:find(str, nil, true);
|
||||
while not pos do
|
||||
data = data..coroutine.yield();
|
||||
pos = data:find(str, nil, true);
|
||||
end
|
||||
local r = data:sub(1, pos-1);
|
||||
data = data:sub(pos);
|
||||
return r;
|
||||
end
|
||||
local function peek()
|
||||
while #data == 0 do data = coroutine.yield(); end
|
||||
return data:sub(1,1);
|
||||
end
|
||||
|
||||
local ns = { xml = "http://www.w3.org/XML/1998/namespace" };
|
||||
ns.__index = ns;
|
||||
local function apply_ns(name, dodefault)
|
||||
local prefix,n = name:match("^([^:]*):(.*)$");
|
||||
if prefix and ns[prefix] then
|
||||
return ns[prefix]..ns_separator..n;
|
||||
end
|
||||
if dodefault and ns[""] then
|
||||
return ns[""]..ns_separator..name;
|
||||
end
|
||||
return name;
|
||||
end
|
||||
local function push(tag, attr)
|
||||
ns = setmetatable({}, ns);
|
||||
for k,v in pairs(attr) do
|
||||
local xmlns = k == "xmlns" and "" or k:match("^xmlns:(.*)$");
|
||||
if xmlns then
|
||||
ns[xmlns] = v;
|
||||
attr[k] = nil;
|
||||
end
|
||||
end
|
||||
local newattr, n = {}, 0;
|
||||
for k,v in pairs(attr) do
|
||||
n = n+1;
|
||||
k = apply_ns(k);
|
||||
newattr[n] = k;
|
||||
newattr[k] = v;
|
||||
end
|
||||
tag = apply_ns(tag, true);
|
||||
ns[0] = tag;
|
||||
ns.__index = ns;
|
||||
return tag, newattr;
|
||||
end
|
||||
local function pop()
|
||||
local tag = ns[0];
|
||||
ns = getmetatable(ns);
|
||||
return tag;
|
||||
end
|
||||
|
||||
while true do
|
||||
if peek() == "<" then
|
||||
local elem = read_until(">"):sub(2,-2);
|
||||
if elem:sub(1,1) == "!" or elem:sub(1,1) == "?" then -- neglect comments and processing-instructions
|
||||
elseif elem:sub(1,1) == "/" then -- end tag
|
||||
elem = elem:sub(2);
|
||||
local name = pop();
|
||||
handlers:EndElement(name); -- TODO check for start-end tag name match
|
||||
elseif elem:sub(-1,-1) == "/" then -- empty tag
|
||||
elem = elem:sub(1,-2);
|
||||
local name,attr = parse_tag(elem);
|
||||
name,attr = push(name,attr);
|
||||
handlers:StartElement(name,attr);
|
||||
name = pop();
|
||||
handlers:EndElement(name);
|
||||
else -- start tag
|
||||
local name,attr = parse_tag(elem);
|
||||
name,attr = push(name,attr);
|
||||
handlers:StartElement(name,attr);
|
||||
end
|
||||
else
|
||||
local text = read_before("<");
|
||||
handlers:CharacterData(xml_unescape(text));
|
||||
end
|
||||
end
|
||||
end
|
||||
|
||||
function new(handlers, ns_separator)
|
||||
local co = coroutine.create(parser);
|
||||
return {
|
||||
parse = function(self, data)
|
||||
if not data then
|
||||
co = deadroutine;
|
||||
return true; -- eof
|
||||
end
|
||||
local success, result = coroutine.resume(co, data, handlers, ns_separator);
|
||||
if result then
|
||||
co = deadroutine;
|
||||
return nil, result; -- error
|
||||
end
|
||||
return true; -- success
|
||||
end;
|
||||
};
|
||||
end
|
||||
|
||||
return _M;
|
Loading…
Add table
Add a link
Reference in a new issue