Модуль:Character code

Выдаёт для символа (или их последовательности) их коды в различных записях.

В настоящий момент модулю, помимо строки, можно передать способ кодирования (сейчас — unicode / numeric character reference; по умолчанию — unicode) и репрезентацию (decimal / hex; по умолчанию — decimal).

  • {{#invoke:Character code|main|β|unicode|decimal}} → 946
  • {{#invoke:Character code|main|β|unicode|hex}} → U+3B2
  • {{#invoke:Character code|main|β|numeric character reference|decimal}} → β
  • {{#invoke:Character code|main|β|numeric character reference|hex}} → β

  • {{#invoke:Character code|main|ⱱ̟|unicode|decimal}} → 11377 799
  • {{#invoke:Character code|main|ⱱ̟|unicode|hex}} → U+2C71 U+31F
  • {{#invoke:Character code|main|ⱱ̟|numeric character reference|decimal}} → ⱱ̟
  • {{#invoke:Character code|main|ⱱ̟|numeric character reference|hex}} → ⱱ̟

  • {{#invoke:Character code|main|ʎ̥˔|unicode|decimal}} → 654 805 724
  • {{#invoke:Character code|main|ʎ̥˔|unicode|hex}} → U+28E U+325 U+2D4
  • {{#invoke:Character code|main|ʎ̥˔|numeric character reference|decimal}} → ʎ̥˔
  • {{#invoke:Character code|main|ʎ̥˔|numeric character reference|hex}} → ʎ̥˔

local getArgs = require('Module:Arguments').getArgs
local p = {}

function p.main(frame)
	local args = getArgs(frame)
	return p._main(args)
end

function p._main(args)
	local char = args[1]
	local encoding = args[2] or 'unicode'
	local representation = args[3] or 'decimal'
	
	local code = {}
	for codepoint in mw.ustring.gcodepoint(char) do
		table.insert(code, codepoint)
	end
	
	local s = ''
	if representation == 'decimal' then
		if encoding == 'unicode' then
			s = table.concat(code, ' ')
		elseif encoding == 'numeric character reference' then
			for i, v in ipairs(code) do
				s = s .. '&#' .. v .. ';'
			end
		end
	elseif representation == 'hex' then
		for i, v in ipairs(code) do
			if encoding == 'unicode' then
				s = s .. 'U+' .. string.format('%X', v) .. ' '
			elseif encoding == 'numeric character reference' then
				s = s .. '&#x' .. string.format('%X', v) .. ';'
			end
		end
	end
	
	return mw.text.trim(s)
end

return p