Модуль:Character code

Материал из Тептар — свободной энциклопедии
Версия от 17:57, 12 февраля 2022; Adam (обсуждение | вклад) (Новая страница: «local getArgs = require('Module:Arguments').getArgs local p = {} function p.main(frame) local args = getArgs(frame) return p._main(args) end function p._main(args) local char = args[1] local encoding = args[2] or 'unicode' local representation = args[3] or 'decimal' local code = {} for codepoint in mw.ustring.gcodepoint(char) do table.insert(code, codepoint) end local s = '' if representation == 'decimal' then if encoding == 'unicode' the...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Выдаёт для символа (или их последовательности) их коды в различных записях.

В настоящий момент модулю, помимо строки, можно передать способ кодирования (сейчас — unicode / numeric character reference; по умолчанию — unicode) и репрезентацию (decimal / hex; по умолчанию — decimal).

  • {{#invoke:Character code|main|β|unicode|decimal}} → 946
  • {{#invoke:Character code|main|β|unicode|hex}} → U+3B2
  • {{#invoke:Character code|main|β|numeric character reference|decimal}} → β
  • {{#invoke:Character code|main|β|numeric character reference|hex}} → β

  • {{#invoke:Character code|main|ⱱ̟|unicode|decimal}} → 11377 799
  • {{#invoke:Character code|main|ⱱ̟|unicode|hex}} → U+2C71 U+31F
  • {{#invoke:Character code|main|ⱱ̟|numeric character reference|decimal}} → ⱱ̟
  • {{#invoke:Character code|main|ⱱ̟|numeric character reference|hex}} → ⱱ̟

  • {{#invoke:Character code|main|ʎ̥˔|unicode|decimal}} → 654 805 724
  • {{#invoke:Character code|main|ʎ̥˔|unicode|hex}} → U+28E U+325 U+2D4
  • {{#invoke:Character code|main|ʎ̥˔|numeric character reference|decimal}} → ʎ̥˔
  • {{#invoke:Character code|main|ʎ̥˔|numeric character reference|hex}} → ʎ̥˔

local getArgs = require('Module:Arguments').getArgs
local p = {}

function p.main(frame)
	local args = getArgs(frame)
	return p._main(args)
end

function p._main(args)
	local char = args[1]
	local encoding = args[2] or 'unicode'
	local representation = args[3] or 'decimal'
	
	local code = {}
	for codepoint in mw.ustring.gcodepoint(char) do
		table.insert(code, codepoint)
	end
	
	local s = ''
	if representation == 'decimal' then
		if encoding == 'unicode' then
			s = table.concat(code, ' ')
		elseif encoding == 'numeric character reference' then
			for i, v in ipairs(code) do
				s = s .. '&#' .. v .. ';'
			end
		end
	elseif representation == 'hex' then
		for i, v in ipairs(code) do
			if encoding == 'unicode' then
				s = s .. 'U+' .. string.format('%X', v) .. ' '
			elseif encoding == 'numeric character reference' then
				s = s .. '&#x' .. string.format('%X', v) .. ';'
			end
		end
	end
	
	return mw.text.trim(s)
end

return p