Кириллица и глаголица в Unicode

В славянских алфавитах кириллица и глаголица будут разделены на пять блоков в Unicode , то первые два из которых содержат символы , необходимые для написания славянских и неславянских языков ( в том числе некоторых исторических персонажей) , а остальные три блока символов для воспроизведение исторических кириллических или глаголических текстов.

Для сравнения Unicode и наиболее распространенных 8-битных кодировок см. Кодировку символов кириллического алфавита # .

Закодированные символы

Основным блоком для кириллицы является блок Unicode для кириллицы , и его можно разделить на несколько частей: Первая часть соответствует кодировке ISO 8859-5 и, таким образом, содержит символы, необходимые для написания славянских языков. Далее следуют буквы тюркских языков , затем абхазского .

Другие блоки содержат редкие или исторические символы: приложение кириллицы кодирует знак коми из ISO 10754 и курдские буквы , два блока кириллица расширенная-A и кириллица расширенная-B были, в основном, буквы в старославянском языке .

Буквы для глаголицы закодированы в блоке Unicode Glagolitic , не делается различий между круглой и угловатой формами букв.

зыбь

  • Джули Д. Аллен и др.: Стандарт Юникода. Версия 6.2 - Базовая спецификация. Консорциум Unicode, Маунтин-Вью, Калифорния, 2012. ISBN 978-1-936213-07-8 . Глава 7.4: Кириллица, Глава 7.5: Глаголица. ( онлайн , PDF)