особый персонаж
Специальный символ есть (в типографии / typometry и обработки цифровых данных ) а символ , который не является ни буквы , ни числа .
К специальным символам относятся знаки препинания ( знаки препинания , словесные знаки ), а также научные и технические символы. Также специальные символы - это диакритические знаки. Б. острый или бревный (é, ă).
Разные значения и меняющиеся значения
К специальным символам также относятся непечатаемые символы, которые помогают ориентироваться при разработке печатного шаблона, например, пробелы , а иногда и нет.
Несколько неясно, действительно ли z. B. Умляуты - специальные символы, согласно данному определению, это связано с вопросом о том, является ли, например, «Ä» независимой буквой, которую нужно отличать от «A», см. Немецкий алфавит # Спорное количество букв . В Швеции , финский и эстонский, однако, Ä это отдельное письмо. В некоторых случаях в специальные символы также включаются цифры .
Греческие буквы могут быть символами, если они используются не для образования греческих слов, а как переменные (например, в статистике σ для стандартного отклонения ) или константы (например, для числа π).
«Ввод специальных символов» часто используется для описания методов ввода (на компьютерных клавиатурах ) (на веб-сайтах с заголовком «Специальные символы» см. # Веб-ссылки и метод ввода # Веб-ссылки ), при этом ввод всех символов обрабатывается без кода ASCII , в том числе буквы - немецкие языки. Датская строчная буква ø часто упоминается в явном виде в качестве примера.
Специальные символы и технологии
На заре информационных технологий ограничение наборов символов 7 или 8 битами было связано с техническими причинами. Чтобы избежать многих связанных с этим проблем - например, когда был введен символ евро, из ISO 8859-15 пришлось удалить еще один символ , 8-битное расширение ASCII - сегодня все чаще используется большее количество бит на символ. .
Однако нет четкой связи между термином специальные символы и достижениями в технологии кодирования. Из 94 печатаемых символов ASCII 32 являются специальными символами, то есть ровно одна треть. Среди них уже доступны символы для более простых математических утверждений, а что касается знаков препинания, Unicode (см. Ниже) имеет только типографские варианты горизонтальной линии ( четверть квадрата , полуквадрат , квадрат , знак минус ), кавычки и Добавлены в эллипсы (которые ранее были доступны с TeX из 7-битовых наборов символов). Терминология неясна в отношении вопроса о том, являются ли большинство вновь закодированных символов по сравнению с ASCII специальными символами (например, умляуты, см. Выше).
Использование специальных символов ASCII не требует какой-либо специальной технологии по сравнению с буквами и цифрами ASCII. Большинство (или многие) специальных символов ASCII (знаки препинания, математические символы) могут быть встроены в исходный код цифровых текстов так же легко, как буквы и цифры. Однако при использовании различных технологий ( имена файлов , программирование, кодирование URL-адресов и т. Д.) Некоторые специальные символы ASCII имеют особую синтаксическую функцию (например, называемые «зарезервированные символы»), что несколько затрудняет их отображение . Для этих целей используются специальные символы ASCII , чтобы сделать ввод текста как можно более трудным для пользователей.
Еще одно соображение - раскладка клавиатуры . Еще во времена пишущей машинки немецкая и американская клавиатуры отличались главным образом расположением и наличием специальных символов. С помощью ярлыков количество вставляемых непосредственно в исходный символ расширяется до компьютерных клавиатур в основных операционных системах. Это вопрос терминологии, все ли дополнительные символы, доступные таким образом, являются специальными символами .
Независимо от концепции специальных символов, следует отметить, что некоторые технологии изначально были разработаны только для символов ASCII, хотя и в большей степени для программистов, чем для пользователей.
В 80-значном коде перфокарты IBM цифры, буквы и цифры были представлены по-разному.
Юникод
В современных системах даже очень удаленные специальные символы можно использовать без особых усилий. Разработаны различные методы (по необходимости).
Юникод считается наиболее современной и универсальной формой реализации. Каждый символ в этом мире, будь то символ повторного использования или китайский символ , имеет место в таблицах Unicode и отображается на компьютере как область памяти, содержащая один или несколько байтов. У каждого символа Юникода есть свой номер. Таблицы символов включают, например:
- U + 0935 для персонажа व.
HTML
Сущности персонажей
Сущности символов позволяют представлять тысячи различных символов с помощью файлов HTML, закодированных в ASCII. В любом случае могут отображаться варианты букв, символы и знаки препинания, для которых 7 бит недостаточно. - В более общем плане эта тема рассматривается в статье « Сущности на языках разметки» .
Числовые символы
В HTML вы можете передать символ с Unicode позиции NUM
через код ( написанный в десятичной системе ) в окне браузера, в качестве альтернативы через , если шестнадцатеричной нотации для , например , или для математического «меньше , чем» символ «<», который имеет позиция 60 в ASCII, как в Unicode. В этом случае говорят о числовых символьных объектах . Вы начинаете с ( символ амперсанда , за которым следует решетка ) и заканчиваете ( точкой с запятой ). Таким образом могут быть представлены как символы ASCII, так и практически все символы, которые можно назвать «специальными символами».
&#NUM;
NUM
&#xHNUM;
HNUM
NUM
<
<
&#
;
Именованные символьные сущности и символы "собственного HTML"
Именованные сущности символов, чьи «имена» легко запомнить, были введены для отдельных символов, которые используются особенно часто . Например, символ «меньше чем» также может быть <
представлен, «имя» lt
является сокращением для «меньше чем». Код снова начинается с &
и заканчивается на ;
, но знак фунта отсутствует.
Сказанное выше в основном касается символов, не кодированных в ASCII . Из 32 специальных символов ASCII только три нужно обрабатывать следующим образом:
- знак "меньше" - см. выше
- знак «больше» - аналог предыдущего, HTML «теги» сформированы ( ) - может быть представлен
<ELTNAME ATTR>TEXT</ELTNAME>
>
- то,
&
что одна сущность представляет себя - представленная&
.
Эти символы называются «специфичными для HTML» символами; их также можно назвать «зарезервированными символами» (как в кодировке URL ).
В связи со значениями атрибутов также может быть полезно заменить "
(«временная двойная кавычка») на "
и '
(«временная одинарная кавычка») на '
(«апостроф»). Однако, если требуется качественная типографика, этих мер недостаточно.
В любом случае именованные символьные сущности упрощают создание файлов HTML с помощью текстового редактора. Показанные таким образом символы включают варианты букв (с диакритическими знаками), математические символы (которые также могут быть стрелками и греческими буквами) и типографские варианты знаков препинания (→ знаки препинания ). В 1995 г. в ISO 8859-1 были введены «имена» для символов, выходящих за рамки ASCII , а в 1999 г. - для отдельных символов Unicode , см. Именованные сущности символов в статье « Сущности на языках разметки» .
Спецификация кодировки исходного кода
Кроме того, средства просмотра HTML (браузеры) могут быть проинструктированы преобразовывать текст, который не закодирован в ASCII, как предполагалось, путем явного указания кодировки исходного текста в заголовке файла:
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
В качестве альтернативы ISO-8859UTF-8
также могут быть указаны варианты. В обоих случаях ссылки характера сущности не нужны, просто , , (и / ) , чтобы искать.
&
<
>
"
'
Оба метода - с использованием сущностей и указанием кодировки символов - могут использоваться одновременно без каких-либо проблем.
Что лучше?
В статье « Сущности на языках разметки» обсуждаются две возможности, представленные не-ASCII-символами (будь то буквы, цифры или специальные символы) в разделах « Будущее символьных сущностей» и « Аннотации» . (По состоянию на середину февраля 2016 г.)
Латекс
LaTeX популярен для создания научных документов , первоначально разработанных компьютерными учеными Дональдом Э. Кнутом ( TeX ) - для Американского математического общества - и Лесли Лэмпортом (LaTeX).
Специальные символы без кода ASCII
Кодировка символов
Как и в случае с HTML, вы можете указать кодировку символов исходного текста, чтобы включить умляуты и диакритические знаки непосредственно в исходный код документа, здесь с помощью строки преамбулы.
\usepackage[utf8]{inputenc}
в качестве альтернативы, latin1
а не utf8
при работе со старыми исходными файлами в кодировке ISO 8859-1 . Без пакета inputenc файлы с расширениями ASCII не могут быть обработаны (по умолчанию LaTeX обрабатывает исходные файлы в кодировке ASCII) - по крайней мере, с исходным механизмом TeX Кнута или с pdfTeX ( ). XeTeX ( ) и LuaTeX интерпретируют исходные файлы в их настройках по умолчанию как закодированные в UTF-8 . В UTF-8 (т.е. Unicode), в принципе, любые символы, требуемые в различных предметных областях , например, в математике (для которой он был первоначально создан), образуют особенно большую долю «специальных символов» (не кодируемых одним ASCII), можно напрямую вставить как отдельный символ в исходный код документа LaTeX. Также доступны типографские варианты, закодированные с помощью знаков препинания ASCII (в 8-битном формате только нестандартные типографские тире, специфичные для производителя, Windows-1252 ).
pdflatex
xelatex
Кодирование с использованием комбинаций ASCII
Типографское качество всегда было возможным с LaTeX без расширения кодировки символов. Половина - четверть прочерк ( тир ) получаются с кодом ASCII --
, то тир (английский тир) с и типографским удовлетворительным упущение с точкой . Символ, первоначально предназначенный для использования в качестве акцента Grave, показан в виде одинарной кавычки в левом верхнем углу; для двойных кавычек одинарные кавычки удваиваются. Варианты букв с комбинированными символами изначально представлялись сдвигающимися буквами и диакритическими глифами, предоставляемыми отдельно в наборах символов ; последние появляются в коде (вне формул) как комбинация начальной обратной косой черты (в шестнадцатеричном коде ASCII 5C) и другого символа, так что , например, «Ä» генерируется. С дополнительным пакетом макросов для немецкого языка вы можете печатать более коротким и разборчивым образом , что означает, что точки размещаются типографически немного ниже, чем на английском языке. Именно такие варианты букв могут быть легко вставлены в файл исходного кода с помощью клавиатуры, разработанной для латинских алфавитов , так что эти комбинированные команды, возможно, устарели из-за расширений ASCII; С другой стороны, при совместном написании текстов необходимо обмениваться файлами исходного кода, а исходные файлы отправляются в англоязычные журналы или издатели, хотя файлы, закодированные в ASCII, ISO 8859-1 и UTF-8, все еще могут "смешиваться". "в таких случаях рекомендуется продолжить использование комбинированных команд.
---
\dots
\
\"{A}
"A
LaTeX также автоматически использует лигатуры , которые, однако, часто неуместны в немецких текстах и поэтому должны быть специально подавлены.
Кроме того, наборы LaTeX символов в общей сложности тысяч предметно-специфических символов из Всеобъемлющего TeX Archive Network или TeX распределений доступны, в сочетании с макро - пакеты , которые предлагают комбинацию начинающегося с обратной косой черты и ASCII буквы как команды для каждого символа ( → # Веб-ссылки ). Таким образом, эти символы занимают место в наборе символов, управляемом одним создателем (или небольшой командой), а не (обязательно) в системе, управляемой органом по стандартизации. Для некоторых отдельных кодовых точек Unicode несколько пакетов TeX или LaTeX предлагают разные стили шрифтов (например, для символа евро € ). Подобно «именованным объектам» в HTML, последовательности букв выбираются в соответствии с мнемоническими критериями. Б. \cup
Что ∪
касается символа объединенного множества .
В качестве преимущества ввода символов ASCII по сравнению с прямой вставкой символов Юникода с помощью сочетаний клавиш или из таблицы символов или панели инструментов иногда указывается, что автор может в значительной степени сосредоточиться на содержании текста, в то время как его пальцы в значительной степени в непрерывном потоке, как при игре на фортепиано блуждание по клавиатуре без сознательного контроля в системе с 10 пальцами . Для часто требуемых команд вы можете (в отличие от HTML с его жестко предписанным синтаксисом - с помощью \newcommand
или \renewcommand
) ввести более короткую команду «Псевдоним».
Специальные символы ASCII
Чтобы упростить набор текста и улучшить читаемость кода, 10 специальных символов ASCII - \{}$&#^_~%
«незаконно присвоенные» / «зарезервированные» ( функциональные символы ), например Б. для (результат «м²»), что вы вводите в HTML или для . Чтобы отобразить их с помощью ASCII, как они были изначально , вы можете « замаскировать » их обратной косой чертой, за исключением и (которые могут быть созданы с помощью более длинных команд в зависимости от контекста) , например, вы вводите символ доллара $ .
m$^2$
m²
m<sup>2</sup>
\
~
\$
В LaTeX некоторые команды ищут следующие левые квадратные скобки [
или звездочку *
. В особых случаях это вызывает трудности, например, если вы хотите начать новую строку с квадратных скобок. Вместо того, чтобы \\[
печатать лучше .
\\{}[
Punycode
Чтобы иметь возможность представлять умляуты и другие специальные символы в доменных именах , была разработана процедура Punycode , которая вместе с Nameprep приводит к стандарту для интернационализированных доменных имен (IDN). Символы, отличные от ASCII, заменяются дефисами, а их представление добавляется в конец слова.
Смотри тоже
литература
- Йоханнес Бергерхаузен, Сири Поаранган: decodeunicode: персонажи мира Герман Шмидт, Майнц, 2011, ISBN 978-3874398138 . Со всеми специальными символами всех систем письма
- Гельмут Хиллер, Стефан Фюссель : Словарь кн. Издание 7-е, коренным образом переработанное. Витторио Клостерманн, Франкфурт-на-Майне 2006, ISBN 3-465-03495-3
- Урсула Раутенберг (Hrsg.): Reclams Sachlexikon des Buches. 2-е улучшенное издание. Филипп Реклам июнь, Штутгарт 2003, ISBN 3-15-010542-0
- Консорциум Unicode: стандарт Unicode, версия 6.0.0 . Консорциум Unicode, Маунтин-Вью, Калифорния, 2011, ISBN 978-1-936213-01-6
веб ссылки
HTML и Юникод
- Дополнительный пакет макросов на немецком языке
- Пакет inputenc
- Справка: ссылка на специальный символ из немецкоязычной Википедии
- ZEICHEN.TV - Специальные символы в HTML и Unicode с функцией поиска
- Сущности ASCII, DOS-Latin-1, Windows-1252 и HTML от Торстена Хорна
Латекс
- Скотт Пакин: Полный список символов LaTeX. (PDF; 8,6 МБ) В: Комплексная сеть архивов TeX . 12 ноября 2015 г., по состоянию на 4 февраля 2016 г. (иллюстрация 14030 с доступными символами LaTeX на 331 странице, оглавлением и указателем, помогающими при поиске).
- Detexify - веб-приложение, которое дает имя макроса рисунку символа, которым он представлен в LaTeX
Индивидуальные доказательства
- ↑ Вольфганг Байнерт : специальные персонажи. В кн . : Типолексикон . 22 августа 2006, доступ к 7 февраля 2016 .
- ↑ специальные символы. В: Дуден онлайн . Проверено 7 февраля, 2016 .
- ↑ а б Йо Аппель, Манфред Лойбнер, Вольфганг Манекеллер, Уте Миелов, Хельга Рюлинг, Аннелоре Шлиц, Аннемари Вейгхардт: Gabler Büro Lexikon . Springer-Verlag, 2013, с. 259 ф . ( [Стр. 259] - «Помимо букв и цифр существуют различные другие символы; [Стр. 260] эти так называемые S. включают, например, символы арифметических операций (+ - /) и коммерческие символы (& %). ").
- ↑ а б в Лутц Дж. Генрих, Армин Хайнцль, Фридрих Ройтмайр: Wirtschaftsinformatik-Lexikon . Вальтер де Грюйтер, 2004, стр. 612 ( ограниченный предварительный просмотр в Поиске книг Google [доступ 7 февраля 2016 г.] «Символ, который не является ни буквой, ни числом, ни пробелом. Например, e для S. - это символы для арифметических операций, знаки препинания, символы сокращений, управляющие символы. ").
- ^ A b c Детлеф Юрген Браунер, Роберт Райбл-Бесте, Мартин М. Вейгерт: Мультимедиа-Lexikon . Вальтер де Грюйтер, 1998, стр. 319 ( ограниченный предварительный просмотр в Поиске книг Google [доступ 7 февраля 2016 г.] «все символы, кроме букв алфавита, т. Е. Цифр, знаков препинания, лигатур, диакритических знаков и т. Д.»).
- ↑ а б Урсула Раутенберг, Дирк Ветцель: кн . Вальтер де Грюйтер, 2001, стр. 22 ( ограниченный предварительный просмотр в Поиске книг Google [доступ 7 февраля 2016 г.] «От этих букв с изображениями отличается непечатный фиктивный материал (пиктограммы как типографские« нулевые символы »), с которыми, например, слово и межстрочный интервал ").
- ↑ горячая клавиша. В: Дуден онлайн . Проверено 7 февраля, 2016 .
- ↑ «Справка: HTML / справочник символов». В: SELFHTML . Проверено 7 мая 2021 года .