особый персонаж

Специальный символ есть (в типографии / typometry и обработки цифровых данных ) а символ , который не является ни буквы , ни числа .

К специальным символам относятся знаки препинания ( знаки препинания , словесные знаки ), а также научные и технические символы. Также специальные символы - это диакритические знаки. Б. острый или бревный (é, ă).

Разные значения и меняющиеся значения

К специальным символам также относятся непечатаемые символы, которые помогают ориентироваться при разработке печатного шаблона, например, пробелы , а иногда и нет.

Несколько неясно, действительно ли z. B. Умляуты - специальные символы, согласно данному определению, это связано с вопросом о том, является ли, например, «Ä» независимой буквой, которую нужно отличать от «A», см. Немецкий алфавит # Спорное количество букв . В Швеции , финский и эстонский, однако, Ä это отдельное письмо. В некоторых случаях в специальные символы также включаются цифры .

Греческие буквы могут быть символами, если они используются не для образования греческих слов, а как переменные (например, в статистике σ для стандартного отклонения ) или константы (например, для числа π).

«Ввод специальных символов» часто используется для описания методов ввода (на компьютерных клавиатурах ) (на веб-сайтах с заголовком «Специальные символы» см. # Веб-ссылки и метод ввода # Веб-ссылки ), при этом ввод всех символов обрабатывается без кода ASCII , в том числе буквы - немецкие языки. Датская строчная буква ø часто упоминается в явном виде в качестве примера.

Специальные символы и технологии

На заре информационных технологий ограничение наборов символов 7 или 8 битами было связано с техническими причинами. Чтобы избежать многих связанных с этим проблем - например, когда был введен символ евро, из ISO 8859-15 пришлось удалить еще один символ , 8-битное расширение ASCII - сегодня все чаще используется большее количество бит на символ. .

Однако нет четкой связи между термином специальные символы и достижениями в технологии кодирования. Из 94 печатаемых символов ASCII 32 являются специальными символами, то есть ровно одна треть. Среди них уже доступны символы для более простых математических утверждений, а что касается знаков препинания, Unicode (см. Ниже) имеет только типографские варианты горизонтальной линии ( четверть квадрата , полуквадрат , квадрат , знак минус ), кавычки и Добавлены в эллипсы (которые ранее были доступны с TeX из 7-битовых наборов символов). Терминология неясна в отношении вопроса о том, являются ли большинство вновь закодированных символов по сравнению с ASCII специальными символами (например, умляуты, см. Выше).

Использование специальных символов ASCII не требует какой-либо специальной технологии по сравнению с буквами и цифрами ASCII. Большинство (или многие) специальных символов ASCII (знаки препинания, математические символы) могут быть встроены в исходный код цифровых текстов так же легко, как буквы и цифры. Однако при использовании различных технологий ( имена файлов , программирование, кодирование URL-адресов и т. Д.) Некоторые специальные символы ASCII имеют особую синтаксическую функцию (например, называемые «зарезервированные символы»), что несколько затрудняет их отображение . Для этих целей используются специальные символы ASCII , чтобы сделать ввод текста как можно более трудным для пользователей.

Еще одно соображение - раскладка клавиатуры . Еще во времена пишущей машинки немецкая и американская клавиатуры отличались главным образом расположением и наличием специальных символов. С помощью ярлыков количество вставляемых непосредственно в исходный символ расширяется до компьютерных клавиатур в основных операционных системах. Это вопрос терминологии, все ли дополнительные символы, доступные таким образом, являются специальными символами .

Независимо от концепции специальных символов, следует отметить, что некоторые технологии изначально были разработаны только для символов ASCII, хотя и в большей степени для программистов, чем для пользователей.

В 80-значном коде перфокарты IBM цифры, буквы и цифры были представлены по-разному.

Юникод

В современных системах даже очень удаленные специальные символы можно использовать без особых усилий. Разработаны различные методы (по необходимости).

Юникод считается наиболее современной и универсальной формой реализации. Каждый символ в этом мире, будь то символ повторного использования или китайский символ , имеет место в таблицах Unicode и отображается на компьютере как область памяти, содержащая один или несколько байтов. У каждого символа Юникода есть свой номер. Таблицы символов включают, например:

  • U + 0935 для персонажа व.

HTML

Сущности персонажей

Сущности символов позволяют представлять тысячи различных символов с помощью файлов HTML, закодированных в ASCII. В любом случае могут отображаться варианты букв, символы и знаки препинания, для которых 7 бит недостаточно. - В более общем плане эта тема рассматривается в статье « Сущности на языках разметки» .

Числовые символы

В HTML вы можете передать символ с Unicode позиции NUMчерез код ( написанный в десятичной системе ) в окне браузера, в качестве альтернативы через , если шестнадцатеричной нотации для , например , или для математического «меньше , чем» символ «<», который имеет позиция 60 в ASCII, как в Unicode. В этом случае говорят о числовых символьных объектах . Вы начинаете с ( символ амперсанда , за которым следует решетка ) и заканчиваете ( точкой с запятой ). Таким образом могут быть представлены как символы ASCII, так и практически все символы, которые можно назвать «специальными символами». &#NUM;NUM &#xHNUM;HNUMNUM&#60;&#x3C; &#;

Именованные символьные сущности и символы "собственного HTML"

Именованные сущности символов, чьи «имена» легко запомнить, были введены для отдельных символов, которые используются особенно часто . Например, символ «меньше чем» также может быть &lt;представлен, «имя» ltявляется сокращением для «меньше чем». Код снова начинается с &и заканчивается на ;, но знак фунта отсутствует.

Сказанное выше в основном касается символов, не кодированных в ASCII . Из 32 специальных символов ASCII только три нужно обрабатывать следующим образом:

  • знак "меньше" - см. выше
  • знак «больше» - аналог предыдущего, HTML «теги» сформированы ( ) - может быть представлен<ELTNAME ATTR>TEXT</ELTNAME>&gt;
  • то, &что одна сущность представляет себя - представленная &amp;.

Эти символы называются «специфичными для HTML» символами; их также можно назвать «зарезервированными символами» (как в кодировке URL ).

В связи со значениями атрибутов также может быть полезно заменить "(«временная двойная кавычка») на &quot;и '(«временная одинарная кавычка») на &apos;(«апостроф»). Однако, если требуется качественная типографика, этих мер недостаточно.

В любом случае именованные символьные сущности упрощают создание файлов HTML с помощью текстового редактора. Показанные таким образом символы включают варианты букв (с диакритическими знаками), математические символы (которые также могут быть стрелками и греческими буквами) и типографские варианты знаков препинания (→  знаки препинания ). В 1995 г. в ISO 8859-1 были введены «имена» для символов, выходящих за рамки ASCII , а в 1999 г. - для отдельных символов Unicode , см. Именованные сущности символов в статье « Сущности на языках разметки» .

Спецификация кодировки исходного кода

Кроме того, средства просмотра HTML (браузеры) могут быть проинструктированы преобразовывать текст, который не закодирован в ASCII, как предполагалось, путем явного указания кодировки исходного текста в заголовке файла:

<meta http-equiv="content-type" content="text/html; charset=UTF-8">

В качестве альтернативы ISO-8859UTF-8 также могут быть указаны варианты. В обоих случаях ссылки характера сущности не нужны, просто , , (и / ) , чтобы искать. &<>"'

Оба метода - с использованием сущностей и указанием кодировки символов - могут использоваться одновременно без каких-либо проблем.

Что лучше?

В статье « Сущности на языках разметки» обсуждаются две возможности, представленные не-ASCII-символами (будь то буквы, цифры или специальные символы) в разделах « Будущее символьных сущностей» и « Аннотации» . (По состоянию на середину февраля 2016 г.)

Латекс

LaTeX популярен для создания научных документов , первоначально разработанных компьютерными учеными Дональдом Э. Кнутом ( TeX ) - для Американского математического общества - и Лесли Лэмпортом (LaTeX).

Специальные символы без кода ASCII

Кодировка символов

Как и в случае с HTML, вы можете указать кодировку символов исходного текста, чтобы включить умляуты и диакритические знаки непосредственно в исходный код документа, здесь с помощью строки преамбулы.

\usepackage[utf8]{inputenc}

в качестве альтернативы, latin1а не utf8при работе со старыми исходными файлами в кодировке ISO 8859-1 . Без пакета inputenc файлы с расширениями ASCII не могут быть обработаны (по умолчанию LaTeX обрабатывает исходные файлы в кодировке ASCII) - по крайней мере, с исходным механизмом TeX Кнута или с pdfTeX ( ). XeTeX ( ) и LuaTeX интерпретируют исходные файлы в их настройках по умолчанию как закодированные в UTF-8 . В UTF-8 (т.е. Unicode), в принципе, любые символы, требуемые в различных предметных областях , например, в математике (для которой он был первоначально создан), образуют особенно большую долю «специальных символов» (не кодируемых одним ASCII), можно напрямую вставить как отдельный символ в исходный код документа LaTeX. Также доступны типографские варианты, закодированные с помощью знаков препинания ASCII (в 8-битном формате только нестандартные типографские тире, специфичные для производителя, Windows-1252 ). pdflatexxelatex

Кодирование с использованием комбинаций ASCII

Типографское качество всегда было возможным с LaTeX без расширения кодировки символов. Половина - четверть прочерк ( тир ) получаются с кодом ASCII --, то тир (английский тир) с и типографским удовлетворительным упущение с точкой . Символ, первоначально предназначенный для использования в качестве акцента Grave, показан в виде одинарной кавычки в левом верхнем углу; для двойных кавычек одинарные кавычки удваиваются. Варианты букв с комбинированными символами изначально представлялись сдвигающимися буквами и диакритическими глифами, предоставляемыми отдельно в наборах символов ; последние появляются в коде (вне формул) как комбинация начальной обратной косой черты (в шестнадцатеричном коде ASCII 5C) и другого символа, так что , например, «Ä» генерируется. С дополнительным пакетом макросов для немецкого языка вы можете печатать более коротким и разборчивым образом , что означает, что точки размещаются типографически немного ниже, чем на английском языке. Именно такие варианты букв могут быть легко вставлены в файл исходного кода с помощью клавиатуры, разработанной для латинских алфавитов , так что эти комбинированные команды, возможно, устарели из-за расширений ASCII; С другой стороны, при совместном написании текстов необходимо обмениваться файлами исходного кода, а исходные файлы отправляются в англоязычные журналы или издатели, хотя файлы, закодированные в ASCII, ISO 8859-1 и UTF-8, все еще могут "смешиваться". "в таких случаях рекомендуется продолжить использование комбинированных команд. ---\dots \\"{A}"A

LaTeX также автоматически использует лигатуры , которые, однако, часто неуместны в немецких текстах и поэтому должны быть специально подавлены.

Кроме того, наборы LaTeX символов в общей сложности тысяч предметно-специфических символов из Всеобъемлющего TeX Archive Network или TeX распределений доступны, в сочетании с макро - пакеты , которые предлагают комбинацию начинающегося с обратной косой черты и ASCII буквы как команды для каждого символа ( → # Веб-ссылки ). Таким образом, эти символы занимают место в наборе символов, управляемом одним создателем (или небольшой командой), а не (обязательно) в системе, управляемой органом по стандартизации. Для некоторых отдельных кодовых точек Unicode несколько пакетов TeX или LaTeX предлагают разные стили шрифтов (например, для символа евро ). Подобно «именованным объектам» в HTML, последовательности букв выбираются в соответствии с мнемоническими критериями. Б. \cupЧто &cup;касается символа объединенного множества .

В качестве преимущества ввода символов ASCII по сравнению с прямой вставкой символов Юникода с помощью сочетаний клавиш или из таблицы символов или панели инструментов иногда указывается, что автор может в значительной степени сосредоточиться на содержании текста, в то время как его пальцы в значительной степени в непрерывном потоке, как при игре на фортепиано блуждание по клавиатуре без сознательного контроля в системе с 10 пальцами . Для часто требуемых команд вы можете (в отличие от HTML с его жестко предписанным синтаксисом - с помощью \newcommandили \renewcommand) ввести более короткую команду «Псевдоним».

Специальные символы ASCII

Чтобы упростить набор текста и улучшить читаемость кода, 10 специальных символов ASCII - \{}$&#^_~%«незаконно присвоенные» / «зарезервированные» ( функциональные символы ), например Б. для (результат «м²»), что вы вводите в HTML или для . Чтобы отобразить их с помощью ASCII, как они были изначально , вы можете « замаскировать » их обратной косой чертой, за исключением и (которые могут быть созданы с помощью более длинных команд в зависимости от контекста) , например, вы вводите символ доллара $ . m$^2$m&sup2;m<sup>2</sup>\~\$

В LaTeX некоторые команды ищут следующие левые квадратные скобки [или звездочку *. В особых случаях это вызывает трудности, например, если вы хотите начать новую строку с квадратных скобок. Вместо того, чтобы \\[печатать лучше . \\{}[

Punycode

Чтобы иметь возможность представлять умляуты и другие специальные символы в доменных именах , была разработана процедура Punycode , которая вместе с Nameprep приводит к стандарту для интернационализированных доменных имен (IDN). Символы, отличные от ASCII, заменяются дефисами, а их представление добавляется в конец слова.

Смотри тоже

литература

  • Йоханнес Бергерхаузен, Сири Поаранган: decodeunicode: персонажи мира Герман Шмидт, Майнц, 2011, ISBN 978-3874398138 . Со всеми специальными символами всех систем письма
  • Гельмут Хиллер, Стефан Фюссель : Словарь кн. Издание 7-е, коренным образом переработанное. Витторио Клостерманн, Франкфурт-на-Майне 2006, ISBN 3-465-03495-3
  • Урсула Раутенберг (Hrsg.): Reclams Sachlexikon des Buches. 2-е улучшенное издание. Филипп Реклам июнь, Штутгарт 2003, ISBN 3-15-010542-0
  • Консорциум Unicode: стандарт Unicode, версия 6.0.0 . Консорциум Unicode, Маунтин-Вью, Калифорния, 2011, ISBN 978-1-936213-01-6

веб ссылки

Викисловарь: специальные символы  - объяснение значений, происхождение слов, синонимы, переводы

HTML и Юникод

Латекс

Викиучебники: Сборник LaTeX: специальные символы  - учебные и обучающие материалы

Индивидуальные доказательства

  1. Вольфганг Байнерт : специальные персонажи. В кн . : Типолексикон . 22 августа 2006, доступ к 7 февраля 2016 .
  2. специальные символы. В: Дуден онлайн . Проверено 7 февраля, 2016 .
  3. а б Йо Аппель, Манфред Лойбнер, Вольфганг Манекеллер, Уте Миелов, Хельга Рюлинг, Аннелоре Шлиц, Аннемари Вейгхардт: Gabler Büro Lexikon . Springer-Verlag, 2013, с. 259 ф . ( [Стр. 259] - «Помимо букв и цифр существуют различные другие символы; [Стр. 260] эти так называемые S. включают, например, символы арифметических операций (+ - /) и коммерческие символы (& %). ").
  4. а б в Лутц Дж. Генрих, Армин Хайнцль, Фридрих Ройтмайр: Wirtschaftsinformatik-Lexikon . Вальтер де Грюйтер, 2004, стр. 612 ( ограниченный предварительный просмотр в Поиске книг Google [доступ 7 февраля 2016 г.] «Символ, который не является ни буквой, ни числом, ни пробелом. Например, e для S. - это символы для арифметических операций, знаки препинания, символы сокращений, управляющие символы. ").
  5. ^ A b c Детлеф Юрген Браунер, Роберт Райбл-Бесте, Мартин М. Вейгерт: Мультимедиа-Lexikon . Вальтер де Грюйтер, 1998, стр. 319 ( ограниченный предварительный просмотр в Поиске книг Google [доступ 7 февраля 2016 г.] «все символы, кроме букв алфавита, т. Е. Цифр, знаков препинания, лигатур, диакритических знаков и т. Д.»).
  6. а б Урсула Раутенберг, Дирк Ветцель: кн . Вальтер де Грюйтер, 2001, стр. 22 ( ограниченный предварительный просмотр в Поиске книг Google [доступ 7 февраля 2016 г.] «От этих букв с изображениями отличается непечатный фиктивный материал (пиктограммы как типографские« нулевые символы »), с которыми, например, слово и межстрочный интервал ").
  7. горячая клавиша. В: Дуден онлайн . Проверено 7 февраля, 2016 .
  8. «Справка: HTML / справочник символов». В: SELFHTML . Проверено 7 мая 2021 года .