Связанные понятия
Основна́я кодиро́вка , как и альтернативная, разработана в 1986 году в ВЦ Академии Наук СССР; использовалась мало (в феврале 1989 года только 7% опрошенных заявлили, что используют её, против 85% использующих альтернативную). Её поддерживало только оборудование и программное обеспечение, производившееся в СССР (ЕС ПЭВМ, Лексикон, …), а также некоторые принтеры Epson.
Основная латиница или Управляющие символы C0 и основная латиница (англ. Basic Latin, C0 Controls and Basic Latin) — первый блок стандарта Юникод и единственный блок, кодируемый одним байтом в системе UTF-8. Блок содержит все буквы и управляющие коды из кодировки ASCII.
Латинский алфавит является основой для многих письменностей; ниже приведено сравнение некоторых из них. Не всегда указанные знаки являются отдельными буквами соответствующих алфавитов; также и их взаимное расположение может быть разным и не соответствующим использованному в приводимых таблицах. (Некоторые символы в таблицах могут не отображаться в зависимости от установленных шрифтов, браузера и операционной системы). См. также список новых алфавитов на основе латиницы.
Подробнее: Алфавиты на основе латинского
Юнико́д (чаще всего) или Унико́д (англ. Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является доминирующим в Интернете.
Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).
Кодовая страница (англ. code page) — таблица, сопоставляющая каждому значению байта некоторый символ (или его отсутствие). Обычно код символа имеет размер 8 бит, так что кодовая страница может содержать максимум 256 символов, из чего вытекает резкая недостаточность всякой 8-битной кодовой страницы для представления многоязычных текстов. К тому же часть символов используется как управляющие, из-за чего число печатных символов редко превышает 223.
Шестиби́тные кодиро́вки применялись в компьютерах, производившихся в США в 1950-х — 1960-х годах. Соответственно размер машинного слова на этих компьютерах был кратен 6 бит (например, 12, 18, 24, 36, 48, 60 бит). Такой размер символа позволял кодировать заглавные латинские буквы, арабские цифры, несколько знаков пунктуации и иногда управляющих символов (в те времена можно было обходиться без управляющих символов, так как текстовые файлы представляли собой последовательность записей фиксированной...
Типографская раскладка Ильи Бирмана — под этим названием известны расширенные версии раскладок клавиатуры QWERTY и ЙЦУКЕН, позволяющие набирать специальные символы без использования символьных кодов.
Чува́шские раскла́дки клавиату́ры — соглашения о соответствии типографических символов (букв, цифр, знаков препинания и т. д.) чувашского письменного языка клавишам клавиатуры компьютера, печатной машинки или другого устройства, предполагающего ввод текстовой информации на чувашском языке. Каждое из соглашений предполагает установление механических, визуальных и функциональных соответствий «клавиша-значение».
Транслитерация русского текста латиницей, другими словами романизация русского текста, транслитерация русского текста с кириллицы на латиницу — передача букв, слов, выражений и связанных текстов, записанных с помощью русского алфавита (кириллического), средствами латинского алфавита.
В русской типографике для обозначения порядкового числа предмета (при условии обязательного указания числового значения) в ряду других однородных — номера — употребляется символ №. В США номер обозначают знаком решётки — #.
Подробнее: Знак номера
Раскла́дка клавиату́ры — соглашение о соответствии типографических символов (букв, цифр, знаков препинания и т. д.) письменного языка клавишам клавиатуры компьютера, пишущей машинки или другого устройства, с помощью которого вводится текст. Раскладка устанавливает несколько соответствий между клавишами и значениями, вводимыми с их помощью...
Диграф ы (англ. digraphs) — в программировании последовательности из двух символов, которые следует заменять на один конкретный символ. Созданы и используются для ввода символов, отсутствующих на клавиатуре или в кодировке. Применялись во времена семибитных кодировок.
Фонетическая раскладка — система расположения букв одного письменного языка на раскладке клавиатуры другого языка, при которой буквы, близкие по произношению, располагаются на одних и тех же клавишах.
Нестанда́ртные шрифты ́ — компьютерные шрифты, расположение глифов в которых не соответствует общепринятым кодировкам. Такие шрифты могут включать в себя...
Для письменности казахского языка в прошлом использовались алфавиты разнообразных систем, в современности действующими являются алфавиты на следующих графиках...
Подробнее: Казахская письменность
Байт (англ. byte) (русское обозначение: байт и Б; международное: B, byte) — единица хранения и обработки цифровой информации; совокупность битов, обрабатываемая компьютером одномоментно. В современных вычислительных системах байт состоит из восьми битов и, соответственно, может принимать одно из 256 (28) различных значений (состояний, кодов). Однако в истории компьютерной техники существовали решения с иными размерами байта (например, 6, 32 или 36 битов), поэтому иногда в компьютерных стандартах...
Чувствительность к регистру символов (англ. case sensitivity) — особенность некоторых файловых систем, программ и языков программирования, состоящая в том, что если одинаковые имена отличаются регистром хотя бы одного символа (то есть заглавными или строчными буквами), то эти имена считаются разными. Например, слово «TEXT» и слово «Text» в программе, чувствительной к регистру символов — абсолютно разные слова. Файлы «Photo.jpg», «photo.jpg» и «photo.JPG» в файловой системе, чувствительной к регистру...
Транслитера́ция — точная передача знаков одной письменности знаками другой письменности, при которой каждый знак (или последовательность знаков) одной системы письма передаётся соответствующим знаком (или последовательностью знаков) другой системы письма.
Армянская система счисления — историческая система счисления, созданная с использованием маюскулов (заглавных букв) армянского алфавита.
Амперса́нд (иногда — амперсе́нд; англ. ampersand) — знак &. Он является логограммой, заменяющей союз «и», и возник как лигатура букв et (с лат. — «и»).
ЙЦУКЕН — основная русскоязычная раскладка клавиатуры компьютеров и пишущих машинок.
В программировании,
строковый тип (англ. string «нить, вереница») — тип данных, значениями которого является произвольная последовательность (строка) символов алфавита. Каждая переменная такого типа (строковая переменная) может быть представлена фиксированным количеством байтов либо иметь произвольную длину.
Румы́нский алфави́т — вариант латинского алфавита, используемый для записи румынского языка. Первая румынская грамматика была издана в Вене в 1780. Официально румынская латиница используется в Румынни с 1860 года, когда она заменила валашско-молдавскую кириллицу.
Каретная нотация — способ записи управляющих символов в кодировке ASCII. Запись состоит из символа карета (^) и заглавной буквы; эта диграмма обозначает ASCII-код символа в соответствии с позицией буквы в английском алфавите. Например, символ конца передачи имеет номер 4 и представляется как ^D, поскольку D — четвертая буква алфавита. Нулевой символ записывается как ^@ (@ идет в таблице ASCII до A). Символ DEL имеет значение 127 и обычно записывается как ^?, потому что ASCII-символ ? идет до @ и...
Специальные символы (англ. Specials) — 161-й блок стандарта «Юникод» и последний в Основной многоязычной плоскости. Занимает кодовые позиции с U+FFF0 по U+FFFF. Из содержащихся в блоке шестнадцати кодовых позиций задействованы лишь пять. Блок примечателен символом-заполнителем (�), относящимся к двум самым часто используемым символам в Юникоде, который в большинстве операционных систем (преимущественно в браузерах) отображаются, когда какой-либо символ Юникода не поддерживается самой системой пользователя...
Переноси́мый набо́р си́мволов (англ. portable character set) — набор из 103 символов, которые, согласно стандарту POSIX, должны присутствовать в любой используемой кодировке. Включает в себя все печатные символы US-ASCII и часть управляющих. Является базовым алфавитом для практически всех современных языков программирования.
Арабское письмо произошло от набатейского письма, развившегося из арамейского письма, которое в свою очередь восходит к финикийскому письму. Арабский алфавит включил в себя все буквы арамейского и добавил к ним буквы, отражающие специфически арабские звуки. Это буквы са, ха, заль, дад, за, гайн.
«Суммарный алфавит, принятый в СССР» — набор из 400 символов, достаточный для набора текстов на 90 языках, пользующихся кириллицей и латиницей. Сходные русские и латинские буквы были совмещены (хотя на картинках русские и латинские буквы без диакритики показаны отдельно).
Лигату́ра (лат. ligatura — связь) — знак любой системы письма или фонетической транскрипции, образованный путём соединения двух и более графем, например: датск., исл., норв., осет. æ; нем. ß.
Пробе́л — интервал между буквами, обозначающий границы слов во многих системах письменности. Функционально пробел принадлежит к знакам препинания.
Советские микросхемы — микросхемы, разработанные в СССР до 26 декабря 1991 года. Продолжают эксплуатироваться до настоящего времени в различных электронных устройствах, преимущественно промышленного и специального назначения.
Герша́им (герша́йим; ивр. גֵּרְשַׁיִם; без огласовок: ивр. גרשיים), иногда граша́им (ивр. גְּרָשַׁיִם) или шней гриши́н — название двух различных типографских знаков в еврейском языке. Название является формой двойственного числа слова «ге́реш» (גֵּרֵשׁ) и буквально означает «два гереша» или «двойной гереш».
Символ или знак валюты (¤) — типографский символ, который входит в группу «Управляющие символы C1 и дополнение 1 к латинице» (англ. C1 Controls and Latin-1 Supplement) стандарта Юникод: оригинальное название — Currency sign (англ.); код — U+00A4. Мнемоника HTML — ¤. Используется, когда в том или ином компьютерном шрифте недоступен или отсутствует знак конкретной валюты.
Чертёжный шрифт — рукописный и компьютерный шрифт, который применяется для оформления чертежей и других технических документов. Шрифт стандартизован, его описывает международный стандарт ISO 3098 и такие национальные стандарты, как ГОСТ 2.304-81 и DIN 6776-1. Надписи чертёжным шрифтом могут выполняются от руки с использованием прямоугольной или наклонной сетки, могут использоваться трафареты и сухой перенос, а также компьютерный набор.Согласно требованиям системы стандартов ЕСКД все надписи на чертежах...
Двоеточие (:) — знак препинания в виде двух расположенных одна над другой точек, употребляемый для указания на то, что часть текста после него связана причинными, пояснительными и т. п. смысловыми отношениями с частью текста перед ним.
Те́кстовый файл — компьютерный файл, содержащий текстовые данные. Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).
Дефи́с (от нем. divis — соединительный знак, знак деления, от лат. divisio — (раз)деление), чёрточка (‐) — небуквенный орфографический знак русской и многих других письменностей. Графически тождествен со знаком переноса.
Шрифт Брайля на эсперанто — это шрифт Брайля алфавита эсперанто. Рельефно-точечный тактильный шрифт Брайля на языке эсперанто предназначен для письма и чтения незрячими и плохо видящими людьми. С 1920 года издается журнал «Aŭroro» на шрифте Брайля, с 1904 года издается аналогичный журнал Esperanta Ligilo.
Черта́ све́рху — типографический знак горизонтальной линии, нарисованной сразу над текстом. В математической нотации черта сверху долгое время используется для vinculum, объединения определённых символов. Также знак используется с римскими цифрами, показывая умножение цифры на тысячу, а также в средневековых аббревиатурах (sigla). Обозначение одного и более слов сплошной линией над буквами называется надчёркивание.
Шифр подстано́вки — это метод шифрования, в котором элементы исходного открытого текста заменяются зашифрованным текстом в соответствии с некоторым правилом. Элементами текста могут быть отдельные символы (самый распространённый случай), пары букв, тройки букв, комбинирование этих случаев и так далее.
Немые клавиши, «Мёртвые клавиши» (англ. dead keys) — клавиши на компьютерных клавиатурах или пишущих машинках, позволяющие изменить вид следующего вводимого символа. На печатных машинках нажатие на немую клавишу ставит надстрочный символ, но не сдвигает каретку на следующий символ. На компьютерах нажатие немой клавиши изменяет код следующего вводимого символа. К примеру, последовательность ⌥ Option+`, e на Macintosh создаёт символ «è».
Нуль-терминированная строка или C-строка (от названия языка Си) или ASCIIZ-строка — способ представления строк в языках программирования, при котором вместо введения специального строкового типа используется массив символов, а концом строки считается первый встретившийся специальный нуль-символ (NUL из кода ASCII, со значением 0).
Ɪ, ɪ (капительная I/I с засечками) — буква расширенной латиницы. Хотя ɪ, как правило, аллограф буквы I, она рассматривается как отдельная буква в Африканском эталонном алфавите и использовалась как таковая в некоторых публикациях на языке куланго в Кот-д’Ивуаре в 1990-х годах. В Международном фонетическом алфавите строчная ɪ используется для обозначения ненапряжённого неогублённого гласного переднего ряда верхнего подъёма. Также используется в версиях Юнифона для английского, языков хупа, карук...
Управля́ющие си́мволы — символы в кодировке, которым не приписано графическое представление, но которые используются для управления устройствами, организации передачи данных и других целей.
Управляющая последовательность (исключённая последовательность, экранированная последовательность, от англ. escape sequence) — совокупность идущих подряд значащих элементов, в группе теряющих для обрабатывающего механизма своё индивидуальное значение, одновременно с приобретением этой группой нового значения.
Тег , те́ги (иногда тэг, англ. tag — именованная метка, читается /tæg/; более правильное название — дескриптор). В SGML (HTML, WML, AmigaGuide, языках семейства XML) — элемент языка разметки гипертекста. Текст, содержащийся между начальным и конечным тегом, отображается и размещается в соответствии со свойствами, указанными в начальном теге.
Мегаба́йт (русское обозначение: Мбайт; международное: Mbyte, MB) — единица измерения количества информации, обозначающая, в зависимости от контекста, 1 000 000 (106) или 1 048 576 (220) байт. В Российской Федерации под мегабайтом понимается единица информации, равная 220 (1 048 576) байт, то есть мебибайт. Такое понимание зафиксировано в Положении о единицах величин, допускаемых к применению в Российской Федерации, утверждённом Постановлением Правительства РФ в 2009 году...