Основная кодировка

Основна́я кодиро́вка, как и альтернативная, разработана в 1986 году в ВЦ Академии Наук СССР; использовалась мало (в феврале 1989 года только 7% опрошенных заявлили, что используют её, против 85% использующих альтернативную). Её поддерживало только оборудование и программное обеспечение, производившееся в СССР (ЕС ПЭВМ, Лексикон, …), а также некоторые принтеры Epson.

Встречаются упоминания, что данная кодировка была принята как ГОСТ 19768-87, но достоверных сведений о существовании такого стандарта нет — за 19768-74 (описывавший КОИ-8 и ДКОИ-8) последовал 19768-93 (описывающий только ДКОИ-8). Стандарт ГОСТ Р 34.303-92 устанавливает схожую кодировку под названием КОИ-8 В1 на основе ISO 8859-5, но с отсутствием знаков псевдографики.

Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII.

Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

Примечания:

в позициях 0xF2—0xF5 должны быть прямые диагональные линии
позиция 0xFF, видимо, не использовалась вообще.

Источник: Википедия

Связанные понятия

Кодовая страница (англ. code page) — таблица, сопоставляющая каждому значению байта некоторый символ (или его отсутствие). Обычно код символа имеет размер 8 бит, так что кодовая страница может содержать максимум 256 символов, из чего вытекает резкая недостаточность всякой 8-битной кодовой страницы для представления многоязычных текстов. К тому же часть символов используется как управляющие, из-за чего число печатных символов редко превышает 223.

Юнико́д (чаще всего) или Унико́д (англ. Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является доминирующим в Интернете.

Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).

«Болга́рская кодиро́вка» (называемая также MIK, Interprog и «старый вариант ВЦ АН СССР») — это кодовая страница, применявшаяся на компьютерах болгарского производства (например, «Правец»). Эта кодировка не зафиксирована ни в одном нормативном документе. В Windows не используется, потому что в болгарских стандартах указана не она. Если в Windows 95-98-Me, International Version, установить болгарский язык, то в сессиях DOS будет использоваться кодовая страница CP855.

Байт (англ. byte) (русское обозначение: байт и Б; международное: B, byte) — единица хранения и обработки цифровой информации; совокупность битов, обрабатываемая компьютером одномоментно. В современных вычислительных системах байт состоит из восьми битов и, соответственно, может принимать одно из 256 (28) различных значений (состояний, кодов). Однако в истории компьютерной техники существовали решения с иными размерами байта (например, 6, 32 или 36 битов), поэтому иногда в компьютерных стандартах...

Упоминания в литературе

На заре развития вычислительной техники очень широко использовалась кодировка с кириллицей KOI-8. Она появилась в семидесятые годы при адаптации операционной системы UNIX к русскому языку – персональных компьютеров тогда еще не было. KOI-8 – до сих пор основная кодировка в UNIX. Потом началось победное шествие персональных компьютеров IBM, а с ними – операционных систем MS DOS, имевших DOS-кодировку (или кодовую страницу 866). Параллельно развивались компьютеры Macintosh, и, разумеется, была придумана еще одна кодировка – MAC. Наконец, с появлением операционной системы Microsoft Windows появилась и новая windows-кодировка (кодовая страница 1251). Она-то и стала самой распространенной в России.

Александр Петрович Загуменов, Как раскрутить и разрекламировать Web-сайт в сети Интернет, 2005

Связанные понятия (продолжение)

Мегаба́йт (русское обозначение: Мбайт; международное: Mbyte, MB) — единица измерения количества информации, обозначающая, в зависимости от контекста, 1 000 000 (106) или 1 048 576 (220) байт. В Российской Федерации под мегабайтом понимается единица информации, равная 220 (1 048 576) байт, то есть мебибайт. Такое понимание зафиксировано в Положении о единицах величин, допускаемых к применению в Российской Федерации, утверждённом Постановлением Правительства РФ в 2009 году...

Язы́к разме́тки (текста) в компьютерной терминологии — набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении. Принадлежит классу компьютерных языков. Текстовый документ, написанный с использованием языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках — например, указание на заголовки, выделения, списки и т. д. В более сложных случаях язык разметки...

Нестанда́ртные шрифты́ — компьютерные шрифты, расположение глифов в которых не соответствует общепринятым кодировкам. Такие шрифты могут включать в себя...

В этой статье сравнивается более 50 языков программирования по основным свойствам синтаксиса.

Подробнее: Сравнение языков программирования (синтаксис)

Цифровой идентификатор объекта (сокр. ЦИО; от англ. Digital Object Identifier, сокр. DOI) — стандарт обозначения представленной в сети информации об объекте ГОСТ Р ИСО 26324-2015. Информация, содержащаяся в DOI электронного документа, содержит указатель его местонахождения (например, URL), его имя (название), прочие идентификаторы объекта (например, ISBN для электронного образа книги) и ассоциированный с объектом набор описывающих его данных (метаданных) в структурированном и расширяемом виде.

Станда́рт оформле́ния ко́да (станда́рт коди́рования, стиль программи́рования) (англ. coding standards, coding convention или programming style) — набор правил и соглашений, используемых при написании исходного кода на некотором языке программирования. Наличие общего стиля программирования облегчает понимание и поддержание исходного кода, написанного более чем одним программистом, а также упрощает взаимодействие нескольких человек при разработке программного обеспечения.

Те́кстовый файл — компьютерный файл, содержащий текстовые данные. Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).

Транслитера́ция — точная передача знаков одной письменности знаками другой письменности, при которой каждый знак (или последовательность знаков) одной системы письма передаётся соответствующим знаком (или последовательностью знаков) другой системы письма.

В программировании термин «директива» (указание) по использованию похож на термин «команда», так как также используется для описания некоторых конструкций языка программирования (то есть указаний компилятору или ассемблеру особенностей обработки при компиляции).

Шестиби́тные кодиро́вки применялись в компьютерах, производившихся в США в 1950-х — 1960-х годах. Соответственно размер машинного слова на этих компьютерах был кратен 6 бит (например, 12, 18, 24, 36, 48, 60 бит). Такой размер символа позволял кодировать заглавные латинские буквы, арабские цифры, несколько знаков пунктуации и иногда управляющих символов (в те времена можно было обходиться без управляющих символов, так как текстовые файлы представляли собой последовательность записей фиксированной...

Форт (англ. Forth) — один из первых конкатенативных языков программирования, в котором программы записываются последовательностью лексем («слов» в терминологии языка Форт). Математические выражения представляются постфиксной записью при использовании стековой нотации. Поддерживает механизмы метарасширения семантики и синтаксиса языка для адаптации к нужной предметной области. Синтаксис базового уровня в Форте прост и состоит из единственного правила: «все определения разделяются пробелами». Определения...

Управляющая последовательность (исключённая последовательность, экранированная последовательность, от англ. escape sequence) — совокупность идущих подряд значащих элементов, в группе теряющих для обрабатывающего механизма своё индивидуальное значение, одновременно с приобретением этой группой нового значения.

«Foobar» перенаправляется сюда. См. также статью о медиапроигрывателе foobar2000, о канадском фильме Фубар и об англоязычном акрониме FUBAR.Метасинтаксическая переменная, Метапереме́нные — это слова-заменители, которые применяются в технических текстах для обозначения чего-либо, что может стоять на их месте, метапеременные часто используются в программировании.

Подробнее: Метапеременная

Двоичные приставки — приставки перед наименованиями или обозначениями единиц измерения информации, применяемые для формирования кратных единиц, отличающихся от базовой единицы в определённое целое, являющееся целой положительной степенью числа 210, число раз (210 = 1024, (210)2 = 220 = 10242, (210)3 = 230 = 10243 и т. д.). Двоичные приставки используются для образования единиц измерения информации, кратных битам и байтам.

Чувствительность к регистру символов (англ. case sensitivity) — особенность некоторых файловых систем, программ и языков программирования, состоящая в том, что если одинаковые имена отличаются регистром хотя бы одного символа (то есть заглавными или строчными буквами), то эти имена считаются разными. Например, слово «TEXT» и слово «Text» в программе, чувствительной к регистру символов — абсолютно разные слова. Файлы «Photo.jpg», «photo.jpg» и «photo.JPG» в файловой системе, чувствительной к регистру...

В программировании, строковый тип (англ. string «нить, вереница») — тип данных, значениями которого является произвольная последовательность (строка) символов алфавита. Каждая переменная такого типа (строковая переменная) может быть представлена фиксированным количеством байтов либо иметь произвольную длину.

Расширенная форма Бэкуса — Наура (расширенная Бэкус — Наурова форма (РБНФ)) (англ. Extended Backus–Naur Form (EBNF)) — формальная система определения синтаксиса, в которой одни синтаксические категории последовательно определяются через другие. Используется для описания контекстно-свободных формальных грамматик. Предложена Никлаусом Виртом. Является расширенной переработкой форм Бэкуса — Наура, отличается от БНФ более «ёмкими» конструкциями, позволяющими при той же выразительной способности упростить...

Транслитерация русского текста латиницей, другими словами романизация русского текста, транслитерация русского текста с кириллицы на латиницу — передача букв, слов, выражений и связанных текстов, записанных с помощью русского алфавита (кириллического), средствами латинского алфавита.

Типографская раскладка Ильи Бирмана — под этим названием известны расширенные версии раскладок клавиатуры QWERTY и ЙЦУКЕН, позволяющие набирать специальные символы без использования символьных кодов.

Гигабайт (обозначение Гбайт) — кратная единица измерения количества информации, равная 230 = 1 073 741 824 байт (согласно предложению международной электротехнической комиссии является гибибайтом). Согласно ГОСТ 8.417—2002 термин гигабайт с обозначением «ГБ» равен 109 = 1 000 000 000 байт.

Фокал (Focal, акроним от англ. formula calculator) — интерпретируемый язык программирования высокого уровня, переработка языка JOSS.

Шифр подстано́вки — это метод шифрования, в котором элементы исходного открытого текста заменяются зашифрованным текстом в соответствии с некоторым правилом. Элементами текста могут быть отдельные символы (самый распространённый случай), пары букв, тройки букв, комбинирование этих случаев и так далее.

Перебор по словарю (англ. dictionary attack) — атака на систему защиты, использующая метод полного перебора (англ. brute-force) предполагаемых паролей, используемых для аутентификации, осуществляемого путём последовательного пересмотра всех слов (паролей в чистом виде или их зашифрованных образов) определённого вида и длины из словаря с целью последующего взлома системы и получения доступа к секретной информации.

Пробе́л — интервал между буквами, обозначающий границы слов во многих системах письменности. Функционально пробел принадлежит к знакам препинания.

Те́кстовые да́нные (также те́кстовый форма́т) — представление информации строкового типа (то есть, последовательности печатных символов) в вычислительной системе. В MIME закодированным таким образом данным соответствует тип text/plain.

Регуля́рные выраже́ния (англ. regular expressions) — формальный язык поиска и осуществления манипуляций с подстроками в тексте, основанный на использовании метасимволов (символов-джокеров, англ. wildcard characters). Для поиска используется строка-образец (англ. pattern, по-русски её часто называют «шаблоном», «маской»), состоящая из символов и метасимволов и задающая правило поиска. Для манипуляций с текстом дополнительно задаётся строка замены, которая также может содержать в себе специальные символы...

Цанцзе (кит. трад. 倉頡輸入法, упр. 仓颉输入法, пиньинь: cāng jié shūrùfǎ, палл.: цанцзе шужуфа) — структурный метод ввода китайских иероглифов, разработанный в 1976 году Чу Бонфу, один из способов ввода иероглифов с клавиатуры пишущей машины, компьютера и так далее.

Компьютерный шрифт — это файл, содержащий в себе описание набора буквенных, цифровых, служебных и псевдографических символов, используемый для отображения этих символов (в частности текста) программой или операционной системой.

Советские микросхемы — микросхемы, разработанные в СССР до 26 декабря 1991 года. Продолжают эксплуатироваться до настоящего времени в различных электронных устройствах, преимущественно промышленного и специального назначения.

Килоба́йт (русское обозначение: Кбайт; международное: Kbyte, KB) — единица измерения количества информации, равная 1024 байт.

Основная латиница или Управляющие символы C0 и основная латиница (англ. Basic Latin, C0 Controls and Basic Latin) — первый блок стандарта Юникод и единственный блок, кодируемый одним байтом в системе UTF-8. Блок содержит все буквы и управляющие коды из кодировки ASCII.

Простая старая документация (англ. Plain old documentation, сокращённо pod; близкое по смыслу к оригинальному русскому выражению — «Старая добрая документация») — простой язык разметки, применяемый для документирования языка программирования Perl.

Вики-разметка — язык разметки, который используется для оформления текста на веб-сайтах (как правило, относящихся к классу вики-проектов) и позволяет упростить доступ к возможностям языка HTML. Страницы, оформленные с применением вики-разметки, предварительно преобразуются в HTML для просмотра в веб-браузере, преобразование реализует специальное программное обеспечение — вики-движок (англ. wiki engine).

В информатике таблица символов (от англ. symbol table «таблица идентификаторов») — это структура данных, используемая транслятором (компилятором или интерпретатором), в которой каждый идентификатор переменной или функции из исходного кода ассоциируется с информацией, связанной с его объявлением или появлением в коде: типом данных, областью видимости и в некоторых случаях местом в памяти (смещением).

Бе́йсик (BASIC, сокращение от англ. Beginner’s All-purpose Symbolic Instruction Code — универсальный код символических инструкций для начинающих) — семейство высокоуровневых языков программирования.

Ло́го (англ. Logo) — язык программирования высокого уровня, разработанный в 1967 году Уолли Фёрзегом, Сеймуром Пейпертом и Синтией Соломон в образовательных целях для обучения детей дошкольного и младшего школьного возраста основным концепциям программирования (рекурсии, расширяемости и пр.).

Память переводов (ПП, англ. translation memory, TM, иногда также называемая «накопитель переводов») — база данных, содержащая набор ранее переведённых сегментов текста.

Паска́ль (англ. Pascal) — один из наиболее известных языков программирования, используется для обучения программированию в старших классах и на первых курсах вузов, является основой для ряда других языков.

Знак решётки (#) — символ; иные варианты названия: решётка, октото́рп (от лат. octothorpe — восемь концов), хеш, знак номера, дие́з (или шарп , из-за внешнего сходства этих двух символов), знак фунта (знак решётки часто используют в случаях, когда в системе отсутствует техническая возможность ввода символа фунта).

Свободные шрифты ПТ (шрифтовая система «Питер»; англ. PT — аббревиатура от public type) — проект по созданию общенациональных бесплатных шрифтов с открытой лицензией, поддерживающих все языки малых народов РФ (см. список языков). В настоящее время в состав семейства входят 3 гарнитуры...

Дефи́с (от нем. divis — соединительный знак, знак деления, от лат. divisio — (раз)деление), чёрточка (‐) — небуквенный орфографический знак русской и многих других письменностей. Графически тождествен со знаком переноса.

Латинский алфавит является основой для многих письменностей; ниже приведено сравнение некоторых из них. Не всегда указанные знаки являются отдельными буквами соответствующих алфавитов; также и их взаимное расположение может быть разным и не соответствующим использованному в приводимых таблицах. (Некоторые символы в таблицах могут не отображаться в зависимости от установленных шрифтов, браузера и операционной системы). См. также список новых алфавитов на основе латиницы.

Подробнее: Алфавиты на основе латинского

Псевдогра́фика, псевдографические символы — совокупность символов, включённых в набор символов компьютерного шрифта, отображающих графические примитивы (линии, прямоугольники, треугольники, кресты, различная заливка и тому подобное). Псевдографические символы реализуются в рамках формата шрифта (к примеру, матрица 8×12 точек) и дополняют в таком наборе цифро-буквенные и служебные символы.

Раскла́дка клавиату́ры — соглашение о соответствии типографических символов (букв, цифр, знаков препинания и т. д.) письменного языка клавишам клавиатуры компьютера, пишущей машинки или другого устройства, с помощью которого вводится текст. Раскладка устанавливает несколько соответствий между клавишами и значениями, вводимыми с их помощью...

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я