Связанные понятия
Лидийское письмо (англ. Lydian) — блок стандарта Юникод. Содержит древние символы лидийского письма для вымершего лидийского языка.
Ликийское письмо (англ. Lycian) — блок стандарта Юникод. Содержит древние символы ликийского письма для вымершего ликийского языка.
Осейдж (англ. Osage) — блок стандарта Юникод. Содержит символы письменности осейдж, созданной в 2006 году для языка осейдж, на котором говорили осейджи в Оклахоме, США.
Унифицированные идеограммы ККЯ — расширение F (англ. CJK Unified Ideographs Extension F) — блок стандарта Юникод. Содержит древние и исторические символы китайского, японского, корейского и вьетнамского писем (ККЯ), а также более тысячи символов чжуанского письма.
Мероитские иероглифы (англ. Meroitic Hieroglyphs) — блок стандарта Юникод. Содержит древние иероглифы мероитского письма для мероитского египетского языка.
Унифицированные идеограммы ККЯ — расширение E (англ. CJK Unified Ideographs Extension E) — блок стандарта Юникод. Содержит древние и исторические символы китайского, японского, корейского и вьетнамского писем (ККЯ).
Тайское письмо (англ. Thai) — тридцать первый блок стандарта Юникод. Содержит символы тайского письма для записи языков тайского, ланнатай и пали. Основан на стандарте Thai Industrial Standard 620-2533.
Дополнение к сирийскому письму (англ. Syriac Supplement) — двадцатый блок стандарта Юникод. Содержит дополнительные символы сирийского письма для записи сирийского малаялама.
Тангутское письмо (англ. Tangut) — блок стандарта Юникод. Содержит символы тангутского письма, на котором говорили тангуты в Тангутском царстве Си Ся и в Китае во время династии юань и в начале империи Мин.
Постскриптум (лат. post scriptum — «после написанного») — приписка к законченному и подписанному письму, обычно обозначаемая «P. S.». Также используют сокращение «P. P. S.» (лат. post post scriptum) для приписки, сделанной после постскриптума. В рунете иногда используют кириллические буквы «ЗЫ» — это PS, набранные русской раскладкой. В эпоху электронных писем, когда изменить основную часть текста довольно легко, использование «P. S.» позволяет сохранить первоначальную форму письма, сохраняя при этом...
Древние символы (англ. Ancient Symbols) — блок стандарта Юникод. Содержит древнеримские символы валют, а также один греческий символ.
Вертикальные формы (англ. Vertical Forms) — блок стандарта Юникод. Содержит вертикальные знаки пунктуации, используемые в китайской письменности, для совместимости с GB18030, таким образом являяясь расширением блока Совместимые формы ККЯ.
Язы́к разме́тки (текста) в компьютерной терминологии — набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении. Принадлежит классу компьютерных языков. Текстовый документ, написанный с использованием языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках — например, указание на заголовки, выделения, списки и т. д. В более сложных случаях язык разметки...
Юнико́д (чаще всего) или Унико́д (англ. Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является доминирующим в Интернете.
Объём письменного
перевода может оцениваться либо по времени, затраченному на перевод, либо по объёму текста. В первом случае единицей измерения служит час (астрономический). Применяется относительно редко, в основном, когда переводятся изменения и дополнения в существующий текст, то есть когда затруднительно определить объём переводимого или переведённого текста.
Коммента́рии — пояснения к исходному тексту программы, находящиеся непосредственно внутри комментируемого кода. Синтаксис комментариев определяется языком программирования. С точки зрения компилятора или интерпретатора, комментарии — часть текста программы, не влияющая на её семантику. Комментарии не оказывают никакого влияния на результат компиляции программы или её интерпретацию. Помимо исходных текстов программ, комментарии также применяются в языках разметки и языках описания.
Транслитера́ция — точная передача знаков одной письменности знаками другой письменности, при которой каждый знак (или последовательность знаков) одной системы письма передаётся соответствующим знаком (или последовательностью знаков) другой системы письма.
Комбинируемые полузнаки (англ. Combining Half Marks) — блок Юникода, содержащий части диакритических знаков, предназначенных для размещения над несколькими символами.
Визуа́льно неоднозна́чные си́мволы (англ. Visually Confusable Characters, или VCC) — термин, используемый для обозначения проблемы компьютерной безопасности, когда две различные строки символов выглядят на экране монитора очень похоже.
«Трактат о шифрах » (1466 г.) — одна из первых в Европе книг, посвящённая криптоанализу, написана Леоном Баттиста Альберти — итальянским учёным, гуманистом, писателем, одним из зачинателей новой европейской архитектуры и ведущим теоретиком искусства эпохи Возрождения. Своей работой он внёс существенный вклад в развитие криптографии, предложив идею многоалфавитного шифра, и изобрёл устройство, реализующее шифр многоалфавитной замены, получившее название «диск Альберти».
Шрифт Брайля (фр. Braille) — рельефно-точечный тактильный шрифт, предназначенный для письма и чтения незрячими и плохо видящим людям. Разработан в 1824 году французом Луи Брайлем (фр. Louis Braille), сыном сапожника. Луи в возрасте трёх лет поранился в мастерской отца шорным ножом; из-за начавшегося воспаления глаза мальчик потерял зрение. В возрасте 15 лет Луи создал свой рельефно-точечный шрифт как альтернативу рельефно-линейному шрифту Валентина Гаюи, вдохновившись простотой «ночного шрифта» капитана...
Шифр Бэкона (или «двухлитерный шифр») — метод сокрытия секретного сообщения, придуманный Фрэнсисом Бэконом в начале XVII века. Он разрабатывал шифры, которые бы позволяли передавать секретные сообщения в обычных текстах так, чтобы никто не знал об этих сообщениях. Шифр базируется на двоичном кодировании алфавита символами «A» и «B», которым можно сопоставить «0» и «1». Затем секретное послание «прячется» в открытом тексте, с помощью одного из способов сокрытия сообщений.
Пи́сьменность — знаковая система, предназначенная для формализации, фиксации и передачи тех или иных данных (речевой информации и других элементов смысла безотносительно к их языковой форме) на расстоянии и придания этим данным вневременного характера. Письменность — одна из форм существования человеческого языка.
Книжный шифр — вид шифра, в котором каждый элемент открытого текста (каждая буква или слово) заменяется на указатель (например, номер страницы, строки и столбца) аналогичного элемента в дополнительном тексте-ключе.
Автоформати́рование текста — изменение знаков препинания, отступов, капитализации символов текста в зависимости от его лексического значения.
Абреже ́ (от фр. abrégé — краткое изложение; возможно, от кельт. аbreg — отрезать) — перечень основных тем или внутренних заголовков, либо краткое содержание главы, помещённое перед её текстом после заголовка.
Простая старая документация (англ. Plain old documentation, сокращённо pod; близкое по смыслу к оригинальному русскому выражению — «Старая добрая документация») — простой язык разметки, применяемый для документирования языка программирования Perl.
Синдзитай (яп. 新字体, букв. «новые формы знаков») — формы кандзи, используемые в Японии с момента обнародования списка Тоё кандзи в 1946 г. Старые формы называются кюдзитай (яп. 旧字体 кю:дзитай, букв. «прежние формы знаков»). Некоторые из новых форм повторяют формы, которые используются в упрощённом китайском, однако синдзитай претерпели не такие обширные модификации. Таким образом, современные японские кандзи более близки к традиционным китайским знакам.
Гиперте́кст (англ. hypertext) — термин, обозначающий систему из текстовых страниц, имеющих перекрёстные ссылки.
Панграмма (c греч. «все буквы») или разнобуквица — короткий текст, использующий все или почти все буквы алфавита, по возможности не повторяя их.
Память переводов (ПП, англ. translation memory, TM, иногда также называемая «накопитель переводов») — база данных, содержащая набор ранее переведённых сегментов текста.
Шифр Виженера (фр. Chiffre de Vigenère) — метод полиалфавитного шифрования буквенного текста с использованием ключевого слова.Этот метод является простой формой многоалфавитной замены. Шифр Виженера изобретался многократно. Впервые этот метод описал Джовани Баттиста Беллазо (итал. Giovan Battista Bellaso) в книге La cifra del. Sig. Giovan Battista Bellasо в 1553 году, однако в XIX веке получил имя Блеза Виженера, французского дипломата. Метод прост для понимания и реализации, он является недоступным...
Расширенная сеть переходов (РСП) (калька с англ. Augmented transition network, или сокращенно — ATN) — технология грамматической и семантической обработки текстов предложенная американским лингвистом Вудсом. Расширенная сеть переходов представляет собой автомат, меняющий состояния при переходе от слова к слову в разбираемом предложении или тексте. Термин расширенная применительно к сетям переходов означает, что узлы сети наделены дополнительными условиями проверки, в которых могут содержаться различные...
Кодовая страница (англ. code page) — таблица, сопоставляющая каждому значению байта некоторый символ (или его отсутствие). Обычно код символа имеет размер 8 бит, так что кодовая страница может содержать максимум 256 символов, из чего вытекает резкая недостаточность всякой 8-битной кодовой страницы для представления многоязычных текстов. К тому же часть символов используется как управляющие, из-за чего число печатных символов редко превышает 223.
Двуязычный
словарь по традиции называется переводным. На протяжении веков перевод текстов был главным стимулом для создателей двуязычного словаря. Однако современные двуязычные словари становятся все более интегральными, включая синонимы и толкования, краткие сведения о реалиях и дополнительную грамматическую информацию о заглавном слове. С появлением электронной и кибернетической лексикографии возможности и перспективы двуязычного словаря могут оцениваться не только с позиции адекватности и полноты...
В программировании,
строковый тип (англ. string «нить, вереница») — тип данных, значениями которого является произвольная последовательность (строка) символов алфавита. Каждая переменная такого типа (строковая переменная) может быть представлена фиксированным количеством байтов либо иметь произвольную длину.
Компью́терная лексикогра́фия — прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей. Это временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям.
Расширенная форма Бэкуса — Наура (расширенная Бэкус — Наурова форма (РБНФ)) (англ. Extended Backus–Naur Form (EBNF)) — формальная система определения синтаксиса, в которой одни синтаксические категории последовательно определяются через другие. Используется для описания контекстно-свободных формальных грамматик. Предложена Никлаусом Виртом. Является расширенной переработкой форм Бэкуса — Наура, отличается от БНФ более «ёмкими» конструкциями, позволяющими при той же выразительной способности упростить...
Нормати́вный контро́ль в библиотечном деле — организация библиотечных каталогов и библиографической информации путём присвоения каждой теме определённого названия. Такие уникальные заголовки последовательно используются в каталоге и работают вместе с другими организационными данными, например, перекрёстными ссылками. Каждый заголовок имеет краткое описание пределов применимости и использования, такая организация помогает персоналу библиотек поддерживать каталог в актуальном состоянии и упрощает работу...
О ссылках между вики-проектами Фонда Викимедиа см. Википедия:Интервики.Интерви́ки (англ. interwiki) — средство организации ссылок между различными вики-системами в сети интернет. При её использовании можно избежать вставки в текст полного URL страницы, ограничившись внутренней ссылкой. При этом ссылка формируется следующим образом: префикс удалённой вики-системы + название страницы в удалённой вики.
Подробнее: Интервики
Регуля́рные выраже́ния (англ. regular expressions) — формальный язык поиска и осуществления манипуляций с подстроками в тексте, основанный на использовании метасимволов (символов-джокеров, англ. wildcard characters). Для поиска используется строка-образец (англ. pattern, по-русски её часто называют «шаблоном», «маской»), состоящая из символов и метасимволов и задающая правило поиска. Для манипуляций с текстом дополнительно задаётся строка замены, которая также может содержать в себе специальные символы...
Управля́ющие си́мволы — символы в кодировке, которым не приписано графическое представление, но которые используются для управления устройствами, организации передачи данных и других целей.
Знак решётки (#) — символ; иные варианты названия: решётка, октото́рп (от лат. octothorpe — восемь концов), хеш, знак номера, дие́з (или шарп , из-за внешнего сходства этих двух символов), знак фунта (знак решётки часто используют в случаях, когда в системе отсутствует техническая возможность ввода символа фунта).
Ифку́иль (ифк. Iţkuîl), также Ыфкуил или Илакш — искусственный язык философского направления. Обладает крайней сложностью грамматики и огромным набором фонем, что делает язык весьма трудным для изучения.
Форма Бэкуса — Наура (сокр. БНФ, Бэкуса — Наура форма) — формальная система описания синтаксиса, в которой одни синтаксические категории последовательно определяются через другие категории. БНФ используется для описания контекстно-свободных формальных грамматик. Существует расширенная форма Бэкуса — Наура, отличающаяся лишь более ёмкими конструкциями.
Глосси́рование (англ. Interlinear gloss) — это способ оформления текста, предполагающий наличие кратких пояснений к нему, которые помещаются в строчке между оригинальным текстом (или его транслитерацией) и переводом. Глоссы используются для того, чтобы читателю было ясно, как именно соотносится текст и его перевод с точки зрения грамматики и семантики. Поморфемное глоссирование часто используется в лингвистических исследованиях (обычно в отношении текстов на малоизвестных языках), а также в учебных...
Те́кстовый файл — компьютерный файл, содержащий текстовые данные. Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).
Си́мвол-джо́кер (си́мвол подстано́вки) — символ, используемый для замены других символов или их последовательностей, приводя таким образом к символьным шаблонам. Развитием символов-джокеров являются регулярные выражения.