Связанные понятия
Транслитера́ция — точная передача знаков одной письменности знаками другой письменности, при которой каждый знак (или последовательность знаков) одной системы письма передаётся соответствующим знаком (или последовательностью знаков) другой системы письма.
Автоматизи́рованный перево́д (АП, англ. Computer-Aided Translation) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.
Компью́терная лексикогра́фия — прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей. Это временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям.
Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.
Синхронный автоматический перевод (Speech-to-Speech Real-Time Translation) — «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Маши́нный перево́д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.
Контроли́руемый язы́к (упрощённый естественный язык, англ. controlled natural language, CNL) — ограниченная версия естественного языка, созданная для выполнения определённых задач. Контролируемый язык — это подвид естественного языка, полученный ограничением в использовании грамматики, терминологии и речевых оборотов посредством регламентирующих правил с тем, чтобы снизить или искоренить его многозначность и сложность.
Память переводов (ПП, англ. translation memory, TM, иногда также называемая «накопитель переводов») — база данных, содержащая набор ранее переведённых сегментов текста.
Транслитерация русского текста латиницей, другими словами романизация русского текста, транслитерация русского текста с кириллицы на латиницу — передача букв, слов, выражений и связанных текстов, записанных с помощью русского алфавита (кириллического), средствами латинского алфавита.
Практи́ческая транскри́пция — запись иноязычных имён и названий с помощью исторически сложившейся орфографической системы языка, на который они передаются. Практическая транскрипция использует обычные знаки (буквы) языка-приёмника без введения дополнительных знаков. При практической транскрипции на русский язык слово записывается буквами кириллицы с приблизительным сохранением его звукового облика в исходном языке, а также с возможным учётом написания в оригинале и сложившихся традиций.
Машинный перевод на основе примеров (англ. Example-based machine translation, EBMT) — это метод машинного перевода, который часто характеризуется использованием двуязычного корпуса с параллельными текстами в качестве основной базы знаний во время выполнения перевода. По сути, это перевод по аналогии, который может рассматриваться как применение метода рассуждений на основе прецедентов к машинному обучению.
В египтологии транслитерация — это процесс преобразования (отображения) египетских текстов, при котором иероглифы (или их эквиваленты в иератике и демотике) заменяются на алфавитные символы (напр. латинские буквы), что очень удобно для научных публикаций.
«Трактат о шифрах » (1466 г.) — одна из первых в Европе книг, посвящённая криптоанализу, написана Леоном Баттиста Альберти — итальянским учёным, гуманистом, писателем, одним из зачинателей новой европейской архитектуры и ведущим теоретиком искусства эпохи Возрождения. Своей работой он внёс существенный вклад в развитие криптографии, предложив идею многоалфавитного шифра, и изобрёл устройство, реализующее шифр многоалфавитной замены, получившее название «диск Альберти».
Машинный перевод на основе трансформации является разновидностью машинного перевода (MП). В настоящее время это один из наиболее распространённых методов машинного перевода. В отличие от более простой модели прямого MП, MП на основе трансформации разделяет процесс перевод на три этапа: анализ текста на исходном языке для определения его грамматической структуры, перевод результирующей структуры в структуру, подходящую для производства текста на языке перевода, и генерацию текста. Таким образом, системы...
Расширенная сеть переходов (РСП) (калька с англ. Augmented transition network, или сокращенно — ATN) — технология грамматической и семантической обработки текстов предложенная американским лингвистом Вудсом. Расширенная сеть переходов представляет собой автомат, меняющий состояния при переходе от слова к слову в разбираемом предложении или тексте. Термин расширенная применительно к сетям переходов означает, что узлы сети наделены дополнительными условиями проверки, в которых могут содержаться различные...
Интерактивный машинный перевод (ИМП) — специальный подраздел области компьютерного перевода. При этом парадигма перевода в том, что компьютерное программное обеспечение помогает переводчику, пытаясь спрогнозировать текст, который пользователю пришлось бы вводить, учитывая всю информацию, которую он имеет в наличии. Когда такое предположение неправильно, система предоставляет пользователю обратную связь, а новое предсказание выполняется с учётом новой информации. Такой процесс повторяется до перевода...
Интеллектуальный анализ текстов (ИАТ, англ. text mining) — направление в искусственном интеллекте, целью которого является получение информации из коллекций текстовых документов, основываясь на применении эффективных в практическом плане методов машинного обучения и обработки естественного языка. Название «интеллектуальный анализ текстов» перекликается с понятием «интеллектуальный анализ данных» (ИАД, англ. data mining), что выражает схожесть их целей, подходов к переработке информации и сфер применения...
Грамматика ван Вейнгаардена (также вВ-грамматика или В-грамматика) — это двухуровневая грамматика, которая предоставляет способ определения потенциально бесконечных грамматик через конечное число правил. Формализм был изобретён Адрианом ван Вейнгаарденом для определения некоторых синтаксических ограничений, которые ранее должны были формулироваться на естественных языках, несмотря на свою принципиально синтаксическую сущность. Типичными применениями являются обработка рода и числа в естественных...
Юридический перевод — это перевод текстов, относящихся к области права и используемых для обмена юридической информацией между людьми, говорящими на разных языках. Поскольку право является предметной областью, связанной с социально-политическими и культурными особенностями страны, юридический перевод представляет собой непростую задачу. Для адекватной передачи юридической информации язык юридического перевода должен быть особо точным, ясным и достоверным.
Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники.
Нейронный машинный перевод (англ. Neural Machine Translation, NMT) — это подход к машинному переводу, в котором используется большая искусственная нейронная сеть. Он отличается от методов машинного перевода, основанных на статистике фраз, которые используют отдельно разработанные подкомпоненты.
Греклиш (англ. Greeklish, слияние слов Greek и English), также Grenglish и Латиноэллиника (греч. Λατινοελληνικά) — жаргонный, сетевой вариант греческого языка, заключающийся в записи слов греческого языка буквами латинского алфавита. Используется преимущественно при неофициальном общении в средах, где невозможно использование греческого алфавита (например, при общении в Интернете, на интернет-форумах, переписке при помощи электронной почты, SMS, программ мгновенного обмена сообщениями).
О ссылках между вики-проектами Фонда Викимедиа см. Википедия:Интервики.Интерви́ки (англ. interwiki) — средство организации ссылок между различными вики-системами в сети интернет. При её использовании можно избежать вставки в текст полного URL страницы, ограничившись внутренней ссылкой. При этом ссылка формируется следующим образом: префикс удалённой вики-системы + название страницы в удалённой вики.
Подробнее: Интервики
Фонети́ческий алфави́т ИКА́О , известный также как фонетический алфавит ITU, фонетический алфавит НАТО или международный радиотелефонный фонетический алфавит — наиболее широко используемый фонетический алфавит. Часто так называемые «фонетические алфавиты» являются на самом деле орфографическими алфавитами и не имеют никакой связи с фонетическими транскрипционными системами типа «Международный фонетический алфавит». Вместо этого в алфавите Международной организации гражданской авиации (ICAO (ИКАО...
Силе́зская пи́сьменность — варианты письменности с основой на латинской графике, применяемые для записи силезского языка/диалекта. В условиях отсутствия общепринятой письменной стандартной нормы и организации, ответственной за регулирование языковых норм, силезская письменность представляет собой несколько конкурирующих между собой орфографических систем, используемых в различных силезских сообществах и/или регионах.
Перевод медицинских текстов (медицинский перевод) — это перевод с одного языка на другой специализированных медицинских публикаций и текстов частного характера, содержание которых непосредственно связано со здоровьем человека. Особая позиция данной категории специализированных переводов определяется важностью любой переводимой информации, повышенным требованиям к точности перевода и соблюдению конфиденциальности частных сведений, а также ярко выраженной неоднородностью используемой терминологии...
Глосси́рование (англ. Interlinear gloss) — это способ оформления текста, предполагающий наличие кратких пояснений к нему, которые помещаются в строчке между оригинальным текстом (или его транслитерацией) и переводом. Глоссы используются для того, чтобы читателю было ясно, как именно соотносится текст и его перевод с точки зрения грамматики и семантики. Поморфемное глоссирование часто используется в лингвистических исследованиях (обычно в отношении текстов на малоизвестных языках), а также в учебных...
Двуязычный
словарь по традиции называется переводным. На протяжении веков перевод текстов был главным стимулом для создателей двуязычного словаря. Однако современные двуязычные словари становятся все более интегральными, включая синонимы и толкования, краткие сведения о реалиях и дополнительную грамматическую информацию о заглавном слове. С появлением электронной и кибернетической лексикографии возможности и перспективы двуязычного словаря могут оцениваться не только с позиции адекватности и полноты...
Си́мула -67 (Simula 67) — язык программирования общего назначения, разработанный в конце 60-х сотрудниками Норвежского Вычислительного Центра (Осло) Кристеном Нюгором и Оле-Йоханом Далем для моделирования сложных систем.
Машинный перевод на основе правил (Rule-Based Machine Translation) — общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках. Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим. На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода...
Интергло́сса (Interglossa) — международный вспомогательный язык, разработанный в 1943 году Ланселотом Хогбеном. Является предшественником языка глоса.
Сте́мминг — это процесс нахождения основы слова для заданного исходного слова. Основа слова не обязательно совпадает с морфологическим корнем слова.
ОСМО — язык программирования высокого уровня, использующий русскую лексику. Разработан в 1980-е годы в СССР . ОСМО сокращение от словосочетания: языковые Средства Общесистемного Математического Обеспечения систем обработки экономической информации (ОСМО СОЭИ). Язык разработан для решения задач систем обработки экономической информации. В ОСМО есть действия...
Глобиш (англ. Globish) — версия английского языка, разработанная вице-президентом по международному маркетингу компании IBM Жаном-Полем Нерьером на основе стандартной английской грамматики и лексикона в 1500 английских слов. По оценкам самого Нерьера, глобиш «сам по себе не является языком», но служит средством коммуникации в международном бизнесе для людей, не являющихся носителями английского языка.
РАПИРА — Расширенный Адаптированный Поплан-Интерпретатор, Редактор, Архив — процедурный язык программирования. Разработан в начале 1980-х годов в СССР в качестве средства перехода от более простых языков (в частности, учебного языка Робик) к языкам высокого уровня. Синтаксис построен на основе русской лексики. Язык использовался в школах для изучения информатики. Преподавание на Рапире велось в «Заочной школе программирования» в журнале «Квант» с начала 1980 года.
Лисп (LISP, от англ. LISt Processing language — «язык обработки списков»; современное написание: Lisp) — семейство языков программирования, программы и данные в которых представляются системами линейных списков символов. Лисп был создан Джоном Маккарти для работ по искусственному интеллекту и до сих пор остаётся одним из основных инструментальных средств в данной области. Применяется он и как средство обычного промышленного программирования, от встроенных скриптов до веб-приложений массового использования...
Язы́к разме́тки (текста) в компьютерной терминологии — набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении. Принадлежит классу компьютерных языков. Текстовый документ, написанный с использованием языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках — например, указание на заголовки, выделения, списки и т. д. В более сложных случаях язык разметки...
Форт (англ. Forth) — один из первых конкатенативных языков программирования, в котором программы записываются последовательностью лексем («слов» в терминологии языка Форт). Математические выражения представляются постфиксной записью при использовании стековой нотации. Поддерживает механизмы метарасширения семантики и синтаксиса языка для адаптации к нужной предметной области. Синтаксис базового уровня в Форте прост и состоит из единственного правила: «все определения разделяются пробелами». Определения...
Гомоикони́чность (гомоиконность, англ. homoiconicity, англ. homoiconic, от греч. ὁμός — равный, одинаковый + ср.-греч. εἰκόνα — «о́браз», «изображение») — свойство некоторых языков программирования, в которых структура программы похожа на его синтаксис, и поэтому внутреннее представление программы можно определить прочитав текстовую разметку. Если язык гомоиконичен, это означает, что текст программы имеет такую же структуру, как её абстрактное синтаксическое дерево (то есть AST и синтаксис являются...
А́да (Ada) — язык программирования, созданный в 1979—1980 годах в ходе проекта Министерством обороны США с целью разработать единый язык программирования для встроенных систем (то есть систем управления автоматизированными комплексами, функционирующими в реальном времени). Имелись в виду прежде всего бортовые системы управления военными объектами (кораблями, самолётами, танками, ракетами, снарядами и т. п.). Перед разработчиками не стояло задачи создать универсальный язык, поэтому решения, принятые...
Силе́зская орфогра́фия Pro Loquela Silesiana (оригинальное название «азбучное письмо»; сил. ślabikŏrzowy szrajbōnek) — один из вариантов орфографии силезского языка/диалекта, официально принятый сообществом Pro Loquela Silesiana в 2010 году в городе Цешин. Является одной из новейших систем силезской письменности. В её создании активное участие принимала профессор Силезского университета в Катовице И. Тамбор. Новая орфография ориентирована прежде всего на молодое поколение, изучающее силезский идиом...
Язык программи́рования — формальный язык, предназначенный для записи компьютерных программ. Язык программирования определяет набор лексических, синтаксических и семантических правил, определяющих внешний вид программы и действия, которые выполнит исполнитель (обычно — ЭВМ) под её управлением.
Корефере́нтность или референциональное тождество — отношение между именами — компонентами высказывания, в котором имена ссылаются на один и тот же объект (ситуацию) внеязыковой действительности (референт).
Нормати́вный контро́ль в библиотечном деле — организация библиотечных каталогов и библиографической информации путём присвоения каждой теме определённого названия. Такие уникальные заголовки последовательно используются в каталоге и работают вместе с другими организационными данными, например, перекрёстными ссылками. Каждый заголовок имеет краткое описание пределов применимости и использования, такая организация помогает персоналу библиотек поддерживать каталог в актуальном состоянии и упрощает работу...
Нейронный машинный перевод Google (GNMT) — это система нейронного машинного перевода (NMT), разработанная компанией Google и представленная в ноябре 2016 года, которая использует искусственную нейронную сеть для повышения беглости и точности перевода в Google Переводчике.GNMT улучшает качество перевода, применяя метод машинного перевода на основе примеров (EBMT), в котором система “обучается на миллионах примеров”. Предлагаемая архитектура системного обучения GNMT была впервые опробована на более...
Пи́сьменность — знаковая система, предназначенная для формализации, фиксации и передачи тех или иных данных (речевой информации и других элементов смысла безотносительно к их языковой форме) на расстоянии и придания этим данным вневременного характера. Письменность — одна из форм существования человеческого языка.