Связанные понятия
Трансдукция — один из видов языковой трансформации, при котором происходит перекодирование исходного текста на одном языке и генерирование вторичного текста на другом языке, которые, в отличие от традиционного перевода, производятся при условии отхода от сигнификативного прагматического значения исходного текста и сохранения денотативного значения всей информации. Трансдукция лежит в основе реферативного перевода.
Машинный перевод на основе трансформации является разновидностью машинного перевода (MП). В настоящее время это один из наиболее распространённых методов машинного перевода. В отличие от более простой модели прямого MП, MП на основе трансформации разделяет процесс перевод на три этапа: анализ текста на исходном языке для определения его грамматической структуры, перевод результирующей структуры в структуру, подходящую для производства текста на языке перевода, и генерацию текста. Таким образом, системы...
Двуязычный
словарь по традиции называется переводным. На протяжении веков перевод текстов был главным стимулом для создателей двуязычного словаря. Однако современные двуязычные словари становятся все более интегральными, включая синонимы и толкования, краткие сведения о реалиях и дополнительную грамматическую информацию о заглавном слове. С появлением электронной и кибернетической лексикографии возможности и перспективы двуязычного словаря могут оцениваться не только с позиции адекватности и полноты...
Компью́терная лексикогра́фия — прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей. Это временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям.
Динамическая и формальная эквивалентность (термин ввёл Юджин Найда) — это два различных подхода к переводу, которые помогают избежать буквализмов из текста оригинала в тексте перевода, что наблюдалось в переводах Библии.
Машинный перевод на основе правил (Rule-Based Machine Translation) — общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках. Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим. На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода...
Синхронный автоматический перевод (Speech-to-Speech Real-Time Translation) — «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Машинный перевод на основе примеров (англ. Example-based machine translation, EBMT) — это метод машинного перевода, который часто характеризуется использованием двуязычного корпуса с параллельными текстами в качестве основной базы знаний во время выполнения перевода. По сути, это перевод по аналогии, который может рассматриваться как применение метода рассуждений на основе прецедентов к машинному обучению.
Теория «Смысл — текст» (название более точно записывается как «теория „Смысл ⇔ Текст“») — лингвистическая концепция, созданная И. А. Мельчуком и представляющая язык как многоуровневую модель преобразований смысла в текст и обратно (модель «Смысл ⇔ Текст»); отличительной особенностью этой теории является также использование синтаксиса зависимостей. Значительна роль, отводимая лексическому компоненту модели — Толково-комбинаторному словарю.
Ана́лиз тона́льности те́кста (сентимент-анализ, англ. Sentiment analysis, англ. Opinion mining) — класс методов контент-анализа в компьютерной лингвистике, предназначенный для автоматизированного выявления в текстах эмоционально окрашенной лексики и эмоциональной оценки авторов (мнений) по отношению к объектам, речь о которых идёт в тексте.
О термине из программирования см. Зарезервированное слово.Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми словами дать высокоуровневое описание содержания текстового документа, позволяющее выявить его тематику. В вебе используется главным образом для поиска.
Подробнее: Ключевое слово
Креолизованный текст — текст, фактура которого состоит из двух разнородных частей: вербальной (языковой/речевой) и невербальной (принадлежащей к другим знаковым системам, нежели естественный язык). Примеры креолизованных текстов — тексты рекламы, комиксы, афиши, плакаты.
Семанти́ческий ана́лиз — этап в последовательности действий алгоритма автоматического понимания текстов, заключающийся в выделении семантических отношений, формировании семантического представления текстов. Один из возможных вариантов представления семантического представления — структура, состоящая из «текстовых фактов». Семантический анализ в рамках одного предложения называется локальным семантическим анализом.
Авторове́дческая эксперти́за — исследование текста (чаще всего — печатного) с целью установления авторства (атрибуция произведения) или получения каких-либо сведений об авторе и условиях создания текстового документа.
Системно-функциональная лингвистика (СФЛ) - это подход к лингвистике, рассматривающий язык как социальную семиотическую систему. Данный подход был разработан Майклом Халлидеем, который перенял понятие системы от своего учителя, Дж. Р. Ферса. В то время как Ферс считал, что системы ссылались на возможности, подчиненные структуре, Халлидей в некотором смысле «освободил» сферу выбора от структуры и сделал выбор основополагающим понятием своей теории. Другими словами, в то время как многие подходы к...
Автоматизи́рованный перево́д (АП, англ. Computer-Aided Translation) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.
В лингвистике кóрпус (в данном значении множественное число — кóрпусы, не корпусá) — подобранная и обработанная по определённым правилам совокупность текстов, используемых в качестве базы для исследования языка. Они используются для статистического анализа и проверки статистических гипотез, подтверждения лингвистических правил в данном языке.
Подробнее: Корпус текстов
Экспертиза перевода — это систематическое изучение, экспертное оценивание и интерпретация различных аспектов переведенных работ. Она представляет собой междисциплинарную научную область, тесно связанную с литературной критикой и переводоведением. Экспертиза перевода включает в себя проверку и оценку студенческих переводов, а также проверку опубликованных переводов.
Глосси́рование (англ. Interlinear gloss) — это способ оформления текста, предполагающий наличие кратких пояснений к нему, которые помещаются в строчке между оригинальным текстом (или его транслитерацией) и переводом. Глоссы используются для того, чтобы читателю было ясно, как именно соотносится текст и его перевод с точки зрения грамматики и семантики. Поморфемное глоссирование часто используется в лингвистических исследованиях (обычно в отношении текстов на малоизвестных языках), а также в учебных...
Корефере́нтность или референциональное тождество — отношение между именами — компонентами высказывания, в котором имена ссылаются на один и тот же объект (ситуацию) внеязыковой действительности (референт).
Выделение знаний (англ. Knowledge extraction) — это создание знаний из структурированных (реляционных баз данных, XML) и неструктурированных источников (тексты, документы, изображения). Полученное знание должно иметь формат, позволяющий компьютерный ввод, и должно представлять знания так, чтобы облегчить логические выводы. Хотя по методике процесс подобен извлечению информации (обработке естественного языка, англ. Natural language processing, NLP) и процессу «Извлечения, Преобразования, Загрузки...
Ле́йпцигские пра́вила глосси́рования (англ. Leipzig glossing rules) — предложенный для унифицированного использования при представлении языковых примеров в лингвистических работах набор правил глоссирования (поморфемной нотации). Включает как собственно правила оформления интерлинеарных глосс, так и список рекомендуемых сокращений (грамматических помет, «ярлыков»), используемых для обозначения грамматических категорий.
Рефера́т (нем. Referat от лат. referre «докладывать, сообщать») — краткий доклад по определённой теме, в котором собрана информация из одного или нескольких источников. Рефераты могут являться изложением содержания научной работы, статьи и т. п.
Расширенная сеть переходов (РСП) (калька с англ. Augmented transition network, или сокращенно — ATN) — технология грамматической и семантической обработки текстов предложенная американским лингвистом Вудсом. Расширенная сеть переходов представляет собой автомат, меняющий состояния при переходе от слова к слову в разбираемом предложении или тексте. Термин расширенная применительно к сетям переходов означает, что узлы сети наделены дополнительными условиями проверки, в которых могут содержаться различные...
«Синтакси́ческие структу́ры » (англ. Syntactic Structures) — лингвистическая работа, выпущенная Н. Хомским в 1957 году. Наряду с другими работами Н. Хомского, книга заложила основы теории порождающих грамматик и теории формальных языков. Год выхода работы в свет принято считать отправной точкой генеративной лингвистики:311. Выход в свет «Синтаксических структур» привёл к возникновению когнитивной науки:15.
Нау́чный стиль — функциональный стиль речи литературного языка, которому присущ ряд особенностей: предварительное обдумывание высказывания, монологический характер, строгий отбор языковых средств, тяготение к нормированной речи.
Пролог (англ. Prolog) — язык и система логического программирования, основанные на языке предикатов математической логики дизъюнктов Хорна, представляющей собой подмножество логики предикатов первого порядка.
Чте́ние — сложный когнитивный процесс декодирования символов, направленный на понимание текста. Одно из средств усвоения языка, общения, обмена информацией и идеями. Представляет собой сложное взаимодействие между текстом и читателем, формируемое на основе предварительных знаний, опыта и отношения читателя с языковой общностью, обусловленное культурно и социально. Кроме того, чтение требует творческого подхода и критического анализа. Каких-либо законов в чтении нет, читателя в чтении ничего не ограничивает...
Интеллектуальный анализ текстов (ИАТ, англ. text mining) — направление в искусственном интеллекте, целью которого является получение информации из коллекций текстовых документов, основываясь на применении эффективных в практическом плане методов машинного обучения и обработки естественного языка. Название «интеллектуальный анализ текстов» перекликается с понятием «интеллектуальный анализ данных» (ИАД, англ. data mining), что выражает схожесть их целей, подходов к переработке информации и сфер применения...
Теза́урус (от греч. θησαυρός «сокровище»), в общем смысле — специальная терминология, более строго и предметно — словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации (пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией); в современной лингвистике — особая разновидность словарей, в которых указаны...
Си́нтаксис (др.-греч. σύν-ταξις — составление) — раздел лингвистики, изучающий строение и функциональное взаимодействие различных частей речи в предложениях, словосочетаниях и пр. языковых единицах. Является составной частью грамматики. Исследуемые в рамках синтаксиса вопросы тесно соприкасаются с областью изучения морфологии.
Маши́нный перево́д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.
Коммента́рии — пояснения к исходному тексту программы, находящиеся непосредственно внутри комментируемого кода. Синтаксис комментариев определяется языком программирования. С точки зрения компилятора или интерпретатора, комментарии — часть текста программы, не влияющая на её семантику. Комментарии не оказывают никакого влияния на результат компиляции программы или её интерпретацию. Помимо исходных текстов программ, комментарии также применяются в языках разметки и языках описания.
Контроли́руемый язы́к (упрощённый естественный язык, англ. controlled natural language, CNL) — ограниченная версия естественного языка, созданная для выполнения определённых задач. Контролируемый язык — это подвид естественного языка, полученный ограничением в использовании грамматики, терминологии и речевых оборотов посредством регламентирующих правил с тем, чтобы снизить или искоренить его многозначность и сложность.
Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.
Разрешение лексической многозначности (word sense disambiguation, WSD) — это неразрешенная проблема обработки естественного языка, которая заключается в задаче выбора значения (или смысла) многозначного слова или словосочетания в зависимости от контекста, в котором оно находится. Данная задача возникает в дискурсивном анализе, при оптимизации релевантности результатов поисковыми системами, при разрешении анафорических отсылок, в исследовании лингвистической когерентность текста, при анализе умозаключений...
Грамматика ван Вейнгаардена (также вВ-грамматика или В-грамматика) — это двухуровневая грамматика, которая предоставляет способ определения потенциально бесконечных грамматик через конечное число правил. Формализм был изобретён Адрианом ван Вейнгаарденом для определения некоторых синтаксических ограничений, которые ранее должны были формулироваться на естественных языках, несмотря на свою принципиально синтаксическую сущность. Типичными применениями являются обработка рода и числа в естественных...
Петербу́ргская шко́ла функциона́льной грамма́тики (ПШФГ) — направление функциональной грамматики, ориентированное на описание системы семантических категорий в их языковом выражении, центром разработки которого с начала 1990-х годов является Отдел теории грамматики Института лингвистических исследований РАН.
Юридический перевод — это перевод текстов, относящихся к области права и используемых для обмена юридической информацией между людьми, говорящими на разных языках. Поскольку право является предметной областью, связанной с социально-политическими и культурными особенностями страны, юридический перевод представляет собой непростую задачу. Для адекватной передачи юридической информации язык юридического перевода должен быть особо точным, ясным и достоверным.
Универсальная грамматика — термин, которым в ряде лингвистических теорий обозначается предполагаемый набор правил или принципов, присущих каждому человеческому языку. Подобные правила не определяют язык полностью: они допускают значительную вариантность, но ограничивают её некоторыми конечными рамками. В современной когнитивной науке универсальная грамматика понимается как встроенное на генетическом уровне знание о языке.
Дескри́птор (от лат. descriptor «описывающий») — лексическая единица (слово, словосочетание) информационно-поискового языка, служащая для описания основного смыслового содержания документа или формулировки запроса при поиске документа (информации) в информационно-поисковой системе. Дескриптор однозначно ставится в соответствие группе ключевых слов естественного языка, отобранных из текста, относящегося к определённой области знаний.
Терминове́дение (терминология — устар.) — наука, изучающая специальную лексику с точки зрения её типологии, происхождения, формы, содержания (значения) и функционирования, а также использования, упорядочения и создания.
Интертекст — соотношение одного текста с другим, диалогическое взаимодействие текстов, обеспечивающее превращение смысла в заданный автором. Основной вид и способ построения художественного текста в искусстве модернизма и постмодернизма, состоящий в том, что текст строится из цитат и реминисценций к другим текстам.
Сема́нтика (от др.-греч. σημαντικός «обозначающий») — раздел лингвистики, изучающий смысловое значение единиц языка.
Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путём индексирования) по запросу пользователя.
Минимали́стская програ́мма — лингвистическая теория, предложенная американским лингвистом Н. Хомским для объяснения тех языковых феноменов, механизмы которых не были прояснены полностью в рамках теории принципов и параметров. Сама Минималистская программа содержит ряд сильных утверждений, касающихся универсальной грамматики, а также некоторые гипотезы об устройстве когнитивной системы в связи с врождённой языковой способностью. Главным методологическим принципом Минималистской программы является...
Сема́нтика в программировании — дисциплина, изучающая формализации значений конструкций языков программирования посредством построения их формальных математических моделей. В качестве инструментов построения таких моделей могут использоваться различные средства, например, математическая логика, λ-исчисление, теория множеств, теория категорий, теория моделей, универсальная алгебра. Формализация семантики языка программирования может использоваться как для описания языка, определения свойств языка...
Алгоритм Леска — классический алгоритм разрешения лексической многозначности, основанный на знаниях, предложенный Майклом Леском в 1986 году.
Перевод медицинских текстов (медицинский перевод) — это перевод с одного языка на другой специализированных медицинских публикаций и текстов частного характера, содержание которых непосредственно связано со здоровьем человека. Особая позиция данной категории специализированных переводов определяется важностью любой переводимой информации, повышенным требованиям к точности перевода и соблюдению конфиденциальности частных сведений, а также ярко выраженной неоднородностью используемой терминологии...