Связанные понятия
Избыточность языка — статистическая величина, обозначающая избыточность информации, содержащейся в тексте на определённом языке.
Корефере́нтность или референциональное тождество — отношение между именами — компонентами высказывания, в котором имена ссылаются на один и тот же объект (ситуацию) внеязыковой действительности (референт).
Глагольной группой (ГГ, англ. Verb phrase, VP) в лингвистике называют синтаксическую единицу, состоящую из по меньшей мере одного глагола и его зависимых, таких как дополнения, комплементы и другие модификаторы. Исключение составляет подлежащее, не входящее в состав глагольной группы. Так, в предложении Толстый мужчина быстро положил бриллианты в коробку слова быстро положил бриллианты в коробку могут считаться глагольной группой, состоящей из глагола положил и его зависимых, но не включающей в себя...
Подробнее: Глагольная группа
Грамматика составляющих (метод составляющих; англ. constituency grammar, phrase structure grammar) основана на постулате, согласно которому всякая сложная грамматическая единица складывается из двух более простых и не пересекающихся единиц, называемых её непосредственными составляющими (англ. immediate constituent).
Синхронный автоматический перевод (Speech-to-Speech Real-Time Translation) — «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Ана́фора (от греч. ἀναφέρειν — относить назад, возводить к чему-либо, возвращать) — лингвистическое явление, зависимость интерпретации некоторого выражения от другого выражения, обычно ранее встречавшегося в тексте. Это определяющее выражение называется антецедент (если оно появляется до анафорического выражения) или постцедент (если появляется после).
Гибридный машинный перевод (Hybrid machine translation — HMT) — интеграция разных подходов машинного перевода из возможных вариантов МП...
Расширенная форма Бэкуса — Наура (расширенная Бэкус — Наурова форма (РБНФ)) (англ. Extended Backus–Naur Form (EBNF)) — формальная система определения синтаксиса, в которой одни синтаксические категории последовательно определяются через другие. Используется для описания контекстно-свободных формальных грамматик. Предложена Никлаусом Виртом. Является расширенной переработкой форм Бэкуса — Наура, отличается от БНФ более «ёмкими» конструкциями, позволяющими при той же выразительной способности упростить...
В информатике
лексический анализ («токенизация», от англ. tokenizing) — процесс аналитического разбора входной последовательности символов на распознанные группы — лексемы, с целью получения на выходе идентифицированных последовательностей, называемых «токенами» (подобно группировке букв в словах). В простых случаях понятия «лексема» и «токен» идентичны, но более сложные токенизаторы дополнительно классифицируют лексемы по различным типам («идентификатор, оператор», «часть речи» и т. п.). Лексический...
Вале́нтность (от лат. valentia/ valens (род.п. valentis) — «имеющий силу») в синтаксисе — способность слова вступать в синтаксические связи с другими элементами, наприм., валентности глагола дать определяют способность сочетаться с подлежащим, прямым дополнением, косвенным дополнением: Я даю ему книгу.
Формальная грамматика или просто грамматика в теории формальных языков — способ описания формального языка, то есть выделения некоторого подмножества из множества всех слов некоторого конечного алфавита. Различают порождающие и распознающие (или аналитические) грамматики — первые задают правила, с помощью которых можно построить любое слово языка, а вторые позволяют по данному слову определить, входит ли оно в язык или нет.
Индукция грамматики (или грамматический вывод) — это процесс в машинном обучении для обучения формальной грамматике (обычно в виде набора правил вывода или порождающих правил или, альтернативно, как конечный автомат или автомат другого вида) из набора наблюдений, то есть построение модели, которая описывает наблюдаемые объекты. Более обще, грамматический вывод — это такая ветвь машинного обучения, в которой пространство примеров состоит из дискретных комбинаторных объектов, таких как строки, деревья...
Де́йксис (др.-греч. δεῖξις — указание) в лингвистике — указание как значение или функция языковой единицы, выражается лексическими и грамматическими средствами.
Сте́мминг — это процесс нахождения основы слова для заданного исходного слова. Основа слова не обязательно совпадает с морфологическим корнем слова.
Сочета́емость — свойство языковых единиц сочетаться в речи при образовании единиц более высокого уровня, отражающее синтагматические отношения между ними. Сочетаемость является одним из фундаментальных свойств единиц языка.
Контекстно-свободная грамматика (КС-грамматика, бесконтекстная грамматика) — частный случай формальной грамматики (тип 2 по иерархии Хомского), у которой левые части всех продукций являются одиночными нетерминалами (объектами, обозначающими какую-либо сущность языка (например: формула, арифметическое выражение, команда) и не имеющими конкретного символьного значения). Смысл термина «контекстно-свободная» заключается в том, что есть возможность применить продукцию к нетерминалу, причём независимо...
Графическая система в узком смысле — инвентарь общеобязательных графем, используемых в некоторой письменной традиции. В широком смысле — этот же инвентарь и так называемое базисное соответствие между графемами и фонемами.
Форма Бэкуса — Наура (сокр. БНФ, Бэкуса — Наура форма) — формальная система описания синтаксиса, в которой одни синтаксические категории последовательно определяются через другие категории. БНФ используется для описания контекстно-свободных формальных грамматик. Существует расширенная форма Бэкуса — Наура, отличающаяся лишь более ёмкими конструкциями.
Отображение онтологий (англ. ontology alignment или ontology matching) — это процесс установления соответствий между понятиями (концептами) нескольких онтологий. Множество таких соответствий и называется «отображением». Термин имеет разное значение в компьютерной, когнитивной областях и философии.
Комплетив — аспектуальное значение глагола, обозначающее достижение финала предельного процесса. В работе Bybee et al. комплетиву дается следующее определение: «сделать что-то основательно, вплоть до завершения».
Едини́ца языка ́ — элемент системы языка, неразложимый в рамках определённого уровня членения текста и противопоставленный другим единицам в подсистеме языка, соответствующей этому уровню. Может быть разложима на единицы низшего уровня.
Дистрибути́вная сема́нтика — это область лингвистики, которая занимается вычислением степени семантической близости между лингвистическими единицами на основании их распределения (дистрибуции) в больших массивах лингвистических данных (текстовых корпусах).
Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.
Маши́нный перево́д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.
Аппликати́в (лат. applicatus «примыкающий, присоединяющийся» от гл. applicare) — повышающая актантная деривация, при которой у описываемой глаголом ситуации появляется новый обязательный участник, который раньше был периферийным. Во многих языках аппликатив имеет морфологическое выражение: глагол присоединяет особый аффикс, который показывает, что валентность глагола возросла на один аргумент. Новый обязательный участник может играть различные семантические роли: бенефактива, адресата, экспериенцера...
Метаязы́к — язык, предназначенный для описания другого языка, называемого объектным языком.
Предика́т (лат. praedicatum «сказанное») в логике и лингвистике — сказуемое суждения, то, что высказывается (утверждается или отрицается) о субъекте. Предикат находится с субъектом в предикативном отношении и показывает наличие (отсутствие) у предмета некоторого признака.
Алгоритм Леска — классический алгоритм разрешения лексической многозначности, основанный на знаниях, предложенный Майклом Леском в 1986 году.
Рефере́нт (от лат. referens — относящий, сопоставляющий) — объект внеязыковой действительности, подразумеваемый автором конкретного речевого отрезка; предмет референции. Референт некоторого речевого отрезка может принадлежать не только реальному миру, но и воображаемому, например, быть персонажем художественного произведения.
Синтакси́ческий ана́лиз (или разбор, жарг. па́рсинг ← англ. parsing) в лингвистике и информатике — процесс сопоставления линейной последовательности лексем (слов, токенов) естественного или формального языка с его формальной грамматикой. Результатом обычно является дерево разбора (синтаксическое дерево). Обычно применяется совместно с лексическим анализом.
Лаадан — феминистический искусственный язык, созданный Сьюзет Хейден Элджин в 1982 году для проверки гипотезы Сепира — Уорфа, в частности — чтобы выяснить, сможет ли язык, нацеленный на выражение мыслей женщины, сформировать культуру; также рассматривалась теория о том, что западные естественные языки более приспособлены для выражения мыслей мужчин, чем женщин. Лаадан фигурировал в романе Элджин Native Tongue. Лаадан содержит слова для устранения двусмысленности высказываний, повествующих о чувствах...
Минимали́стская програ́мма — лингвистическая теория, предложенная американским лингвистом Н. Хомским для объяснения тех языковых феноменов, механизмы которых не были прояснены полностью в рамках теории принципов и параметров. Сама Минималистская программа содержит ряд сильных утверждений, касающихся универсальной грамматики, а также некоторые гипотезы об устройстве когнитивной системы в связи с врождённой языковой способностью. Главным методологическим принципом Минималистской программы является...
Ле́йпцигские пра́вила глосси́рования (англ. Leipzig glossing rules) — предложенный для унифицированного использования при представлении языковых примеров в лингвистических работах набор правил глоссирования (поморфемной нотации). Включает как собственно правила оформления интерлинеарных глосс, так и список рекомендуемых сокращений (грамматических помет, «ярлыков»), используемых для обозначения грамматических категорий.
Словообразова́ние неме́цкого языка́ — это раздел немецкого языкознания, изучающий структуру слов и законы их образования, опираясь на модельный аппарат. Последний является классификацией всех известных способов словопроизводства, включающих наиболее общие признаки (наличие или отсутствие словообразовательных аффиксов, морфолого-синтаксический метод как способ образования новых лексем и т. д.).
Высказывание — речевое произведение, созданное в ходе конкретного речевого акта. Рассматривается в контексте этого речевого акта как часть дискурса (текста).
Генерати́вная лингви́стика (трансформационная порождающая грамматика, трансформационно-генеративная грамматика, хомскианская лингвистика, генеративизм) — направление в современном мировом языкознании, получило распространение с конца 1950-х годов, основоположник — Ноам Хомский (США). В 1960—1990-е годы генеративизм являлся наиболее влиятельным подходом в лингвистике.
Усвое́ние языка ́ — процесс обучения человека языку, исследуемый лингвистами. Обычно фраза обозначает усвоение родного языка ребёнком, в противовес термину усвоение второго языка, под которым понимается процесс приобретения навыков общения на новом иностранном языке, независимо от числа ранее выученных.
Дифференцированное маркирование объекта , или вариативное маркирование дополнения (используется также сокращение DOM от англ. Differential Object Marking) — широко распространенный в языках мира феномен, когда выбор морфосинтаксического оформления объекта определяется значением одного или нескольких признаков объектной именной группы или глагольной группы в целом.
В лингвистике кóрпус (в данном значении множественное число — кóрпусы, не корпусá) — подобранная и обработанная по определённым правилам совокупность текстов, используемых в качестве базы для исследования языка. Они используются для статистического анализа и проверки статистических гипотез, подтверждения лингвистических правил в данном языке.
Подробнее: Корпус текстов
Двойное маркирование — способ кодирования синтаксических отношений, при котором грамматические показатели связи помещаются как на главный, так и на зависимый элемент отношения.
Лексическая типология , или лексико-семантическая типология, — раздел лингвистической типологии, изучающий разнообразие семантики лексических единиц в языках мира.
Теория оптимальности (ОТ) — лингвистическая теория, предложенная в начале 90-х годов 20-го века П. Смоленским, А. Принсом, Дж. Маккарти и др. Теория оптимальности возникла в рамках фонологии, однако вскоре нашла применение и в других областях лингвистики. ОТ обычно рассматривается как направление в рамках генеративной лингвистики, предметом которой является исследование универсальных принципов языка, лингвистической типологии, механизмов усвоения языка, порождения и восприятия речи. ОТ часто называют...
Идиома программирования — устойчивый способ выражения некоторой составной конструкции в одном или нескольких языках программирования. Идиома является шаблоном решения задачи, записи алгоритма или структуры данных путём комбинирования встроенных элементов языка.
Фини́тность — одна из важнейших и вместе с тем трудных для определения лингвистических категорий. Часто определяется как способность глагола приписывать падеж субъекту предложения и иметь показатели согласования, однако данное определение касается только синтаксической стороны вопроса. Что же касается семантической части, что иногда утверждается, что понятие финитности тождественно понятию предикативности, или сказуемости. В целом, признаётся, что данное понятие довольно сложно сформулировать: как...
Активный язык (фиентивный строй, активная типология, активность; лат. activus — деятельный, действенный) — язык, обладающий типологией, ориентированной на семантическое противопоставление не субъекта и объекта, как в языках номинативного строя, а так называемого активного и инактивного начал.
Подробнее: Активные языки
Глубинная структура (в генеративной лингвистике) — способ представления предложения. Глубинная структура позволяет отразить смысловую близость ряда предложений, которые содержат одни и те же лексические единицы и отличаются друг от друга только некоторыми грамматическими значениями. Так, например, единая глубинная структура постулировалась для предложений «Бобры строят плотины» и «Плотины строятся бобрами». Глубинная структура формально изображается в виде так называемого дерева составляющих, либо...
Синтаксическая диаграмма — это направленный граф с одним входным ребром и одним выходным ребром и помеченными вершинами. Синтаксическая диаграмма задаёт язык. Цепочка пометок при вершинах на любом пути от входного ребра к выходному — это цепочка языка, задаваемого синтаксической диаграммой. Поэтому можно считать, что синтаксическая диаграмма — это одна из форм порождающей грамматики автоматных языков. Синтаксические диаграммы и конечные автоматы имеют тесную связь: любой автоматный язык задаётся...
Акта́нт (фр. actant — «действующий») в лингвистике — активный, значимый участник ситуации, речевая конструкция, заполняющая семантическую или синтаксическую валентность предиката. Актант, как правило, обязательно сопровождает предикат; его опущение возможно только в ограниченных случаях и подчиняется специальным правилам. Противопоставлен сирконстанту как необязательному участнику ситуации. Термин введён в обиход французским лингвистом Л. Теньером в 1930—50-х гг. для уточнения традиционных понятий...