Понятия со словом «пословно»

Связанные понятия

Абза́ц (нем. Absatz «раздел, часть текста») — отрезок письменной речи, состоящий из одного или нескольких предложений.
Абстрактное синтаксическое дерево (АСД) — в информатике конечное помеченное ориентированное дерево, в котором внутренние вершины сопоставлены (помечены) с операторами языка программирования, а листья — с соответствующими операндами. Таким образом, листья являются пустыми операторами и представляют только переменные и константы.
Амперса́нд (иногда — амперсе́нд; англ. ampersand) — знак &. Он является логограммой, заменяющей союз «и», и возник как лигатура букв et (с лат. — «и»).
Ана́фора (от греч. ἀναφέρειν — относить назад, возводить к чему-либо, возвращать) — лингвистическое явление, зависимость интерпретации некоторого выражения от другого выражения, обычно ранее встречавшегося в тексте. Это определяющее выражение называется антецедент (если оно появляется до анафорического выражения) или постцедент (если появляется после).
Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.
Вертика́льная черта́ — символ ASCII, имеющий код 0x7C (hex), 124 (dec). Этот символ пользователи UNIX называют «пайп», от англ. pipeline — конвейер. В первых, ещё советских, изданиях книг В. Э. Фигурнова название «pipe» было переведено как «символ трубопровода».
Вока́була (от лат. vocabulum «слово, имя, название») — отдельно взятое слово для заучивания наизусть при первоначальном обучении языкам; в заголовке словарной статьи — основное определяющее слово или словосочетание, выделенное полужирным шрифтом с указанием ударения; предмет изучения в лексикологии и лексикографии.
Выразительность языка программирования — качество языка, показывающее, насколько разнообразны идеи, которые можно реализовать на этом языке, и насколько легко они читаются.
Глосса́рий (лат. glossarium «собрание глосс») — словарь узкоспециализированных терминов в какой-либо отрасли знаний с толкованием, иногда переводом на другой язык, комментариями и примерами. Собрание глосс (иноязычных или непонятных слов в тексте книги с толкованием) и собственно глоссарии стали предшественниками словаря.
Гомоикони́чность (гомоиконность, англ. homoiconicity, англ. homoiconic, от греч. ὁμός — равный, одинаковый + ср.-греч. εἰκόνα — «о́браз», «изображение») — свойство некоторых языков программирования, в которых структура программы похожа на его синтаксис, и поэтому внутреннее представление программы можно определить прочитав текстовую разметку. Если язык гомоиконичен, это означает, что текст программы имеет такую же структуру, как её абстрактное синтаксическое дерево (то есть AST и синтаксис являются...
Индукция грамматики (или грамматический вывод) — это процесс в машинном обучении для обучения формальной грамматике (обычно в виде набора правил вывода или порождающих правил или, альтернативно, как конечный автомат или автомат другого вида) из набора наблюдений, то есть построение модели, которая описывает наблюдаемые объекты. Более обще, грамматический вывод — это такая ветвь машинного обучения, в которой пространство примеров состоит из дискретных комбинаторных объектов, таких как строки, деревья...
Графическая система в узком смысле — инвентарь общеобязательных графем, используемых в некоторой письменной традиции. В широком смысле — этот же инвентарь и так называемое базисное соответствие между графемами и фонемами.
Знак ударе́ния (◌́) — небуквенный орфографический знак русской, украинской и некоторых других письменностей; по другой терминологии — один из надстрочных диакритических знаков. Ставится над гласной буквой (А́а́, Е́е́, И́и́, О́о́, У́у́, Ы́ы́, Э́э́, Ю́ю́, Я́я́), соответствующей ударному звуку (ударному слогу).
Зна́ки препина́ния — элементы письменности, выполняющие вспомогательные функции разделения (выделения) смысловых отрезков текста, предложений, словосочетаний, слов, частей слова, указания на грамматические и логические отношения между словами, указания на коммуникативный тип предложения, его эмоциональную окраску, законченность, а также некоторые иные функции.
Избыточность языка — статистическая величина, обозначающая избыточность информации, содержащейся в тексте на определённом языке.
Ифку́иль (ифк. Iţkuîl), также Ыфкуил или Илакш — искусственный язык философского направления. Обладает крайней сложностью грамматики и огромным набором фонем, что делает язык весьма трудным для изучения.
Кавы́чки — парный знак препинания, который употребляется для выделения прямой речи, цитат, отсылок, названий предприятий, литературных произведений, газет, журналов, а также отдельных слов, если они включаются в текст не в своём обычном значении, используются в ироническом смысле, предлагаются впервые или, наоборот, как устаревшие и тому подобное.
Кернинг (англ. kerning) при наборе текста — избирательное изменение интервала между буквами в зависимости от их формы.
Компью́терная лексикогра́фия — прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей. Это временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям.
Контекстно-свободная грамматика (КС-грамматика, бесконтекстная грамматика) — частный случай формальной грамматики (тип 2 по иерархии Хомского), у которой левые части всех продукций являются одиночными нетерминалами (объектами, обозначающими какую-либо сущность языка (например: формула, арифметическое выражение, команда) и не имеющими конкретного символьного значения). Смысл термина «контекстно-свободная» заключается в том, что есть возможность применить продукцию к нетерминалу, причём независимо...
Корефере́нтность или референциональное тождество — отношение между именами — компонентами высказывания, в котором имена ссылаются на один и тот же объект (ситуацию) внеязыковой действительности (референт).
В лингвистике кóрпус (в данном значении множественное число — кóрпусы, не корпусá) — подобранная и обработанная по определённым правилам совокупность текстов, используемых в качестве базы для исследования языка. Они используются для статистического анализа и проверки статистических гипотез, подтверждения лингвистических правил в данном языке.

Подробнее: Корпус текстов
Ле́йпцигские пра́вила глосси́рования (англ. Leipzig glossing rules) — предложенный для унифицированного использования при представлении языковых примеров в лингвистических работах набор правил глоссирования (поморфемной нотации). Включает как собственно правила оформления интерлинеарных глосс, так и список рекомендуемых сокращений (грамматических помет, «ярлыков»), используемых для обозначения грамматических категорий.
В информатике лексический анализ («токенизация», от англ. tokenizing) — процесс аналитического разбора входной последовательности символов на распознанные группы — лексемы, с целью получения на выходе идентифицированных последовательностей, называемых «токенами» (подобно группировке букв в словах). В простых случаях понятия «лексема» и «токен» идентичны, но более сложные токенизаторы дополнительно классифицируют лексемы по различным типам («идентификатор, оператор», «часть речи» и т. п.). Лексический...
Машинный перевод на основе примеров (англ. Example-based machine translation, EBMT) — это метод машинного перевода, который часто характеризуется использованием двуязычного корпуса с параллельными текстами в качестве основной базы знаний во время выполнения перевода. По сути, это перевод по аналогии, который может рассматриваться как применение метода рассуждений на основе прецедентов к машинному обучению.
Метаязы́к — язык, предназначенный для описания другого языка, называемого объектным языком.
Алгоритм Леска — классический алгоритм разрешения лексической многозначности, основанный на знаниях, предложенный Майклом Леском в 1986 году.
Многопроходный компилятор (англ. Multi-pass compiler) — тип компилятора, который обрабатывает исходный код или абстрактное синтаксическое дерево программы несколько раз (в отличие от однопроходного компилятора, который проходит программу только один раз). Между проходами генерируется промежуточный код, который принимается следующим проходом в качестве входа. Таким образом, многопроходный компилятор обрабатывает код по частям, проход за проходом, а последний проход выдает финальный результат программы...
Названия букв русского алфавита — имена, которыми называются буквы русского алфавита. С течением времени названия букв претерпели изменения, названия заменялись, упрощались и изменялись в произношении. Как части речи современные названия букв русского алфавита представляют собой имена существительные, род которых — средний:68. Например, говорится: строчное а.
Нигханту (Nighaṇṭu IAST, санскр. निघण्टु) — древнеиндийский трактат, наиболее известный глоссарий к священным гимнам Ригведы.
Окуригана (яп. 送り仮名, букв. «сопровождающая кана») — суффиксы в виде каны для иероглифов кандзи в японском языке. Окуригана обычно используется для изменения форм прилагательных и глаголов, может отражать время (прошедшее или настоящее/будущее), утвердительное или отрицательное значение, категории вежливости, а также выполнять другие функции словообразования. В современном письменном языке окуригана практически всегда записывается хираганой; в прошлом для этих целей часто использовалась катакана...
Панграмма (c греч. «все буквы») или разнобуквица — короткий текст, использующий все или почти все буквы алфавита, по возможности не повторяя их.
Пара́граф (от греческого παράγραφος — написанное рядом) — мелкое подразделение текста внутри главы, раздела, обозначаемое обычно специальным знаком — § или пп.
Переводческая скоропись (тж. переводческая запись, универсальная переводческая скоропись (УПС), переводческая нотация, переводческая семантография) — свод правил и рекомендаций, а также сама система фиксирования переводчиком содержания переводимого выступления с целью дальнейшего его воспроизведения на языке перевода.
Перено́с в типографике — разрыв части текста (слова, формулы и т. п.), при котором её начало оказывается на одной строке, а конец — на другой.
Прямая речь — высказывание, дословно введённое в авторскую речь (говорящего или пишущего). В отличие от косвенной речи, сохраняет индивидуальные и стилистические особенности речи того, чьё высказывание воспроизводится: диалектные черты, повторы, паузы, вводные слова и т. п. Прямая речь вводится без союзов, личных местоимений, глагольные формы обозначают отношение к лицу говорящего, например: «Ты сказал: „Вернусь поздно“». Для сравнения в косвенной речи: «Ты сказал, что вернёшься поздно». Обычно прямая...
Расширенная форма Бэкуса — Наура (расширенная Бэкус — Наурова форма (РБНФ)) (англ. Extended Backus–Naur Form (EBNF)) — формальная система определения синтаксиса, в которой одни синтаксические категории последовательно определяются через другие. Используется для описания контекстно-свободных формальных грамматик. Предложена Никлаусом Виртом. Является расширенной переработкой форм Бэкуса — Наура, отличается от БНФ более «ёмкими» конструкциями, позволяющими при той же выразительной способности упростить...
Синтаксическая диаграмма — это направленный граф с одним входным ребром и одним выходным ребром и помеченными вершинами. Синтаксическая диаграмма задаёт язык. Цепочка пометок при вершинах на любом пути от входного ребра к выходному — это цепочка языка, задаваемого синтаксической диаграммой. Поэтому можно считать, что синтаксическая диаграмма — это одна из форм порождающей грамматики автоматных языков. Синтаксические диаграммы и конечные автоматы имеют тесную связь: любой автоматный язык задаётся...
Синтакси́ческий ана́лиз (или разбор, жарг. па́рсинг ← англ. parsing) в лингвистике и информатике — процесс сопоставления линейной последовательности лексем (слов, токенов) естественного или формального языка с его формальной грамматикой. Результатом обычно является дерево разбора (синтаксическое дерево). Обычно применяется совместно с лексическим анализом.
Синхронный автоматический перевод (Speech-to-Speech Real-Time Translation) — «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Язык эсперанто был стабилен с момента его создания на фоне других искусственных языков. Это связано с документом Декларация Булонь (Declaration of Boulogne) от 1905 года, определяющим суть и основные принципы движения эсперантистов. Декларация была написана Л. Л. Заменгофом. Согласно декларации, обязательной для всех эсперантистов, фундаментом языка эсперанто является произведение «Основы эсперанто», в которое никто не имеет права вносить изменения.
Станда́рт оформле́ния ко́да (станда́рт коди́рования, стиль программи́рования) (англ. coding standards, coding convention или programming style) — набор правил и соглашений, используемых при написании исходного кода на некотором языке программирования. Наличие общего стиля программирования облегчает понимание и поддержание исходного кода, написанного более чем одним программистом, а также упрощает взаимодействие нескольких человек при разработке программного обеспечения.
Сте́мминг — это процесс нахождения основы слова для заданного исходного слова. Основа слова не обязательно совпадает с морфологическим корнем слова.
Теза́урус (от греч. θησαυρός «сокровище»), в общем смысле — специальная терминология, более строго и предметно — словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации (пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией); в современной лингвистике — особая разновидность словарей, в которых указаны...
Тире́ (фр. tiret, от tirer — растягивать) — один из знаков препинания, применяемый во многих языках. В русскую письменность тире ввёл писатель и историк Н. М. Карамзин. Правила употребления и название этого знака установились не сразу. Он был описан в «Российской грамматике» А. А. Барсова, где был именован «молчанка», затем «черта», а позднее — «знак мыслеотделительный» (в «Сокращённой русской грамматике» А. Х. Востокова).
Существует несколько способов транслитерации письма деванагари латинским алфавитом. Наиболее распространёнными являются Международный алфавит транслитерации санскрита (IAST) (в печатных работах) и ITRANS (в интернете).

Подробнее: Транслитерация деванагари латиницей
Удобочитаемость («читабельность») — свойство текстового материала, характеризующее лёгкость восприятия его человеком.
Ѹ, ѹ или Ꙋ, ꙋ (ук или оук, глаголица: Ⱆ) — буква старославянской азбуки. Первоначально диграф букв О и У (точнее, буквы «ик», варианта ижицы) писался горизонтально, но впоследствии, для экономии места, стали использовать вертикальную лигатуру, а впоследствии и вовсе заменили буквой У.

Подробнее: Ук (кириллица)
Форма Бэкуса — Наура (сокр. БНФ, Бэкуса — Наура форма) — формальная система описания синтаксиса, в которой одни синтаксические категории последовательно определяются через другие категории. БНФ используется для описания контекстно-свободных формальных грамматик. Существует расширенная форма Бэкуса — Наура, отличающаяся лишь более ёмкими конструкциями.
Формальная грамматика или просто грамматика в теории формальных языков — способ описания формального языка, то есть выделения некоторого подмножества из множества всех слов некоторого конечного алфавита. Различают порождающие и распознающие (или аналитические) грамматики — первые задают правила, с помощью которых можно построить любое слово языка, а вторые позволяют по данному слову определить, входит ли оно в язык или нет.
а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я