Понятия со словом «совпадение»

Индекс совпадений — один из методов криптоанализа шифра Виженера. Описание было опубликовано Уильямом Фридманом в 1920 году.

Связанные понятия

Инверсия в предложении (от лат. inversio — переворачивание, перестановка), «обратный порядок слов» — изменение значения слова путём размещения в синтаксически необычном для него месте предложении. Возможна инверсия как отдельных слов, так и целых групп (например, группы подлежащего, сказуемого и любых других). Инверсия — нарушение порядка слов, имеющее значение (то есть — являющаяся знаком: грамматическим, эмоциональным, стилистическим, риторическим и т. д.).

Избыточность языка — статистическая величина, обозначающая избыточность информации, содержащейся в тексте на определённом языке.

Индуктивное логическое программирование (Inductive Logic Programming, ILP) — раздел машинного обучения, который использует логическое программирование как форму представления примеров, фоновых знаний и гипотез. Получив описания уже известных фоновых знаний и набор примеров, представленных как логическая база фактов, система ILP может породить логическую программу в форме гипотез, объясняющую все положительные примеры и ни одного отрицательного.

Дешифровка ронго-ронго, письменности острова Пасхи, обнаруженной в конце XIX века, до сих пор не осуществлена. Аналогично другим недешифрованным письменностям, существует множество гипотез относительно ронго-ронго, в том числе фантастических. Известно содержание только части одной таблички, имеющей отношение к лунному календарю, но даже эту часть пока не удалось расшифровать. Дешифровке препятствуют три обстоятельства: малое количество сохранившихся текстов (содержащих в сумме не более 15 000 знаков...

Автокорреляционный метод — это метод криптоанализа полиалфавитных шифров, например таких как шифр Виженера.

Сте́мминг — это процесс нахождения основы слова для заданного исходного слова. Основа слова не обязательно совпадает с морфологическим корнем слова.

Авторове́дческая эксперти́за — исследование текста (чаще всего — печатного) с целью установления авторства (атрибуция произведения) или получения каких-либо сведений об авторе и условиях создания текстового документа.

Алгоритм «прямого-обратного» хода — алгоритм для вычисления апостериорных вероятностей последовательности состояний при наличии последовательности наблюдений. Иначе говоря, алгоритм, вычисляющий вероятность специфической последовательности наблюдений. Алгоритм применяется в трёх алгоритмах скрытых Марковских моделей.

Алгоритм Леска — классический алгоритм разрешения лексической многозначности, основанный на знаниях, предложенный Майклом Леском в 1986 году.

Качественная, дискретная, или категорийная переменная — это переменная, которая может принимать одно из ограниченного и, обычно, фиксированного числа возможных значений, назначая каждую единицу наблюдения определённой группе или номинальной категории на основе некоторого качественного свойства. В информатике и некоторых других ветвях математики качественные переменные называются перечислениями или перечисляемыми типами. Обычно (хотя не в этой статье), каждое из возможных значений качественной переменной...

Наи́вный ба́йесовский классифика́тор — простой вероятностный классификатор, основанный на применении теоремы Байеса со строгими (наивными) предположениями о независимости.

Спектрогра́мма (соногра́мма) — изображение, показывающее зависимость спектральной плотности мощности сигнала от времени. Спектрограммы применяются для идентификации речи, анализа звуков животных, в различных областях музыки, радио- и гидролокации, обработке речи, сейсмологии и в других областях.

Минимали́стская програ́мма — лингвистическая теория, предложенная американским лингвистом Н. Хомским для объяснения тех языковых феноменов, механизмы которых не были прояснены полностью в рамках теории принципов и параметров. Сама Минималистская программа содержит ряд сильных утверждений, касающихся универсальной грамматики, а также некоторые гипотезы об устройстве когнитивной системы в связи с врождённой языковой способностью. Главным методологическим принципом Минималистской программы является...

Алгоритм Баума — Велша используется в информатике и статистике для нахождения неизвестных параметров скрытой марковской модели (HMM). Он использует алгоритм прямого-обратного хода и является частным случаем обобщённого EM-алгоритма.

Лемма разветвления (англ. Forking lemma) — лемма в области криптографических исследований.

Корефере́нтность или референциональное тождество — отношение между именами — компонентами высказывания, в котором имена ссылаются на один и тот же объект (ситуацию) внеязыковой действительности (референт).

Сочета́емость — свойство языковых единиц сочетаться в речи при образовании единиц более высокого уровня, отражающее синтагматические отношения между ними. Сочетаемость является одним из фундаментальных свойств единиц языка.

В законе Об авторском праве США термин существенное сходство является стандартом, используемым для определения того, нарушены ли авторские права или нет. Стандарт исходит из признания того, что исключительное право делать копии произведения будет лишено смысла, если нарушение было ограничено только точными и полными копиями произведения. Многие суды использовали термин «существенное сходство» или «поразительное сходство» для доказательства проведенного копирования.

Полисеми́я (от греч. πολυσημεία — «многозначность») — многозначность, многовариантность, то есть наличие у слова (единицы языка, термина) двух и более значений, исторически обусловленных или взаимосвязанных по смыслу и происхождению.

Макрокомпаративи́стика — раздел лингвистической компаративистики, изучающий дальнее языковое родство.

Локальный уровень выброса является алгоритмом в выявлении аномалий, который предложили Маркус М. Бройниг, Ганс-Петер Кригель, Реймонд Т. Нг и Ёрг Сандер в 2000 году для нахождения аномальных точек данных путём измерения локального отклонения данной точки данных с учётом её соседей.

Э́ллипсис (от др.-греч. ἔλλειψις — недостаток) в лингвистике — намеренный пропуск слов, не существенных для смысла выражения. Используется и как риторическая фигура разговорного стиля.

Ана́фора (от греч. ἀναφέρειν — относить назад, возводить к чему-либо, возвращать) — лингвистическое явление, зависимость интерпретации некоторого выражения от другого выражения, обычно ранее встречавшегося в тексте. Это определяющее выражение называется антецедент (если оно появляется до анафорического выражения) или постцедент (если появляется после).

Демпстера-Шафера теория — математическая теория очевидностей (свидетельств) (), основанная на функции доверия (belief functions) и функции правдоподобия (plausible reasoning), которые используются, чтобы скомбинировать отдельные части информации (свидетельства) для вычисления вероятности события. Теория была развита Артуром П. Демпстером и Гленном Шафером.

Коэффициент инбридинга может быть вычислен для отдельной персоны и является мерой степени редукции предков в родословии конкретной личности.

Теоре́ма о бесконе́чных обезья́нах (в одном из многочисленных вариантов формулировки) утверждает, что абстрактная обезьяна, ударяя случайным образом по клавишам пишущей машинки в течение неограниченно долгого времени, рано или поздно напечатает любой наперёд заданный текст.

Частотный анализ, частотный криптоанализ — один из методов криптоанализа, основывающийся на предположении о существовании нетривиального статистического распределения отдельных символов и их последовательностей как в открытом тексте, так и в шифротексте, которое, с точностью до замены символов, будет сохраняться в процессе шифрования и дешифрования.

Предика́ция (лат. praedicātio — высказывание, утверждение) в лингвистике — одна из функций языкового выражения, имеющая целью соотнести заключённую в отрезке речи мысль к действительности: состоянию объекта или субъекта, событию или ситуации. Предикация — формальное установление связей между субъектом и предикатомВ предикации, которую можно считать актом высказывания, построения пропозиции, выделяются два этапа...

Апостерио́рная вероя́тность — условная вероятность случайного события при условии того, что известны апостериорные данные, т.е. полученные после опыта.

Эволюционная дистанция — величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена.

Скрытая марковская модель (СММ) — статистическая модель, имитирующая работу процесса, похожего на марковский процесс с неизвестными параметрами, и задачей ставится разгадывание неизвестных параметров на основе наблюдаемых. Полученные параметры могут быть использованы в дальнейшем анализе, например, для распознавания образов. СММ может быть рассмотрена как простейшая байесовская сеть доверия.

Фидуциальный вывод (от лат. fides: вера, доверие), как разновидность статистического вывода, был впервые предложен сэром Р. Э. Фишером.

Семплирование по Гиббсу — алгоритм для генерации выборки совместного распределения множества случайных величин. Он используется для оценки совместного распределения и для вычисления интегралов методом Монте-Карло. Этот алгоритм является частным случаем алгоритма Метрополиса-Гастингса и назван в честь физика Джозайи Гиббса.

Уйгурский язык (уйг. ئۇيغۇرچە/Uyghurche/Уйғурчә) — агглютинативный язык, наряду с узбекским входящий в карлукскую группу тюркских языков.

Подробнее: Морфология уйгурского языка

Геометрия признаков - (англ. feature geometry) фонологическая теория, в которой дифференциальные признаки фонемы представлены в виде нелинейной иерархии автономных элементов. Была предложена Дж. Клементсом в 1985 году и получила дальнейшее развитие в работах Э.Сейджи, М.Халле, Э.Хьюм. В отличие от системы признаков Хомского-Халле, фонологические признаки в теории Клементса не просто группируются на основании функциональной общности, а образуют иерархическую структуру.

В теории информации теорема Шеннона об источнике шифрования (или теорема бесшумного шифрования) устанавливает предел максимального сжатия данных и числовое значение энтропии Шеннона.

Причинность по Грэнджеру (англ. Granger causality) — понятие, используемое в эконометрике (анализе временных рядов), формализующее понятие причинно-следственной связи между временными рядами. Причинность по Грэнджеру является необходимым, но не достаточным условием причинно-следственной связи.

Принцип минимальной длины описания (англ. minimum description length, MDL) — это формализация бритвы Оккама, в которой лучшая гипотеза (модель и её параметры) для данного набора данных это та, которая ведёт к лучшему сжиманию даных. Принцип MDL предложил Йорма Риссанен в 1978. Принцип является важной концепцией в теории информации и теории вычислительного обучения.

Выявление аномалий (также обнаружение выбросов) — это опознавание во время интеллектуального анализа данных редких данных, событий или наблюдений, которые вызывают подозрения ввиду существенного отличия от большей части данных. Обычно аномальные данные превращаются в некоторый вид проблемы, такой как мошенничество в банке, структурный дефект, медицинские проблемы или ошибки в тексте. Аномалии также упоминаются как выбросы, необычности, шум, отклонения или исключения.

Когнити́вные измере́ния — это принципы разработки синтаксиса, пользовательских интерфейсов и других особенностей языков программирования, описанные исследователями Томасом Грином и Марианом Петре. Измерения могут использоваться для оценки юзабилити существующих языков или для рекомендаций по дизайну новых.

Ифку́иль (ифк. Iţkuîl), также Ыфкуил или Илакш — искусственный язык философского направления. Обладает крайней сложностью грамматики и огромным набором фонем, что делает язык весьма трудным для изучения.

Расщеплённая эргати́вность — синтаксическое или морфологическое явление, состоящее в том, что в зависимости от определённого параметра в языке используются различные стратегии ролевой кодировки: как эргативная, так и какая-то другая (или другие). В значительном количестве эргативных языков имеется расщеплённая эргативность.

Алгоритм Витерби — алгоритм поиска наиболее подходящего списка состояний (называемого путём Витерби), который в контексте цепей Маркова получает наиболее вероятную последовательность произошедших событий.

Систематическая ошибка отбора — статистическое понятие, показывающее, что выводы, сделанные применительно к какой-либо группе, могут оказаться неточными вследствие неправильного отбора в эту группу.

Вале́нтность (от лат. valentia/ valens (род.п. valentis) — «имеющий силу») в синтаксисе — способность слова вступать в синтаксические связи с другими элементами, наприм., валентности глагола дать определяют способность сочетаться с подлежащим, прямым дополнением, косвенным дополнением: Я даю ему книгу.

Адмирати́вность — лингвистическая категория, выражающая удивление говорящего от факта, внезапно установленного им непосредственно перед моментом речи («эпистемическая неожиданность»); в этом случае полученное знание контрастирует с предыдущим состоянием незнания. Это значение рассматривается в качестве особой категории (адмирати́в или мирати́в) либо в рамках категории эвиденциальности.

Эффект фрейминга (framing effect, от англ. frame рамка, обрамление) — когнитивное искажение, при котором форма подачи информации влияет на ее восприятие человеком. Так, одно и то же утверждение, в зависимости от формулировки и смысловых акцентов, может быть представлено как в негативном, так и в позитивном свете («Стакан наполовину пуст или наполовину полон»), в качестве выгоды или потери.

Грамматика составляющих (метод составляющих; англ. constituency grammar, phrase structure grammar) основана на постулате, согласно которому всякая сложная грамматическая единица складывается из двух более простых и не пересекающихся единиц, называемых её непосредственными составляющими (англ. immediate constituent).

Логическая вероятность — логическое отношение между двумя предложениями, степень подтверждения гипотезы H свидетельством E.