Связанные понятия
Анализ полных наблюдений (англ. listwise/casewise deletion, реже англ. complete-case analysis) — статистический метод обработки пропущенных данных, основанный на удалении всех наблюдений с неполными признаковыми описаниями. Считается самым простым способом разрешения проблемы пропущенных данных.
Закон сравнительных суждений - психофизический закон, определяющий отношение между двумя объектами в психическом пространстве человека. Сформулирован Л. Л. Терстоуном.
Интервальная оце́нка — это пара чисел в математической статистике, оцениваемых на основе наблюдений, между которыми предположительно находится оцениваемый параметр.
Шкала максимального различия (англ. maximum difference scaling, MaxDiff) — это методика исследования с очень специфичными предположениями о том, как люди осуществляют выбор: она предполагает, что респонденты оценивают все возможные пары позиций в рамках предложенного набора и выбирают пару, которая отображает максимальное отклонение в предпочтении или важности.
Модели дискретного выбора — экономические (эконометрические) модели, позволяющие описывать, объяснять и прогнозировать выбор между, двумя или более альтернативами (то есть когда множество альтернатив не более чем счетно). Модели дискретного выбора позволяют на основе некоторых характеристик (атрибутов) экономического субъекта или ситуации оценить вероятность выбора той или иной альтернативы.
Подробнее: Дискретный выбор
Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных признаков и событий на объясняемую переменную. При этом фиктивные переменные позволяют учесть влияние не только качественных признаков, принимающих два значения, но и несколько возможных. В этом случае добавляются несколько фиктивных переменных. Фиктивная переменная может быть также индикатором принадлежности наблюдения к некоторой...
Статистический параметр или параметр совокупности — это величина, которая индексирует семейство распределений вероятностей. Его можно расценивать как числовую характеристику совокупности или статистической модели.
В математической статистике
критерий знаков используется при проверке нулевой гипотезы о равенстве медианы некоторому заданному значению (для одной выборки) или о равенстве нулю медианы разности (для двух связанных выборок). Это непараметрический критерий, то есть он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность, чем более специализированные критерии.
В статистике метод оценки с помощью апостериорного максимума (MAP) тесно связан с методом максимального правдоподобия (ML), но дополнительно при оптимизации использует априорное распределение величины, которую оценивает.
Подробнее: Оценка апостериорного максимума
Тест Хаусмана , называемый также тестом Ву-Хаусмана или Дарбина-Ву-Хаусмана — применяемый в эконометрике тест для сравнения моделей, оцененных разными методами, один из которых позволяет получить состоятельные оценки и при нулевой и при альтернативной гипотезе, а другой — только при нулевой гипотезе.
Теорема схем , или теорема шаблонов — основная теорема теории генетических алгоритмов, дающая обоснование их эффективности. Впервые сформулирована и доказана Дж. Холландом в 1975 году.
Функция предельного правдоподобия (англ. Marginal Likelihood Function) или интегрированное правдоподобие (англ. integrated likelihood) — это функция правдоподобия, в которой некоторые переменные параметры исключены. В контексте байесовской статистики, функция может называться обоснованностью (англ. evidence) или обоснованностью модели (англ. model evidence).
Подробнее: Предельное правдоподобие
Эффекти́вная оце́нка в математической статистике — несмещенная статистическая оценка, дисперсия которой совпадает с нижней гранью в неравенстве Крамера-Рао.
Вне́шне несвя́занные уравне́ния (англ. Seemingly Unrelated Regressions (SUR)) — система эконометрических уравнений, каждое из которых является самостоятельным уравнением со своей зависимой и объясняющими экзогенными переменными. Модель предложена Зельнером в 1968 году. Важной особенностью данных уравнений является то, что несмотря на кажущуюся несвязанность уравнений их случайные ошибки предполагаются коррелированными между собой.
Обратная вероятность , по-разному интерпретированная, не была доминирующим подходом к статистике вплоть до развития частотного подхода в начале 20 века Р.А.Фишер, Ежи Нейман и Эгон Пирсон. После разработки частотного подхода, термины частотная и Байесовская развивались при противопоставлении этих подходов, и получили широкое распространение в 1950-х годах.
Лингвистический ассоциативный эксперимент — один из методов психолингвистики. Берёт начало в методе свободных ассоциаций, одном из первых проективных методов психологии. З. Фрейд и его последователи предполагали, что неконтролируемые ассоциации — это символическая или иногда даже прямая проекция внутреннего, часто неосознаваемого содержания сознания.
Ядро м (англ. kernel) в статистике и эконометрике называют окно (весовую функцию). Байесовская, непараметрическая статистика и теория распознавания образов трактуют термин по-разному.
Иерархия вер (англ. belief hierarchy) — объект эпистемической теории игр, позволяющий определить категорию, рациональности и общей веры в рациональность. Под верой понимается вероятностное распределение на неком пространстве неопределённости — например, на множестве стратегий другого игрока (однако элементы пространства могут иметь и экзогенную природу). Концепция иерархии вер введена Мертенсом и Замиром. Иерархию вер можно задать напрямую, либо с помощью дополнительной структуры — типов игроков...
Минимизация эмпирического риска (МЭР, англ. Empirical risk minimization, ERM) — это принцип статистической теории обучения, который определяет семейство алгоритмов обучения и который задаёт теоретические границы производительности.
Статистическая мощность в математической статистике — вероятность отклонения основной (или нулевой) гипотезы при проверке статистических гипотез в случае, когда конкурирующая (или альтернативная) гипотеза верна. Чем выше мощность статистического теста, тем меньше вероятность совершить ошибку второго рода. Величина мощности также используется для вычисления размера выборки, необходимой для подтверждения гипотезы с необходимой силой эффекта.
Геостати́стика — наука и технология для анализа, обработки и представления пространственно-распределенной (или пространственно-временной) информации с помощью статистических методов. Геостатистика моделирует распределение объектов, явлений и процессов в географическом пространстве.
Таблицы Шу́льте (англ. Schulte Table) — таблицы со случайно расположенными объектами (обычно числами или буквами), служащие для проверки и развития быстроты нахождения этих объектов в определённом порядке. Упражнения с таблицами позволяют улучшить периферическое зрительное восприятие, что важно, например, для скорочтения.
Функция принадлежности нечёткого множества — обобщение индикаторной (или характеристической) функции классического множества. В нечёткой логике она представляет степень принадлежности каждого члена пространства рассуждения к данному нечёткому множеству.
Преобразование Вигнера — Вилла (англ. Wigner — Ville transform) — один из эффективных методов спектрально-временного анализа нестационарных сигналов. Встречаются другие названия: преобразование Вигнера — Вилля, распределение Вигнера — Вилла (англ. Wigner — Ville distribution), распределение Вигнера — Вилля, функция Вигнера.
Пото́к одноро́дных собы́тий — случайная последовательность событий, упорядоченных по неубыванию моментов времени. Если данный момент времени совпадает с одним или несколькими событиями данной последовательности, то говорят, что в этот момент произошло соответствующее число событий потока.
Граф зависи́мостей — ориентированный граф, отображающий соотношение множества элементов некоторой совокупности в соответствии с выбранным транзитивным отношением над ней.
В статистике под латентными или скрытыми переменными понимают такие переменные, которые не могут быть измерены в явном виде, а могут быть только выведены через математические модели с использованием наблюдаемых переменных. Скрытые переменные используются во многих областях, включая психологию, экономику, машинное обучение, биоинформатику, обработку естественного языка и социальные науки.
Подробнее: Скрытая переменная
Взаимодействие гена и окружающей среды — это процесс, в ходе которого на основе определённого генотипа и воздействия фактора среды проявляется фенотип. В узком смысле, в генетической эпидемиологии: взаимодействие гена и окружающей среды — сочетание двух факторов риска (генетического и средового), приводящее к резкому изменению фенотипа, отличающемуся от привычного. Представляет собой интерес как способ описания нелинейных изменений фенотипа, качественных скачков в переходе от нормального (здорового...
Выборочное представление фактов , избирательный подход, выборочное цитирование или черри-пикинг (англ. cherry picking, досл. «сбор вишенок») — логическая ошибка, состоящая в указании на отдельные случаи либо данные, подтверждающие определённое положение, при игнорировании значительной части связанных случаев или данных, которые могут противоречить этому положению. Может быть как умышленным, так и неумышленным.
Коэффицие́нт асимметри́и в теории вероятностей — величина, характеризующая асимметрию распределения данной случайной величины.
Обсервационное исследование , наблюдательное исследование — клиническое исследование, в котором исследователь собирает данные путём простого наблюдения событий в их естественном течении, не вмешиваясь в них активно. Противоположностью обсервационному исследованию является эксперимент.
Отделение
содержания от представления (или «разделение формы и содержания») это общепринятая идиома, философия дизайна и методология, применяемая в контексте различных издательских технологических дисциплинах, включая информационный поиск, обработку шаблонов, веб-дизайн, веб-программирование, обработку текста, компьютерную вёрстку и разработку управляемую моделями. Это конкретный случай более общей философии разделения ответственности.
Неуверенные данные встречается в области сенсорных сетей; тексты с шумом в изобилии встречаются в социальных сетях, интернете и на предприятиях, где структурированные и неструктурированные данные могут быть старыми, устаревшими или попросту некорректными; в моделировании, когда математическая модель способна быть лишь приближением реального процесса. При представлении таких данных в базе данных, указание вероятностии корректности различных значений также должно быть произведено.
Числовая линия — это ментальная карта чисел, автоматически и непреднамеренно появляющаяся, когда человек, ею обладающий, думает о числах. Числа появляются в определенных местах в пространстве, и эти места могут быть различными у разных индивидуумов. Числовая линия была впервые описана сэром Фрэнсисом Гальтоном в его работе «Видения здравомыслящих людей» (Galton 1881a). Позднее исследование идентифицировало числовую линию как форму синестезии (Seron, Pesenti & Noël, 1992; Sagiv et al., 2006).
Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.
Стилизованные факты — эмпирические закономерности экономического роста, впервые предложенные Николасом Калдором в статье, опубликованной в 1957 году.
Анализ чувствительности (sensitivity analysis) — заключается в оценке влияния изменения исходных параметров проекта на его конечные характеристики, в качестве которых, обычно, используется внутренняя норма прибыли или NPV. Техника проведения анализа чувствительности состоит в изменении выбранных параметров в определенных пределах, при условии, что остальные параметры остаются неизменными. Чем больше диапазон вариации параметров, при котором NPV или норма прибыли остается положительной величиной...
Апофени́я (от др.-греч. ἀποφαίνω «высказываю суждение, делаю явным» ← ἀπο «из-» + φαίνω «представление») — переживание, заключающееся в способности видеть структуру или взаимосвязи в случайных или бессмысленных данных. Термин был введён в 1958 году немецким неврологом и психиатром Клаусом Конрадом, который определил его как «немотивированное ви́дение взаимосвязей», сопровождающееся «характерным чувством неадекватной важности» (анормальное сознание значения).
Часто́тный слова́рь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), по типичности (слова, частотные для большинства текстов), и т. д. Частотные списки используются для преподавания языка, создания новых словарей, приложений компьютерной...
Вну́тренняя вали́дность (англ. internal validity) — вид валидности, степень влияния независимой переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше вероятность того, что изменение зависимой переменной вызвано изменением именно независимой переменной (а не чего-либо ещё). Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.
Элиминация кванторов — получение по заданной логической формуле эквивалентной ей, не содержащей кванторов. Теории, допускающие элиминацию кванторов для любой формулы, представляют особый интерес, поскольку наличие алгоритма элиминации позволяет получить ряд содержательных результатов об этой теории.
Многомерное шкалирование — метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в пространстве меньшей размерности чем пространство признаков объектов. Точки размещаются так, чтобы попарные расстояния между ними в новом пространстве как можно меньше отличались от эмпирически измеренных расстояний в пространстве признаков изучаемых объектов. Если элементы матрицы расстояний получены по интервальным шкалам, метод многомерного шкалирования...
Индекс Тейла представляет собой показатель измерения социального неравенства, предложенный в 1967 году нидерландским экономистом Анри Тейлом. Индекс Тейла основан на предложенном Шенноном понятии информационной энтропии. В отличие от коэффициента Джини индекс Тейла разложим, то есть, если популяция разбита на группы, то индекс Тейла всей популяции можно записать в виде взвешенной суммы индексов Тейла каждой из групп и показателя социального неравенства между группами. Разложимость индекса Тейла позволяет...
Структурное прогнозирование или структурное обучение является собирательным термином для техник обучения машин с учителем, которые вовлекают предвидение структурных объектов, а не скалярных дискретных или вещественных значений.
Случайные сигналы — сигналы, мгновенные значения которых (в отличие от детерминированных сигналов) не известны, а могут быть лишь предсказаны с некоторой вероятностью, меньшей единицы. Характеристики таких сигналов являются статистическими, то есть имеют вероятностный вид.
Подробнее: Случайный сигнал
Если методы обучения без учителя в проблеме разрешения многозначности полагаются на неаннотированный (неразмеченный) корпус, то обучение с учителем коренным образом зависят от размеченного корпуса тестов. Проблема получения достаточного количества знаний является одной из самых главных преград в реализации высокоэффективных алгоритмов обучения. Однако, если алгоритм реализуется не такими крупными с точки зрения ресурсов мероприятиями, как Senseval, а более мелкая, то в подобных случаях получение...
Подробнее: Автоматическое получение размеченного корпуса
Комбинаторный взрыв — термин, используемый для описания эффекта резкого («взрывного») роста временной сложности алгоритма при увеличении размера входных данных задачи.