Связанные понятия
Визуализация данных — это представление данных в виде, который обеспечивает наиболее эффективную работу человека по их изучению. Визуализация данных находит широкое применение в научных и статистических исследованиях (в частности, в прогнозировании, интеллектуальном анализе данных, бизнес-анализе), в педагогическом дизайне для обучения и тестирования, в новостных сводках и аналитических обзорах. Визуализация данных связана с визуализацией информации, инфографикой, визуализацией научных данных, разведочным...
Машинное обучение (англ. machine learning, ML) — класс методов искусственного интеллекта, характерной чертой которых является не прямое решение задачи, а обучение в процессе применения решений множества сходных задач. Для построения таких методов используются средства математической статистики, численных методов, методов оптимизации, теории вероятностей, теории графов, различные техники работы с данными в цифровой форме.
Теория распознава́ния о́браза — раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков. Такие задачи решаются довольно часто, например, при переходе или проезде улицы по сигналам светофора. Распознавание цвета загоревшейся лампы светофора и знание правил дорожного движения позволяет принять правильное решение о том, можно...
Извлечение информации (англ. information extraction) — это задача автоматического извлечения (построения) структурированных данных из неструктурированных или слабоструктурированных машиночитаемых документов.
Имитационное моделирование (англ. simulation modeling) — метод исследования, при котором изучаемая система заменяется моделью, с достаточной точностью описывающей реальную систему (построенная модель описывает процессы так, как они проходили бы в действительности), с которой проводятся эксперименты с целью получения информации об этой системе. Такую модель можно «проиграть» во времени, как для одного испытания, так и заданного их множества. При этом результаты будут определяться случайным характером...
Упоминания в литературе
Качественные методы направлены, как правило, на изучение проблем социального поведения, деятельности социальных групп и отдельных индивидов, что связано с исследованием сравнительно небольших по масштабу объектов (микросистемы). Качественные методы возникли раньше количественных. Первые опираются на изучение, оценку и анализ существенных и несущественных признаков и свойств социальных объектов, а вторые – на их прямое или косвенное измерение, предполагающее использование символико-математической формализации и квантификации (количественной измеряемости). В ходе социологических исследований современных макросистем (объектов) все чаще требуется их сложная комбинация (как последовательное, так и параллельное использование). Обработка и
анализ данных требуют привлечения математического аппарата, обобщения десятков национальных статистик, но для разработки программ необходимо сравнение ценностей и норм, особенностей культуры.
Большое значение в статистическом исследовании имеют графический и табличный методы, которые позволяют наглядно определить тенденцию развития изучаемого явления. Современная статистика располагает множеством методов
анализа данных с применением вычислительной техники, позволяющих описать изменчивую структуру любого явления.
В процессе совершенствования методов обработки палеоантропологического материала обычно применяются типологический и популяционный подходы. Для этого предложен канонический дискриминантный
анализ данных индивидуальных измерений черепов и размеров длинных костей, который дает хорошие результаты на больших массивах, выявляя тенденции географической или хронологической изменчивости краниологических комплексов. Применяются также методы многомерного внутригруппового анализа краниологических выборок. Среди них метод главных компонент по индивидуальным измерительным данным, а также метод геометрической морфометрии (на основе анализа конфигураций координат точек, соответствующих классическим краниометрическим точкам). Оба метода позволяют в равной степени определить масштаб и основные закономерности внутригрупповой краниологической изменчивости. Преимуществом геометрической морфометрии является возможность оценки вариации форм черепов независимо от их общих размеров. Методы многомерной статистики применяются также для межгруппового анализа. Российские исследователи Б. А. Козинцев, Ю. К. Чистов, В. Е. Дерябин разработали пакеты программ, которые демонстрируют хорошие результаты.
Стратегия сравнения в социологии – общий способ реализации сравнительного каузального социологического исследования. Она является частью общесоциологической методологии. Стратегия сравнения включает определение общей логики и последовательности этапов сравнения, объектов сравнения, концепции причинности и объяснения и логики
анализа данных . Общепринято выделение двух стратегий сравнения – количественной (ориентированной на переменные) и качественной (ориентированной на кейсы).
Метод статистических группировок хорош тем, что, имея необходимые учетные данные, можно получить любой из трех типов статистических группировок. Для обработки данных требуется только знание ряда формул. Простой
анализ данных позволяет без специального математического образования овладеть научным аппаратом исследования и получать достоверную и полную количественную характеристику изучаемого явления.
Связанные понятия (продолжение)
Экспе́ртная систе́ма (ЭС, англ. expert system) — компьютерная система, способная частично заменить специалиста-эксперта в разрешении проблемной ситуации. Современные экспертные системы начали разрабатываться исследователями искусственного интеллекта в 1970-х годах, а в 1980-х годах получили коммерческое подкрепление. Предшественники экспертных систем были предложены в 1832 году С. Н. Корсаковым, создавшим механические устройства, так называемые «интеллектуальные машины», позволявшие находить решения...
Агентное моделирование (англ. agent-based model (ABM))— метод имитационного моделирования, исследующий поведение децентрализованных агентов и то, как такое поведение определяет поведение всей системы в целом. В отличие от системной динамики аналитик определяет поведение агентов на индивидуальном уровне, а глобальное поведение возникает как результат деятельности множества агентов (моделирование «снизу вверх»).
Больши́е да́нные (англ. big data, ) — обозначение структурированных и неструктурированных данных огромных объёмов и значительного многообразия, эффективно обрабатываемых горизонтально масштабируемыми программными инструментами, появившимися в конце 2000-х годов и альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence.
Обработка естественного языка (Natural Language Processing, NLP) — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза естественных языков. Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста. Решение этих проблем будет означать создание более удобной формы взаимодействия компьютера и человека.
Информацио́нный по́иск (англ. information retrieval) — процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности, и наука об этом поиске.
Инженерия знаний (англ. knowledge engineering) — область наук об искусственном интеллекте, связанная с разработкой экспертных систем и баз знаний. Изучает методы и средства извлечения, представления, структурирования и использования знаний.
Наука о данных (англ. data science; иногда даталогия — datalogy) — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме. Объединяет методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма, статистические методы, методы интеллектуального анализа данных и приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки баз данных.
База знаний (БЗ; англ. knowledge base, KB) — база данных, содержащая правила вывода и информацию о человеческом опыте и знаниях в некоторой предметной области (ISO/IEC/IEEE 24765-2010, ISO/IEC 2382-1:1993). В самообучающихся системах база знаний также содержит информацию, являющуюся результатом решения предыдущих задач.
Предме́тная о́бласть — множество всех предметов, свойства которых и отношения между которыми рассматриваются в научной теории. В логике — подразумеваемая область возможных значений предметных переменных логического языка.
Формальные методы занимаются приложением довольно широкого класса фундаментальных техник теоретической информатики: разные исчисления логики, формальных языков, теории автоматов, формальной семантики, систем типов и алгебраических типов данных.
Выделение признаков — это процесс снижения размерности, в котором исходный набор сырых переменных сокращается до более управляемых групп (признаков) для дальнейшей обработки, оставаясь при этом достаточным набором для точного и полного описания исходного набора данных.
Обучение с подкреплением (англ. reinforcement learning) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой. С точки зрения кибернетики, является одним из видов кибернетического эксперимента. Откликом среды (а не специальной системы управления подкреплением, как это происходит в обучении с учителем) на принятые решения являются сигналы подкрепления, поэтому такое обучение является частным случаем обучения с учителем, но учителем...
Статистическое модели́рование — исследование объектов познания на их статистических моделях. «Статистические модели необходимы для теоретического изучения влияния флуктуаций, шумов и т.п. на процессы. При учёте случайных процессов движение системы будет подчиняться уже не динамическим законам, а законам статистики. В соответствии с этим могут быть поставлены вопросы о вероятности того или иного движения, о наиболее вероятных движениях и о других вероятностных характеристиках поведения системы».Оценка...
Оптимизация — процесс максимизации выгодных характеристик, соотношений (например, оптимизация производственных процессов и производства), и минимизации расходов.
Глубокое обучение (глубинное обучение; англ. Deep learning) — совокупность методов машинного обучения (с учителем, с частичным привлечением учителя, без учителя, с подкреплением), основанных на обучении представлениям (англ. feature/representation learning), а не специализированным алгоритмам под конкретные задачи. Многие методы глубокого обучения были известны ещё в 1980-е (и даже ранее), но результаты были невпечатляющими, пока продвижения в теории искусственных нейронных сетей (предобучение нейросетей...
Многоагентная система (МАС, англ. Multi-agent system) — это система, образованная несколькими взаимодействующими интеллектуальными агентами. Многоагентные системы могут быть использованы для решения таких проблем, которые сложно или невозможно решить с помощью одного агента или монолитной системы. Примерами таких задач являются онлайн-торговля, ликвидация чрезвычайных ситуаций, и моделирование социальных структур.
Онтоло́гия в информатике (новолат. ontologia от др.-греч. ὤν род. п. ὄντος — сущее, то, что существует и λόγος — учение, наука) — это попытка всеобъемлющей и подробной формализации некоторой области знаний с помощью концептуальной схемы. Обычно такая схема состоит из структуры данных, содержащей все релевантные классы объектов, их связи и правила (теоремы, ограничения), принятые в этой области. Этот термин в информатике является производным от древнего философского понятия «онтология».
Компьютерное зрение (иначе техническое зрение) — теория и технология создания машин, которые могут производить обнаружение, отслеживание и классификацию объектов.
Исчисление процессов или алгебра процессов — семейство связанных подходов к формальному моделированию параллельных систем.
Видеоаналитика — технология, использующая методы компьютерного зрения для автоматизированного получения различных данных на основании анализа последовательности изображений, поступающих с видеокамер в режиме реального времени или из архивных записей.
Эволюционные алгоритмы — направление в искусственном интеллекте (раздел эволюционного моделирования), которое использует и моделирует процессы естественного отбора.
Латентно-семантический анализ (ЛСА) (англ. Latent semantic analysis, LSA) — это метод обработки информации на естественном языке, анализирующий взаимосвязь между библиотекой документов и терминами, в них встречающимися, и выявляющий характерные факторы (тематики), присущие всем документам и терминам.
Задача классифика́ции — задача, в которой имеется множество объектов (ситуаций), разделённых некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется выборкой. Классовая принадлежность остальных объектов неизвестна. Требуется построить алгоритм, способный классифицировать (см. ниже) произвольный объект из исходного множества.
Обуче́ние с учи́телем (англ. Supervised learning) — один из способов машинного обучения, в ходе которого испытуемая система принудительно обучается с помощью примеров «стимул-реакция». С точки зрения кибернетики, является одним из видов кибернетического эксперимента. Между входами и эталонными выходами (стимул-реакция) может существовать некоторая зависимость, но она неизвестна. Известна только конечная совокупность прецедентов — пар «стимул-реакция», называемая обучающей выборкой. На основе этих...
Представление знаний — вопрос, возникающий в когнитологии (науке о мышлении), в информатике и в исследованиях искусственного интеллекта.
Релевантность в информационной науке и информационном поиске означает степень соответствия найденного документа или набора документов информационным нуждам пользователя (Релевантность, Relevance).
Распределённая система — система, для которой отношения местоположений элементов (или групп элементов) играют существенную роль с точки зрения функционирования системы, а, следовательно, и с точки зрения анализа и синтеза системы.
Фолксоно́мия (англ. folksonomy, от folk — народный + taxonomy таксономия, от гр. расположение по порядку + закон) — народная классификация, практика совместной категоризации информации (текстов, ссылок, фото, видеоклипов и т. п.) посредством произвольно выбираемых меток, называемых тегами.
Нейронная сеть (биологическая нейронная сеть) — совокупность нейронов головного и спинного мозга центральной нервной системы (ЦНС) и ганглия периферической нервной системы (ПНС), которые связаны или функционально объединены в нервной системе, выполняют специфические физиологические функции.
Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.
Временно́й ряд (или ряд динамики) — собранный в разные моменты времени статистический материал о значении каких-либо параметров (в простейшем случае одного) исследуемого процесса. Каждая единица статистического материала называется измерением или отсчётом, также допустимо называть его уровнем на указанный с ним момент времени. Во временном ряде для каждого отсчёта должно быть указано время измерения или номер измерения по порядку. Временной ряд существенно отличается от простой выборки данных, так...
Библиоме́трия — применение математических и статистических методов к изучению книг, периодических изданий и прочих публикаций.
Интеллектуальный агент в первом смысле — это часть технологии разработки операционных систем, и хотя алгоритмы, в нём используемые, могут базироваться на более сложных моделях, чем даже алгоритмы многих SCADA — систем, диапазон и методика его воздействия на состояние системы очень жестко детерминируется. «Интеллектуальный агент» во втором смысле так же не может быть полностью независимым, выполняя свои задачи, но методики его разработки на много порядков сложнее, в силу абсолютно иного уровня сложности...
Храни́лище да́нных (англ. Data Warehouse) — предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения.
Фа́кторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки.
Бизнес-процесс — это совокупность взаимосвязанных мероприятий или работ, направленных на создание определённого продукта или услуги для потребителей. В качестве графического описания деятельности применяются блок-схемы бизнес-процессов..
В обучении машин и распознавании образов признак — это индивидуальное измеримое свойство или характеристика наблюдаемого явления. Выбор информативных, отличительных и независимых признаков является критическим шагом для эффективных алгоритмов в распознавании образов, классификации и регрессии. Признаки обычно являются числовыми, но структурные признаки, такие как строки и графы, используются в синтаксическом распознавании образов.
Подробнее: Признак (обучение машин)
Обеспечение качества (англ. Quality Assurance, QA) — это процесс или результат формирования требуемых свойств и характеристик продукции по мере её создания, а также — поддержание этих характеристик при хранении, транспортировании и эксплуатации продукции.
Формализа́ция — представление какой-либо содержательной области (рассуждений, доказательств, процедур классификации, поиска информации, научных теорий) в виде формальной системы или исчисления.
Обучение без учителя (самообучение, спонтанное обучение, англ. Unsupervised learning) — один из способов машинного обучения, при котором испытуемая система спонтанно обучается выполнять поставленную задачу без вмешательства со стороны экспериментатора. С точки зрения кибернетики, это является одним из видов кибернетического эксперимента. Как правило, это пригодно только для задач, в которых известны описания множества объектов (обучающей выборки), и требуется обнаружить внутренние взаимосвязи, зависимости...
Управление проектами — область деятельности, в ходе которой определяются и достигаются чёткие цели проекта при балансировании между объёмом работ, ресурсами (такими как деньги, труд, материалы, энергия, пространство и другими), временем, качеством и рисками (PMBoK) .
Формальная верификация или формальное доказательство — формальное доказательство соответствия или несоответствия формального предмета верификации его формальному описанию. Предметом выступают алгоритмы, программы и другие доказательства.
Требования к программному обеспечению — совокупность утверждений относительно атрибутов, свойств или качеств программной системы, подлежащей реализации. Создаются в процессе разработки требований к программному обеспечению, в результате анализа требований.
Упоминания в литературе (продолжение)
Эксперимент не является единственно возможным методом психолингвистического исследования. Психолингвистика использует также экспериментальный материал и методы наблюдения, которыми располагает традиционная лингвистика, при этом использует их в более широком контексте. При
анализе данных лингвистического исследования учитывается речевой и неречевой контекст, общие условия речевой деятельности, замысел коммуниканта, психологическое состояние участников коммуникации.
7) матричные формы представления и
анализа данных . Они не являются специфическим инструментом анализа исследуемых логистических систем, но широко применяются на разных этапах анализа логистической системы в качестве вспомогательного средства;
В настоящей работе представлены результаты многолетних исследований авторов, касающихся нарушений слоговой структуры слова у детей различных категорий. На основе тщательного
анализа данных литературы из таких областей научного знания, как философия, психология, лингвистика, психолингвистика, нейропсихология, физиология и другие, авторами определены когнитивные механизмы, значимые для становления процессов слогового оформления слов детьми в онтогенезе, представлены данные, касающиеся состояния этих механизмов у дошкольников с речевыми нарушениями. Кроме того, охарактеризованы базовые неречевые процессы, развитие которых определяет успешность функционирования указанных когнитивных механизмов и обеспечивает возможность нормативного восприятия и проговаривания слоговой структуры слова. В монографии получила свое отражение коррекционная направленность исследовательских материалов – авторами предложены основные направления работы по устранению недостатков слогового оформления слов у дошкольников с речевыми нарушениями.
4) методы сбора и
анализа данных – технологии получения эмпирического материала и его первичного обобщения.
Выполненный нами
анализ данных монографии «Долгосрочные приоритеты прикладной науки в России» позволяет обосновать необходимость регулярной актуализации некоторых приоритетов, особенно тех, которые сформулированы с избыточной детализацией. Так приоритеты, связанные с разработкой и производством скаффолдов, в значительной мере уже утратили свою безальтернативность. Один из самых признанных и результативных биоинженеров мира В. Миронов в своей лекции, прочитанной в России 19 сентября 2013 г., назвал скаффолды «тупиковым направлением биоинженерии», поскольку их производство является дорогостоящим и требует значительных временных ресурсов. Исследовательское подразделение Минобороны США Defense Advanced Research Projects Agency (DARPA) в 2012 г. инициировало проект «Бескаркасная тканевая инженерия». В аналитическом приложении наукометрической базы WoS Essential Science Indicators (.ESI) зафиксированы мировые фронты исследований по бескаркасной тканевой инженерии с высокими показателями цитируемости, что свидетельствует об активном становлении нового тренда в биоинженерии, к сожалению, не отмеченного в качестве приоритета в монографии «Долгосрочные приоритеты прикладной науки в России».
Важным вопросом является объем выборки. В этом плане общеизвестно требование репрезентативности выборки по выделенным параметрам (критериям); состав опрашиваемых должен приближаться к соответствующим пропорциям в генеральной совокупности. Вместе с тем принципиальным является замечание В. А. Ядова, что «между тем строго репрезентативную выборку по всем важным для проблематики исследования параметрам обеспечить невозможно, и поэтому следует гарантировать репрезентацию по главному направлению
анализа данных » (Ядов, 1998, с. 112), Он полагает, что «репрезентативная выборка должна быть заменена целевой, в которой численность каждой интересующей нас группы будет достаточна для более основательного анализа. Такая выборка, будучи качественно представительной в отношении целей исследования, не является статистически репрезентативной в отношении генеральной совокупности» (Ядов, 1998, с. 115).
Для выведения и подтверждения своих теоретических законов большинство общественных наук пользуются статистикой. Заключениями, сформированными на статистических исследованиях, пользуются экономика, история, социология, политология и множество других гуманитарных наук. Статистика необходима и общественным наукам для подтверждения их теоретической основы, и ее практическая роль очень велика. Ни крупные предприятия, ни серьезные производства, разрабатывая стратегию экономического и социального развития объекта, не могут обойтись без
анализа данных статистического учета. Для этого на предприятиях и производствах организовываются специальные аналитические отделы и службы, привлекающие специалистов, которые закончили профессиональную подготовку по данной дисциплине.
Способность правового объекта к сравнению составляет еще одну важную черту объекта сравнительного правоведения. В свое время
анализу данного признака был посвящен целый ряд работ общеметодологического характера[41].
Анализ топологии процесса может проводиться в несколько итераций. В результате первоначальный построенный процесс может кардинально измениться. Например, функции, которые раньше выполнялись последовательно друг за другом, стали выполняться параллельно. Цель
данного анализа – добиться максимально понятного течения процесса, отражающего при этом либо реальное положение вещей, либо оптимальное с учетом доступности ресурсов.
а) традиционный (качественный) анализ – рассматривает и изучает составные части, материального объекта с позиции лица, проводящего
данный анализ ;
Маркетинговые исследования представляют собой сбор, регистрацию и
анализ данных по маркетинговым проблемам. Основная цель маркетинговых исследований состоит в снижении степени неопределенности в области маркетинга и принятии эффективных решений по маркетинговым проблемам. В зависимости от рода потребности, возникшей у предприятия, выделяют многообразие целей и задач маркетинговых исследований.
Упрощенные прогнозы выполняются с предварительными целями и само их название говорит о том, что на особую точность они не претендуют. Один из них связан с производством приблизительных расчётов среднего прироста (или убывания) показателей за период наблюдения, который прибавляется (вычитается) к последней точке базового периода. Такой подход уместен при выполнении
анализа данных , укладывающихся в некий прямолинейный коридор, образующийся при построении графика.
Установление причинной связи между содержанием фактических данных, характеризующих информационно-процессуальный компонент сложившейся ситуации по расследуемому преступлению, с одной стороны, и следственными версиями по делу, – с другой, – наиболее важный момент криминалистического
анализа данного компонента следственной ситуации. Причинная связь, о которой здесь идет речь, определяет направления расследования, предмет расследования и источники получения доказательственной информации и обусловливает в конечном счете адекватные средства и результаты тактического воздействия на сложившуюся следственную ситуацию. Вне этой связи оптимальный процесс расследования просто немыслим.