Связанные понятия
Релева́нтность (англ. relevance — актуальность, уместность) в информационном поиске — соответствие интента (поискового намерения), заложенного в запросе и выдаче в поисковой системе, полученной в результате этого запроса. Пользователь, который вводит запрос в поисковую систему ожидает, что результаты будут соответствовать намерению, которое он заложил в запросе, иными словами он получит релевантную выдачу.
Информацио́нный по́иск (англ. information retrieval) — процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности, и наука об этом поиске.
Ранжи́рование — сортировка сайтов в поисковой выдаче, применяемая в поисковых системах. Существует множество факторов для ранжирования, среди которых можно отметить рейтинг сайта, количество и качество внешних ссылок, релевантность текста к поисковому запросу, на основании которых поисковая система формирует список сайтов в поисковой выдаче. Алгоритм ранжирования того или иного поисковика меняется в процессе его функционирования.
Поисковый запрос — это какая-то последовательность символов, которую пользователь вводит в поисковую строку, чтобы найти интересующую его информацию.
База знаний (БЗ; англ. knowledge base, KB) — база данных, содержащая правила вывода и информацию о человеческом опыте и знаниях в некоторой предметной области (ISO/IEC/IEEE 24765-2010, ISO/IEC 2382-1:1993). В самообучающихся системах база знаний также содержит информацию, являющуюся результатом решения предыдущих задач.
Упоминания в литературе
Качество
релевантности информации сохраняется и в социальных отношениях, выступая как совокупность свойств, характеризующих степень соответствия информации потребностям использующих ее субъектов, что предполагает оценку информации по ряду критериев, в зависимости от вида деятельности субъекта, с которой связано использование информации, и целями, которые ставит субъект.
Кадровые данные представляют собой еще один тип оценочной информации; обращение к кадровым данным особенно остро ставит вопрос о
релевантности используемых критериев. Наиболее часто используемые показатели, относящиеся к кадровым данным, представлены такими характеристиками, как абстентеизм и аварийные или несчастные случаи на производстве. Абстентеизм составляет важную переменную при оценке успешности работы, однако методы его измерения и способы интерпретации не всегда являются отчетливыми. Абстентеизм как критерий измерения на сегодняшний день продолжает быть предметом углубленных психологических исследований.
Что касается гносеологической стороны, то отметим наличие заметных расхождений как в обозначении (названии), так и в интерпретации ряда ценностных диспозиций и принципов. Так, наряду с понятием «отнесение к ценности» (:ertbeziehung) используются выражения «ценностная уместность» или «ценностная
релевантность » (англ. value relevance); «свобода от оценок» обозначается и как «ценностная свобода» (value freedman), и как «ценностная нейтральность» (value neutrality) – при этом оба выражения могут объединяться как конъюнктивно (через «и»), так и дизъюнктивно (через «или»[169]). Сказываются, безусловно, трудности языковой адаптации исходных немецких терминов, на что обратил внимание Р. Арон, заявив, что «анализ ценности (:ertanalyse) по-французски – несколько странное выражение»[170]. Но и по-русски такой буквальный перевод требует пояснений, ибо «анализ ценности» не означает, что речь идет о постижении содержания той или иной ценности, а об использовании ценностных категорий для исследования самой социальной реальности, прежде всего поведения людей, что можно назвать «ценностным анализом» в отличие от системного, структурного, функционального, компаративного и других видов анализа. «Свобода от ценностей» – это этимологическая калька термина «:ertfreiheit», но, как отметил Ю. В. Давыдов, «буквальный перевод не сов падает с понятийным», т. е. означающим «свободу от оценок».
В технологическом аспекте методология трактуется как совокупность методов получения и подтверждения достоверности научного знания. В некоторых учебниках по политологии и социологии методология определяется как совокупность методов, процедур сбора и обработки данных в эмпирическом исследовании. «Прозрачность», внутренняя логичность самого исследовательского процесса получения знания – крайне важный аспект понимания методологии. В отличие от естественных наук, ассоциирующихся с экспериментальным методом, в социальных степень
релевантности и валидности методов является одним из самых острых и болезненных вопросов9. Это связано с исключительной сложностью социальных объектов и ограниченными возможностями их эмпирической верификации.
Вопрос производства и понимания речи в середине ХХ в. выводится на акциональный уровень. В работах философского направления (Дж. Остин, Дж. Серль и др.) было провозглашено, что речь – это особая форма поведения, а отдельные высказывания приобретают коммуникативный смысл, будучи произнесенными в определенных условиях взаимодействия. На этой принципиальной основе началась разработка основных положений теории, которая в дальнейшем получила известность как теория речевых актов. Были описаны типы речевых актов, а также условия их успешной реализации: правила искренности,
релевантности , мотивированности и др. (Новое в зарубежной…, 1986). Речевой акт, по Серлю, не ограничивается буквальным смыслом сказанного, коммуникативное значение обусловливается конвенцией и иллокуцией (Searle, 1969). Конвенция определяет значение, общее для всех носителей языка, а иллокуция – это то, что говорящий хочет реализовать в разговоре, его намерение в данный момент времени. В высказывании выделяются функциональные уровни: уровень пропозиции – указание на объекты мира и утверждения о них, уровень иллокуции, предполагающий выражение коммуникативного намерения, и уровень перлокуции, т. е. осуществление воздействия. Серль отмечает, что механизм образования коммуникативного смысла речи функционирует в пределах иллокуции. Названо примерное число иллокуций – более тысячи, в том числе: констатировать, замечать, утверждать, командовать, просить, критиковать и т. п. Иллокутивные акты понимаются как конститутивные правила. Они предписывают определенное поведение: так, обещание налагает на говорящего известное обязательство, в противном случае – это не обещание, а другой акт (можно предположить, что «я обещаю завтра дождь» – это предсказание).
Релевантность (в поисковых системах) – мера соответствия результатов поиска задаче, поставленной в запросе.
Связанные понятия (продолжение)
Обуче́ние ранжи́рованию (англ. learning to rank или machine-learned ranking, MLR) — это класс задач машинного обучения с учителем, заключающихся в автоматическом подборе ранжирующей модели по обучающей выборке, состоящей из множества списков и заданных частичных порядков на элементах внутри каждого списка. Частичный порядок обычно задаётся путём указания оценки для каждого элемента (например, «релевантен» или «не релевантен»; возможно использование и более, чем двух градаций). Цель ранжирующей модели...
Онтоло́гия в информатике (новолат. ontologia от др.-греч. ὤν род. п. ὄντος — сущее, то, что существует и λόγος — учение, наука) — это попытка всеобъемлющей и подробной формализации некоторой области знаний с помощью концептуальной схемы. Обычно такая схема состоит из структуры данных, содержащей все релевантные классы объектов, их связи и правила (теоремы, ограничения), принятые в этой области. Этот термин в информатике является производным от древнего философского понятия «онтология».
Предме́тная о́бласть — множество всех предметов, свойства которых и отношения между которыми рассматриваются в научной теории. В логике — подразумеваемая область возможных значений предметных переменных логического языка.
Ценность информации — одно из важных свойств информации, оценка которого зависит от целей процессов её генерации, рецепции и обработки. Изучается специальными теориями информации, теорией принятия решений.
Семанти́ческая паути́на (англ. semantic web) — это общедоступная глобальная семантическая сеть, формируемая на базе Всемирной паутины путём стандартизации представления информации в виде, пригодном для машинной обработки.
Анализ данных — область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных; процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений. Анализ данных имеет множество аспектов и подходов, охватывает разные методы в различных областях науки и деятельности.
Семантический поиск — способ и технология поиска информации, основанная на использовании контекстного (смыслового) значения запрашиваемых фраз, вместо словарных значений отдельных слов или выражений при поисковом запросе. Улучшение результатов поиска при обработке запросов достигается за счет более точной интерпретации поисковых намерений пользователя.
Фолксоно́мия (англ. folksonomy, от folk — народный + taxonomy таксономия, от гр. расположение по порядку + закон) — народная классификация, практика совместной категоризации информации (текстов, ссылок, фото, видеоклипов и т. п.) посредством произвольно выбираемых меток, называемых тегами.
Визуализация данных — это представление данных в виде, который обеспечивает наиболее эффективную работу человека по их изучению. Визуализация данных находит широкое применение в научных и статистических исследованиях (в частности, в прогнозировании, интеллектуальном анализе данных, бизнес-анализе), в педагогическом дизайне для обучения и тестирования, в новостных сводках и аналитических обзорах. Визуализация данных связана с визуализацией информации, инфографикой, визуализацией научных данных, разведочным...
Юзаби́лити (от англ. usability — «удобство и простота использования, степень удобства использования»), также удо́бство испо́льзования, приго́дность испо́льзования, эргономи́чность — способность продукта быть понимаемым, изучаемым, используемым и привлекательным для пользователя в заданных условиях (ISO/IEC 25010); свойство системы, продукта или услуги, при наличии которого конкретный пользователь может эксплуатировать систему в определенных условиях для достижения установленных целей с необходимой...
Представление знаний — вопрос, возникающий в когнитологии (науке о мышлении), в информатике и в исследованиях искусственного интеллекта.
Обработка естественного языка (Natural Language Processing, NLP) — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза естественных языков. Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста. Решение этих проблем будет означать создание более удобной формы взаимодействия компьютера и человека.
Поисковая машина (поиско́вый движо́к) — комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой системы.
Поиско́вая оптимиза́ция (англ. search engine optimization, SEO) — комплекс мер по внутренней и внешней оптимизации для поднятия позиций сайта в результатах выдачи поисковых систем по определённым запросам пользователей, с целью увеличения сетевого трафика (для информационных ресурсов) и потенциальных клиентов (для коммерческих ресурсов) и последующей монетизации (получение дохода) этого трафика.
Модель данных — это абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абстрактную машину доступа к данным, с которой взаимодействует пользователь. Эти объекты позволяют моделировать структуру данных, а операторы — поведение данных.
Поиско́вая систе́ма (англ. search engine) — это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.
Поиско́вый и́ндекс — структура данных, которая содержит информацию о документах и используется в поисковых системах. Индекси́рование, совершаемое поисковой машиной, — процесс сбора, сортировки и хранения данных с целью обеспечить быстрый и точный поиск информации. Создание индекса включает междисциплинарные понятия из лингвистики, когнитивной психологии, математики, информатики и физики. Веб-индексированием называют процесс индексирования в контексте поисковых машин, разработанных, чтобы искать веб-страницы...
Инженерия знаний (англ. knowledge engineering) — область наук об искусственном интеллекте, связанная с разработкой экспертных систем и баз знаний. Изучает методы и средства извлечения, представления, структурирования и использования знаний.
Рекомендательные системы — программы, которые пытаются предсказать, какие объекты (фильмы, музыка, книги, новости, веб-сайты) будут интересны пользователю, имея определенную информацию о его профиле.
Подробнее: Рекомендательная система
Страница результатов поиска (англ. Search engine results page, SERP) или поисковая выдача — веб-страница, генерируемая поисковой системой в ответ на поисковый запрос пользователя.
Извлечение информации (англ. information extraction) — это задача автоматического извлечения (построения) структурированных данных из неструктурированных или слабоструктурированных машиночитаемых документов.
О термине из программирования см. Зарезервированное слово.Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми словами дать высокоуровневое описание содержания текстового документа, позволяющее выявить его тематику. В вебе используется главным образом для поиска.
Подробнее: Ключевое слово
Отображение онтологий (англ. ontology alignment или ontology matching) — это процесс установления соответствий между понятиями (концептами) нескольких онтологий. Множество таких соответствий и называется «отображением». Термин имеет разное значение в компьютерной, когнитивной областях и философии.
Байесовское программирование — это формальная система и методология определения вероятностных моделей и решения задач, когда не вся необходимая информация является доступной.
Вопросно-ответная система (QA-система; от англ. QA — англ. Question-answering system) — информационная система, способная принимать вопросы и отвечать на них на естественном языке, другими словами, это система с естественно-языковым интерфейсом.
Интеллектуальный агент в первом смысле — это часть технологии разработки операционных систем, и хотя алгоритмы, в нём используемые, могут базироваться на более сложных моделях, чем даже алгоритмы многих SCADA — систем, диапазон и методика его воздействия на состояние системы очень жестко детерминируется. «Интеллектуальный агент» во втором смысле так же не может быть полностью независимым, выполняя свои задачи, но методики его разработки на много порядков сложнее, в силу абсолютно иного уровня сложности...
Экспе́ртная систе́ма (ЭС, англ. expert system) — компьютерная система, способная частично заменить специалиста-эксперта в разрешении проблемной ситуации. Современные экспертные системы начали разрабатываться исследователями искусственного интеллекта в 1970-х годах, а в 1980-х годах получили коммерческое подкрепление. Предшественники экспертных систем были предложены в 1832 году С. Н. Корсаковым, создавшим механические устройства, так называемые «интеллектуальные машины», позволявшие находить решения...
Формализа́ция — представление какой-либо содержательной области (рассуждений, доказательств, процедур классификации, поиска информации, научных теорий) в виде формальной системы или исчисления.
Ана́лиз свя́зей или анализ ссылок (от англ. «link analysis») — это метод анализа данных, используемый в рамках сетевого анализа для оценки отношений (связей) между узлами (объектами/акторами). Отношения могут быть определены для различных типов узлов: людей, организаций, операций и т. д.
Требования к программному обеспечению — совокупность утверждений относительно атрибутов, свойств или качеств программной системы, подлежащей реализации. Создаются в процессе разработки требований к программному обеспечению, в результате анализа требований.
Язы́к запро́сов — это искусственный язык, на котором делаются запросы к базам данных и другим информационным системам, особенно к информационно-поисковым системам.
Семанти́ческая сеть — информационная модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а дуги (рёбра) задают отношения между ними. Объектами могут быть понятия, события, свойства, процессы. Таким образом, семантическая сеть является одним из способов представления знаний. В названии соединены термины из двух наук: семантика в языкознании изучает смысл единиц языка, а сеть в математике представляет собой разновидность графа...
Храни́лище да́нных (англ. Data Warehouse) — предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения.
Приватность в Интернете включает в себя право на хранение, передачу, предоставление третьим лицам и отображение информации кому-либо через Интернет. Конфиденциальность в Интернете — это часть конфиденциальности данных. Проблемы конфиденциальности были сформулированы с самого начала широкомасштабного обмена информацией при помощи компьютера.
Интеграция данных включает объединение данных, находящихся в различных источниках, и предоставление данных пользователям в унифицированном виде. Этот процесс становится существенным как в коммерческих задачах (когда двум похожим компаниям необходимо объединить их базы данных), так и в научных (комбинирование результатов исследования из различных биоинформационных репозиториев, для примера). Роль интеграции данных возрастает, когда увеличивается объём и необходимость совместного использования данных...
Компьютерно-опосредованная коммуникация (англ. computer-mediated communication, СМС) — это любое общение между людьми, которое происходит при помощи двух или более электронных устройств. Обычно этим термином называют способы общения, характерные для компьютерных устройств (например, электронная почта, чаты, интернет-форумы, социальные сети и т. п.). Кроме того, термин может применяться к любому текстовому общению. Исследования компьютерно-опосредованной коммуникации фокусируются в основном на социальных...
В компьютерных науках програ́ммный аге́нт — это программа, которая вступает в отношение посредничества с пользователем или другой программой. Слово «агент» происходит от латинского agere (делать) и означает соглашение выполнять действия от имени кого-либо. Такие «действия от имени» подразумевают право решать, какие действия (если они нужны) являются целесообразными. Идея состоит в том, что агенты не запускаются непосредственно для решения задачи, а активизируются самостоятельно.
О́блако те́гов (облако слов, или взвешенный список, представленное(-ый) визуально) — это визуальное представление списка категорий (или тегов, также называемых метками, ярлыками, ключевыми словами и т. п.) Обычно используется для описания ключевых слов (тегов) на веб-сайтах, или для представления неформатированного текста. Ключевые слова чаще всего представляют собой отдельные слова, и важность каждого ключевого слова обозначается размером шрифта или цветом. Такое представление удобно для быстрого...
Машинное обучение (англ. machine learning, ML) — класс методов искусственного интеллекта, характерной чертой которых является не прямое решение задачи, а обучение в процессе применения решений множества сходных задач. Для построения таких методов используются средства математической статистики, численных методов, методов оптимизации, теории вероятностей, теории графов, различные техники работы с данными в цифровой форме.
Идентифика́ция в информационных системах — процедура, в результате выполнения которой для субъекта идентификации выявляется его идентификатор, однозначно идентифицирующий этого субъекта в информационной системе. Для выполнения процедуры идентификации в информационной системе субъекту предварительно должен быть назначен соответствующий идентификатор (то есть проведена регистрация субъекта в информационной системе).
Бизнес-логика — в разработке информационных систем — совокупность правил, принципов, зависимостей поведения объектов предметной области (области человеческой деятельности, которую система поддерживает). Иначе можно сказать, что бизнес-логика — это реализация правил и ограничений автоматизируемых операций. Является синонимом термина «логика предметной области» (англ. domain logic). Бизнес-логика задает правила, которым подчиняются данные предметной области.
Выделение признаков — это процесс снижения размерности, в котором исходный набор сырых переменных сокращается до более управляемых групп (признаков) для дальнейшей обработки, оставаясь при этом достаточным набором для точного и полного описания исходного набора данных.
Эмпирические исследования – наблюдение и исследование конкретных явлений, эксперимент, а также обобщение, классификация и описание результатов исследования эксперимента, внедрение их в практическую деятельность человека.