Топологический анализ данных

Топологический анализ данных — новая область теоретических исследований для задач анализа данных (Data mining) и компьютерного зрения.

Основные вопросы:

  1. Как из низкоразмерных представлений получать структуры высоких размерностей;
  2. Как дискретные единицы складываются в глобальные структуры.

Человеческий мозг легко строит представление об общей структуре по частным данным низких размерностей.

Ему, например, не составляет труда получить трехмерную форму объекта по плоским изображениям в каждом глазу. Создание общей структуры также производится при объединении дискретных во времени фрагментов в непрерывный образ. Так, например, телевизионное изображение технически является массивом отдельных точек, который, однако, воспринимается как единая сцена.

Основной метод топологического анализа данных:

  1. Замена набора элементов данных некоторым семейством симплициальных комплексов в соответствии с параметром близости.
  2. Анализ этих топологических комплексов с помощью алгебраической топологии, а конкретно новой теорией персистентных гомологий.
  3. Перекодировка устойчивой гомологии набора данных в параметризованную версию чисел Бетти, далее называемую штрихкодом.

Источник: Википедия

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я