Математика для DATA SCIENTIST. Анализ данных и математическое моделирование (путеводитель)

Леонид Гербертович Никифоров

Представлен курс математики для специализации DATA SCIENTIST, включающий в себя такие разделы как Алгебра, Математический анализ бесконечно малых переменных величин, Комбинаторика, Теория вероятностей и математическая статистика, а также Дифференциальные уравнения и Анализ данных. Когда спрашивают – зачем DATA SCIENTIST’у дифференциальные уравнения, можно вспомнить графики Курта Воннегута в координатах (время по оси Х, уровень счастья-несчастья по оси Y, есть на youtube).

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Математика для DATA SCIENTIST. Анализ данных и математическое моделирование (путеводитель) предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

© Леонид Гербертович Никифоров, 2021

ISBN 978-5-0053-4495-3

Создано в интеллектуальной издательской системе Ridero

Математика (Математическое обучение) для DATA SCIENTIST

Предисловие

Когда спрашивают — зачем DATA SCIENTIST’у дифференциальные уравнения, можно вспомнить графики Курта Воннегута в координатах (время по оси Х, уровень счастья-несчастья по оси Y).

https://www.youtube.com/watch?v=EEL-PIZVO08

Например, постепенное затухание жизненных сил описывается кратко и понятно одной формулой exp (-k* t), которую сразу видно на графике, где t — время, а что может быть понятнее этой переменной? Или атомный взрыв — той же экспонентой, только с положительным аргументом exp (k*t), качания на качелях или супружескую эмоциональную жизнь — одним уравнением x’' = — k*x. И траекторией y= sin (t). Как тут не вспомнить один из лучших учебников по Микроэкономике Вэриана, где автор долго и добросовестно уговаривает американцев выучить производные, чтобы одной строчкой записывать то, что иначе надо на целую страницу разъяснять.

Совсем недавно мне нужно было консультировать магистерскую диссертацию по «Применение DATA SCIENCE в классификации архетипов американских киносценариев», там была взята за основу тройка хэппи-ендов и тройка трагедий в тех же координатах, что и у Курта Воннегута.

Теперь давайте предположим, что у нас есть случайная величина Z по всему сценарию как оценка (счастья-несчастья) в данный момент времени t. Ну и соответственно выборка Z (n). Как нам найти главного героя? Если есть только реплики? Я предложил ввести аналогичные Х1 (t), X2 (t) и т. д. Конечно, чтобы определить главного героя DATA SCIENCE будем вычислять ковариацию и/или корреляцию corr (Z, Xi). То есть достаточно всего одного числа — по выборке. А как определить врага главного героя? Надо искать отрицательную максимальную корреляцию. А если корреляция близка к нолю? Это кто, как вы думаете, Уважаемый Читатель? Вот вам и потребность в Теории вероятностей и Корреляционном анализе для DATA SCIENTIST.

Иногда также сомневаются в нужности Векторной алгебры и даже матриц, но это снимается теми соображениями, что бальшие массивы данных частно необходимо делить на блоки с малыми связями, как бы нарезать подмножества из всего большого множества. А также уметь смотреть под разными углами или с разных точек зрения. Но ведь это не что иное, как замена базиса пространства и определение ортогональных подпространств меньшей размерности. Вообще говоря, Линейная алгебра — должна быть в преподавании доведена до максимальной степени простоты и это только улучшает ее понимание учащимися.

Что касается предмета «Математический анализ бесконечно малых переменных величин», то мне трудно представить начинающего DATA SCIENTISTa, кто бы сомневался в необходимости этого фундаментального раздела высшей математики.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Математика для DATA SCIENTIST. Анализ данных и математическое моделирование (путеводитель) предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я