Большие данные, цифровизация и машинное обучение для собственников и топ-менеджеров, Или как зарабатывать больше с помощью информации

Алексей Сергеевич Гуржиев, 2023

Эта книга будет полезна любому руководителю вне зависимости от уровня знаний программирования. В ней на доступном языке рассказывается о больших данных, машинном обучении и способах их применения в бизнесе для уменьшения издержек и увеличения прибыли.Помимо машинного обучения в книге раскрывается тема управления персоналом и контроля основных показателей компании с помощью информационной системы. Рассказывается как именно она должна быть построена, какими функциями должна обладать и как работать.И подарок! К книге прилагается демонстрационный сайт с интерактивными 2D/3D графиками, советами и примерами создания информационной системы компании. Примеры на сайте поясняют и дополняют информацию из глав книги…

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Большие данные, цифровизация и машинное обучение для собственников и топ-менеджеров, Или как зарабатывать больше с помощью информации предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Введение

Выйти на самоокупаемость в XXI веке — непростая задача для любой компании, если она не использует большие данные, цифровизацию и машинное обучение в своей повседневной деятельности. Не говоря уже о том, что без этих инструментов невозможно увеличить прибыль и оптимизировать бизнес-процессы. Основная причина — перенасыщенный предложением рынок, на котором борьба идет за доли процента прибыли. А при таком масштабе привычные методы ведения бизнеса становятся бесполезными, и приходится прибегать к помощи вычислительной техники.

Изучив это руководство, вы поймете:

• Для чего бизнесу нужны «большие данные». Почему невозможно начать собирать их без цифровизации компании. Зачем создавать информационные панели для собственников и топ-менеджеров.

• Как устроено машинное обучение, каким образом оно связано с большими данными, какие задачи решает, за счет чего увеличивает прибыль и снижает издержки.

Несмотря на то, что тема, затронутая в этой книге, так или иначе касается программирования, вы не встретите здесь примеров программного кода. Я лишь схематично расскажу, что и за чем следует, чтобы у вас появилось хотя бы общее представление о предмете. Основное же внимание при изложении материала будет уделено тому, чтобы познакомить с особенностями сбора больших данных, автоматизации процессов, визуализации результатов и контроля жизненных показателей бизнеса сквозь призму больших данных руководителей и топ-менеджеров и мотивировать их на внедрение новых инструментов в своих компаниях. Фактически эта книга — научпоп о цифровизации, машинном обучении и уже упомянутых больших данных.

Также в данном руководстве вы найдете информацию, касающуюся управления компанией. Но речь не идет о традиционном управлении коллективом или командой. Здесь описывается способ построения такой системы взаимодействия с сотрудниками, чтобы свести контакты между людьми к минимуму. Этот тип организации рабочего процесса, без сомнения, придется по душе интровертам, которые мечтают о том, чтобы их компания работала сама по себе: без звонков, писем, долгих уговоров и лишних усилий. Благодаря предлагаемому способу вся информация и рабочие задачи оказываются в единой системе, облегчая управление всеми происходящими процессами и контроль за ними. Да, и без такой системы крайне сложно начать собирать большие данные и проводить машинное обучение. Поэтому шаги по ее внедрению будут подробно описаны в первой части книги, которую вы держите в руках.

В дополнение к этому руководству был создан сайт RealBigData.ru. Он является демонстрационным, представляя «информационную панель компании», речь о которой пойдет дальше. В отдельных главах в качестве поясняющих материалов к тексту будут встречаться изображения с этого сайта, но на нем также размещены уникальные рекомендации, которых нет в книге: например, информация о том, на какие показатели компаний чаще всего обращают внимание профессиональные инвесторы. Поэтому обязательно посетите сайт и опробуйте предлагаемую систему — не упускайте возможность получить по-настоящему ценные знания!

Для кого и о чем эта книга

Цель данного руководства — заинтересовать предпринимателей в цифровизации бизнеса и использовании больших данных для увеличения прибыли и снижения издержек.

Эта книга в первую очередь рассчитана на мудрых руководителей зрелого возраста. Поскольку в основном у руля большого числа отечественных компаний находятся именно такие собственники и топ-менеджеры. Часто они не позволяют использовать новые подходы к управлению организацией и производственным циклом, небезосновательно утверждая, что бумажный документооборот надежнее электронного. С одной стороны, это действительно так. И в идеале было бы неплохо хранить бумажные копии всех документов фирмы где-нибудь в бункере на северном полюсе на случай ядерной войны. Но с другой стороны, цифровизация позволяет заметно увеличить чистую прибыль и повысить общий уровень управляемости компании. Поэтому руководителям с многолетним стажем все же стоит сделать над собой усилие ради достижения, по сути, главной цели любого бизнеса — получения прибыли, и начать полноценно, со знанием дела пользоваться компьютером, интернетом и всеми технологиями, которые позволяют сделать рабочий процесс более легким и эффективным.

Несмотря на очевидные плюсы, многие опытные управленцы боятся шагнуть в неизвестность. Поэтому основной задачей этого руководства как раз и является подробное аргументированное объяснение важности квалифицированного использования электронных вычислительных машин с целью получения большей выгоды. В том числе в данной книге будут рассмотрены следующие вопросы:

• Большие данные. Необходимость сбора информации, способы ее хранения и обработки.

• Визуализация данных. Построение графиков и вычисление основных бизнес-показателей в режиме реального времени.

• Машинное обучение. Способы создания моделей машинного обучения на больших данных и их использование для прогнозирования результатов бизнес-процессов.

• Цифровизация производства. Сбор больших данных как при производстве товара (или услуги), так и при контроле качества готового изделия.

• Организация работы сотрудников. От необходимости их перевода на «удаленку» до создания портала (веб-сайта) предприятия для служебного использования.

Все эти темы будут обильно сдобрены примерами успешного использования больших данных как применительно к ежедневной аналитике, так и для прогнозирования редких процессов. При этом в данном руководстве я намеренно старался избегать сложных технических терминов, изложив материал языком, доступным обычному пользователю персонального компьютера. А яркие наглядные примеры позволят вам осознать важность сбора, обработки и анализа всех возможных больших данных, даже если у вас за плечами нет специальных знаний и навыков.

Профессионал же в области машинного обучения, больших данных и их анализа после прочтения следующего абзаца, скорее всего, захочет предать автора анафеме за упрощение терминологии и отступление от строгих математических канонов. Но неопытных новичков это, напротив, должно успокоить: в данной книге точность терминологии принесена в жертву доступности текста. Поверьте, так легче начинать «с нуля» читать о том, о чем никогда раньше не слышал, а возможно, даже и не хотел слышать.

Вследствие упрощения языка этого руководства от читателя потребуется запомнить синонимы некоторых определений. Например, в тексте будут встречаться разные наименования для «алгоритмов машинного обучения»: от сокращенного «алгоритм» до более длинного «искусственный интеллект» или «машинный интеллект». При этом «компьютер» может называться «сервером» или просто «машиной» (не путать с автомобилем). Также на протяжении всей книги красной нитью проводится мысль о том, что надо бережно подходить к большим данным, сохраняя все, что только возможно, для того чтобы в будущем на их основе проводить «тренировку», «обучение» компьютера. Так вот, это в буквальном смысле «тренировка», во время которой машина выясняет, в какой степени взаимосвязаны тысячи разных параметров. После окончания такого обучения компьютер сохраняет сделанные выводы для дальнейшего их использования. Эта сохраненная логика называется «моделью машинного обучения» (иногда в тексте — «алгоритмом»). У такой модели можно попросить «предсказать» результат процесса, о котором она узнала в рамках обучения.

Если вам ясно не все, о чем говорится в предыдущем абзаце, не переживайте. Руководство, собственно, и предназначено для того, чтобы после его изучения вам стала понятнее данная область человеческой деятельности. Для этого все механизмы и процессы не только подробно описаны в книге теоретически, но и проиллюстрированы многочисленными примерами их практического использования в бизнесе.

Источники данных

Автор данной книги является предпринимателем в области информационных технологий с многолетним опытом создания и продвижения собственных проектов (более 10 штук). Поэтому иногда в тексте вы будете встречать цифры и факты без пояснительной сноски на исследовательские статьи-источники. Эта информация была получена из личного опыта автора этой книги, что нисколько не умаляет ее значимость и даже напротив: ее стоит воспринимать как актуальное и реальное положение дел в IT-бизнесе на территории России в 2023 году.

Порядок и план изложения материала

В разных главах этой книги десятки раз будет возникать одна и та же цепочка из трех элементов: «цифровизация» — «большие данные» — «машинное обучение». Но структуру изложения правильнее назвать «спиралевидной». Потому что на каждом последующем витке обсуждения будут рассматриваться новые вопросы, тонкости и особенности всех трех составляющих. Таким образом, читатель сможет последовательно, по нарастающей вникнуть в различные аспекты и без лишнего напряжения овладеть этими темами на хорошем уровне. Главную же мысль данного руководства, которая и описывает вышеуказанную спираль, можно сформулировать так: «Машинное обучение позволяет заработать больше. Но чтобы обучить машину, нужны большие данные. А чтобы собрать большие данные, нужна единая информационная система компании и цифровизация всего трудового процесса».

В первой части книги мы поговорим о цифровизации некоторых процессов компании, а точнее разных ее отделений. Затем разберем способ объединения разрозненных систем. Все эти шаги позволят собирать и накапливать большие данные, о которых речь пойдет в середине руководства.

Если же читатель уже провел цифровизацию всех отделений своей компании, создал единую информационную систему и начал накапливать большие данные, ему стоит сразу обратить внимание на последнюю треть этой книги. Начиная с глав «Примеры успеха» и «Примеры неудач» и далее описаны разнообразные способы использования больших данных и машинного обучения. Приведенные истории взяты из совершенно разных отраслей предпринимательской деятельности: от свинофермы до аэропорта. В них обязательно найдутся идеи и для вашего бизнеса.

Почему машинное обучение стало полезным

С момента появления людей на планете и до двадцатого века нашей эры человечество накопило примерно два терабайта информации в виде печатных книг, рукописных свитков, скрижалей, изображений на стенах пещер и т. п. Но в настоящее время (2023 год) мы создаем подобный объем информации за долю секунды (более 300 экзобайт в день). При этом с каждым днем скорость накопления данных резко увеличивается. Почти 90 % всей существующей информации появилось за последние 2 года. А общее количество данных, накопленных человечеством, достигает уже 120 зетабайт[1].

Весь этот объем надо не только хранить, но и обрабатывать. А алгоритмы классической математики плохо работают в подобных масштабах. Предвосхищая текущее положение дел, еще в период между 1943 и 1965 годом у человечества начали появляться новые методы обработки данных, основанные на машинном обучении. Тогда же были сформулированы основные положения, описывающие, что собой представляют нейронные сети, глубокое обучение и искусственный интеллект в целом. Но путь от теории к практике оказался долгим и тернистым, потому что вычислительная электроника на момент появления первых идей находилась в зачаточном состоянии и была неспособна потягаться даже с современным калькулятором. В результате в области прикладных исследований возникла небольшая пауза.

Через пару десятков лет, в период между 1970 и 1989 годами произошел качественный скачок в развитии баз данных и электроники. Что позволило систематизировать и обрабатывать информацию в той форме, объемах и с такой скоростью, которые требовались для начала использования машинного обучения в промышленных масштабах.

Современный вычислительный сервер (производства 2023 года) из верхнего ценового сегмента, который стоит как автомобиль, легко займет первую строчку в рейтинге 500 самых мощных суперкомпьютеров мира 2000 года. При этом его энергопотребление в три раза ниже, чем у обычного чайника или пылесоса. Благодаря этому любая компания, даже не имеющая большого штата системных администраторов, электриков и программистов, может создавать свои модели машинного обучения, обрабатывая огромные массивы данных. Более того, энтузиасты уже умудряются использовать вычислительные мощности кофеварок, микроволновок и роботов-полотеров для непрерывного анализа информации.

Можно смело сказать, что машинное обучение плотно вошло в нашу жизнь и никуда теперь не исчезнет. С каждым годом все больше компаний будут пользоваться его плодами, обгоняя конкурентов. Поэтому читателю лучше отвергнуть все мысли о том, что это лишь временное явление и не стоит торопиться приступать к изучению новой науки. Прочитав эту книгу, каждый может выйти на достойный уровень понимания всех причин, последствий и способов применения машинного обучения и больших данных в бизнесе.

Битва за хлебные крошки

С начала века бизнес претерпел существенные изменения, вызванные третьей промышленной революцией (информатизацией), развитием каналов продаж и рекламы. При этом доходы его непрерывно падают из-за растущей конкуренции на рынке. Если раньше наценка 50 % считалась вполне привычным делом, то сейчас 3–5 % — это уже большая удача. И если получается сохранить часть пирога выручки после оплаты себестоимости, бизнес выходит на самоокупаемость. А в некоторых случаях даже становится успешным. И, как это ни парадоксально, чем крупнее компания и сложнее ее бизнес-процессы, тем точнее выражение «битва за хлебные крошки» описывает процесс увеличения выручки. Справедливости ради отметим, что у состоявшегося бизнеса доли процента от прибыли могут составлять десятки или даже сотни миллионов рублей. Поэтому, если не бороться буквально за каждую копейку себестоимости, считая ее мелочью, недостойной внимания, потери прибыли могут быть колоссальными.

Итак, сегодня битва идет за проценты прибыли, которые могут решить судьбу всей компании. Эта борьба ведется с помощью автоматизации всех рабочих процессов и за счет снижения издержек в каждом отделении. Ввиду этого набор сотрудников уже давно проводится с пристрастием. Сегодня никто не нанимает «девочку для продаж по телефону» — разумнее отдать ее зарплату программисту, который автоматизирует весь процесс и принесет компании во много раз больше пользы. Поэтому можно без преувеличения сказать, что основными солдатами в бою за повышение прибыли являются специалисты, которые, жонглируя большими данными, позволяют эффективно повышать рентабельность бизнеса за счет обработки огромных массивов информации, их анализа и внедрения следующих из этого процедур, способствующих улучшению работы компании.

Спрос на таких специалистов появляется не только из-за потребностей бизнеса, но и вследствие роста информационной грамотности населения. Для примера сравним розничную торговлю, осуществляемую через интернет-магазины в начале века и сейчас. Если раньше достаточно было продавать товары на одном собственном сайте компании, то теперь необходимо размещать их еще и на «чужих» площадках («Яндекс.Маркет», Ozon, Wildberries и т. п.), использовать агрегаторы и даже социальные сети, которые тоже стали точками продаж. Некоторые сервисы предлагают бизнесменам услуги по созданию таких автоматических выгрузок, однако они не могут удовлетворить индивидуальные запросы клиентов с помощью имеющихся функций. Ведь между компаниями царит жесткая конкуренция в погоне за увеличением процента прибыли. То есть за максимальное привлечение клиентов. Поэтому бизнесу приходится брать дело в свои руки, нанимать штатных программистов и специалистов по большим данным. Их работа с торговыми площадками и соцсетями в «ручном режиме» позволяет достичь более тонкой настройки, а также снизить издержки на доработку стандартного программного обеспечения, что в конечном итоге приводит к увеличению прибыли.

Зарплаты у программистов довольно высокие. Поэтому небольшим компаниям, которые только выходят на современный переполненный конкурентами рынок, может показаться, что достичь самоокупаемости в такой среде практически невозможно. Однако в действительности, хотя у крупных корпораций и есть сотни программистов, которые могут переиграть любого конкурента, процесс их «раскачки» занимает довольно продолжительное время. Небольшие «маневренные» фирмы способны быстрее подстроиться под течения рынка, держа нос по ветру. Они вполне вольготно могут существовать и развиваться в своей нише, куда большие игроки еще не добрались из-за неповоротливости их бюрократической машины. Но когда небольшая компания хорошо себя чувствует, она волей-неволей начинает расти ради получения еще большей прибыли. И со временем переходит в другую конкурентную лигу. Круг замыкается: хочешь жить спокойно — будь маленьким и слабым, хочешь жить сытно и по-царски — качай мышцу. Поэтому идеальной стратегией для фирм любого размера будет постепенный набор программистов с самого начала своего существования. Иначе можно просто потерять бизнес, если спохватиться слишком поздно.

Если вы разделяете такой подход к делу, который требует бо́льших затрат на своих программистов, но в ответ дает вам полную свободу и гибкость по извлечению прибыли из бизнес-процессов, эта книга для вас. Однако даже если вы его не разделяете и склонны нанимать на работу сторонних специалистов, эта книга и для вас тоже, потому что позволит при найме делать осознанный выбор. Повторюсь: здесь вы найдете описание всего процесса сбора, аналитики и обработки больших данных.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Большие данные, цифровизация и машинное обучение для собственников и топ-менеджеров, Или как зарабатывать больше с помощью информации предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Примечания

1

F. Duarte (2023) Amount of Data Created Daily (https://explodingtopics.com/blog/data-generated-per-day).

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я