Как создать Центр искусственного интеллекта за 100 дней

Александр Чесалов

В мае 2021 года мне выпала уникальная возможность стать человеком, перед которым была поставлена задача создать Центр разработки и внедрения сильного и прикладного искусственного интеллекта МГТУ им. Н. Э. Баумана.За сто мимолётных дней невероятно жаркого лета 2021 года была проведена огромная и сложная работа!Это книга дарит вам всю полноту эмоций, полученного опыта и невероятные знания о будущем.Приятного вам чтения!Искренне Ваш, Александр Чесалов.

Оглавление

Глава 2. 20.05.2021: Как все начиналось

Сегодня возникла идея — написать новую книгу о том, как создать Центр искусственного интеллекта за сто дней.

Да, именно. Всего за 100 дней…

Каждый раз, когда берешься за написание новой книги, встает вопрос: «с чего начать?»

Первые строки пишутся с трудом (например, я уже пару раз переписал это предложение, а потом, как книга наполнилась информацией, переписал еще раз).

Когда я размышляю и думаю о чем-то, например, о написании этой книги, ее теме или о ее содержании, мысли в голове летят со скоростью света. Но когда я сажусь за компьютер и начинаю писать, набирать текст, то «полет мысли», волей не волей, приходится останавливать или, если так можно сказать, притормаживать. Мысли приходят очень быстро, руки набирают текст медленно, поэтому написание новой книги — это всегда такой процесс, который меняет реальность вокруг, меняет привычный ритм жизни человека, отдающего свои знания, опыт и эмоции этому процессу.

Иногда приходит мысль: может воспользоваться диктофоном? Конечно, диктофон — это тоже своеобразный интерфейс между мыслью, человеком, звуком, текстом и книгой. Если появляется желание надиктовать книгу, вы также должны понимать, что вам понадобится выработать свой ритм для изложения мыслей вслух, ведь интересная мысль может так и не успеть материализоваться, пока вы пытаетесь подобрать подходящие к ней слова.

Вот так, в который раз, начинается моя работа…

У любого человека, взявшего в руки эту книгу, сразу возникают множество вопросов: «Почему за сто дней? Как вообще можно создать Центр искусственного интеллекта в такой срок? Что, вообще, может быть интересного в этом Центре, их и так сейчас, как грибов после дождя?» и т. д.

Не буду мучить читателя долгими объяснениями или формальными ответами. Расскажу все с самого начала и по порядку.

Эта история начинается с того, что после майских праздников, а именно 17 мая 2021 года меня пригласили на работу в МГТУ им. Н. Э. Баумана, а если быть точнее, в Межотраслевой Инжиниринговый Центр «Композиты России», который является структурным подразделением МГТУ им. Н. Э. Баумана. «Композиты России» появились на свет 15 июня 2011 года с целью содействия в разработке, производстве и коммерциализации высокотехнологичных решений Университета в области новых материалов и информационных технологий, формирования научного задела и современных образовательных технологий и программ. Одним словом, в этот Центр я пришел, чтобы выполнить определенную работу, а именно создать и развить новое направление, в некотором смысле можно даже сказать бизнес-направление, а именно «Центр искусственного интеллекта МГТУ им. Н. Э. Баумана».

На первых порах было не совсем ясно, как это все будет реализовываться…

Кроме красивого словосочетания «искусственный интеллект» (далее ИИ), по факту, у нас не было ничего. Но со временем эта идея, даже не концепция, а именно «идея» создания Центра сильного искусственного интеллекта (изначально именно «сильного» ИИ), проведение фундаментальных исследований в этой области, создание самого ИИ, цифровой платформы (концепция «Искусственный интеллект как сервис»), фреймворков, цифровых сервисов и продуктов на их основе, начала материализовываться, но об этом чуть позже.

На тот момент времени, мое собственное понимание выстраивания процесса работы представлялось мне так: в период с мая по конец августа 2021 года, мне, как человеку, которому эту задачу поручили (в качестве Заместителя Директора Центра, «отвечающего за все головой»), предстояло выиграть новый конкурс на отбор получателей поддержки исследовательских центров в сфере искусственного интеллекта, в том числе в области «сильного» искусственного интеллекта, систем доверенного искусственного интеллекта и этических аспектов применения искусственного интеллекта.

Дата объявления конкурса (на тот момент времени) еще точно не была определена. То ли в июле, то ли в августе, но было ясно то, что с большей долей вероятности в нем примут участие большинство высших учебных заведений нашей страны.

Основная суть этого конкурса заключалась в том, что государство предоставляет шесть грантов по 900 млн руб. на создание и развитие центров искусственного интеллекта на базе ВУЗов, то есть всего шесть призовых мест. Дополнительным условием получения гранта ВУЗом — это привлечение индустриального партнера (так сказать, компании с рынка), который бы был готов инвестировать в проект и задачи центра ВУЗа дополнительно 270 млн руб.

План софинансирования Центра представлен на рисунке ниже.

Сделаю небольшое отступление.

Предпосылки к появлению конкурса появились еще в 2019 году.

Как, возможно, уже известно читателю, в целях обеспечения ускоренного развития искусственного интеллекта в Российской Федерации, проведения научных исследований в области искусственного интеллекта, повышения доступности информации и вычислительных ресурсов для пользователей, совершенствования системы подготовки кадров в этой области, был опубликован Указ Президента Российской Федерации от 10.10.2019 г. №490, который утвердил Национальную стратегию развития искусственного интеллекта на период до 2030 года.

Позже, в 2021 году Минэкономразвития России, в целях реализации Национальной стратегии развития искусственного интеллекта на период до 2030 года, разработало паспорт федерального проекта «Искусственный интеллект».

Направления финансирования представлены на рисунке ниже.

Финансирование Федерального проекта «Искусственный интеллект» в 2021—2024 гг. составляет 31,5 млрд рублей, из которых 24,6 млрд рублей выделяется из федерального бюджета, а также привлечено из внебюджетных источников 6,9 млрд рублей.

Соответственно 5,7 млрд рублей выделялось на проведение именно того самого конкурса, в котором МГТУ им. Н. Э. Баумана должен был принять непосредственное участие, а я должен был организовать весь процесс, в том числе в части написания Программы и Плана мероприятий Центра.

Сложностей на пути к достижению поставленной передо мной цели оказалось не просто много, а очень много.

Одна из них, которая могла бы свести всю начатую работу к нулю, заключалась в поиске индустриального партнера и инвестиций в проект.

Где найти компанию, которая бы поверила в потенциал МГТУ им. Н. Э. Баумана и вложила бы в совместный проект 270 млн руб.?

Вопрос, как говорится, на миллиард и сто семьдесят миллионов…

Что же в таком случае делать?

Ответ очевиден — нужно идти к поставленной цели. Мы пошли двумя очевидными для нас путями: подготовили письма и предложения для потенциальных компаний-инвесторов, сделав уйму различных версий документов и презентаций, а также стали представлять наш проект на всех возможных мероприятиях, форумах и выставках.

Параллельно с той работой, как мне тогда представлялось, нужно было сформировать «с нуля» группы разработки для решения прикладных технических задач. Несмотря на то, что какие-то специалисты в МГТУ им. Н. Э. Баумана уже имелись на тот момент, ситуация с ними была такая, что все они занимались каждый своими задачами и не было ни единой цели, ни стратегии, ни задач, которые бы могли их объединить в одну мощную команду. Самое любопытное в том, у меня сложилось мнение о том, что у некоторых из этих «специалистов» даже нет понимания того, что же такое «искусственный интеллект», нет единого мнения, нет понимания «единой цели» и более того, как выяснилось позже, у них нет желания «созидать» и делать это совместными усилиями.

Тут необходимо сделать небольшое отступление для читателя и дать несколько ключевых определений:

Искусственный интеллект (artificial intelligence), с одной стороны, — это уже целая отрасль компьютерных наук, занимающаяся моделированием интеллектуального поведения, с другой — это компьютерная система, основанная на комплексе научных и инженерных знаний, а также технологий создания интеллектуальных машин, программ, сервисов и приложений (например, машинного обучения и глубокого обучения), имитирующая мыслительные процессы человека или живых существ, способная с определенной степенью автономности воспринимать информацию, обучаться и принимать решения на основе анализа больших массивов данных, целью создания которой является помощь людям в решении их повседневных рутинных задач..

Машинное обучение (machine learning) — это подмножество искусственного интеллекта, которое использует компьютерные алгоритмы для анализа данных и принятия разумных решений на основе полученных знаний без явного программирования. Алгоритмы машинного обучения обучаются на больших наборах данных и учатся на примерах. Они не следуют алгоритмам, основанным на правилах. Машинное обучение — это то, что позволяет машинам самостоятельно решать проблемы и делать точные прогнозы, используя предоставленные данные.

Нейронная сеть (artificial neural networks) — математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. Также, под нейронной сетью понимают набор небольших вычислительных единиц, называемых нейронами, которые принимают входящие данные и учатся принимать решения с течением времени. Нейронные сети часто имеют многоуровневую структуру и являются причиной того, что алгоритмы глубокого обучения становятся более эффективными по мере увеличения объема наборов данных, в отличие от других алгоритмов машинного обучения, которые по мере увеличения объема данных могут выйти на плато.

Глубокое обучение (deep learning) — это специализированное подмножество машинного обучения, которое использует многоуровневые нейронные сети для имитации принятия решений человеком, путем извлечения знаний из необработанных данных и их преобразования на каждом уровне. Эти уровни постепенно получают функции более высокого уровня из необработанных данных, что позволяет решать сложные проблемы с более высокой точностью, меньшим количеством функций и меньшей ручной настройкой. Алгоритмы глубокого обучения могут маркировать и категоризировать информацию и определять закономерности. Это то, что позволяет системам ИИ постоянно учиться на работе и улучшать качество и точность результатов, определяя, были ли решения правильными.

Наука о данных (Data Science) — это процессы и методы извлечения знаний и идей из больших объемов разрозненных данных. Являясь междисциплинарной областью, она включает математику, статистический анализ, визуализацию данных, машинное обучение и многое другое. Наука о данных позволяет нам анализировать информацию, видеть закономерности, находить смысл в больших объемах данных и использовать их для принятия решений, или, как я часто говорю, получать «ценность» или «знания» из данных. Наука о данных может использовать разные методы искусственного интеллекта для анализа данных.

Итак, мне нужны были руководители групп разработки (именно «групп») и сами разработчики, которые бы работали в разных направлениях, решая задачи из некой составленной мной «матрицы», в которой по вертикали находились отрасли экономики, а по горизонтали технологии искусственного интеллекта (работа с «голосом», «текстом», «изображениями» и т.д.), а внутри, на их пересечении, располагались бы отраслевые задачи от наших потенциальных заказчиков и индустриальных партнеров. «Технари» мне нужны были еще и за тем, чтобы они помогали мне в процессе поиска индустриального партнера и привлечению новых заказов в Центр, показывая наши реальные наработки и компетенции.

По факту, все вышло несколько иначе, чем я себе это представлял…

С технарями ничего не получилось.

Времени собрать их было слишком мало, не говоря уже о том, чтобы в кратчайшие сроки сделать хоть сколь-нибудь работающий прототип для демонстрации заказчикам.

И, по факту, оставалось только одно — готовить презентационный материал, который бы раскрывал потенциал нашего будущего Центра, с темами («кейсами») для различных отраслей экономики и заказчиков.

Среди перспективных для нашего Центра были: государство, здравоохранение и промышленность. Позже мы переориентировались на телекоммуникационный рынок.

В силу того, что МГТУ им. Н. Э. Баумана посещают ежедневно большое число руководителей крупных предприятий и организаций, а также министров и чиновников из различных министерств и ведомств, буквально за первые недели у нас набралось несколько десятков предложений для заказчиков по разным темам.

Ниже я привожу визуальное изображение, которое отражает перечень из 75 взаимосвязанных задач от наших заказчиков, которые сформировались уже за пару месяцев подготовки к конкурсу по тематике искусственного интеллекта.

Читателю на столь маленькой картинке, к сожалению, будет плохо видно, но для общего понимания происходящих процессов и объема предстоящих работ, я все-таки публикую наш рабочий файл, в котором отражены все задачи наших заказчиков.

На что стоит также обратить свое внимание, так это на то, что задачи поступали от таких организаций, как Министерство обороны РФ, ФНС, Роскосмос, МВД, Министерство строительства и жилищно-коммунального хозяйства РФ, НИИ «Восход», РФЯЦ-ВНИИЭФ, Росатом, Министерство энергетики РФ и многих других.

Эта визуализация, в свою очередь, говорит о высокой потребности на рынке в использовании технологий искусственного интеллекта для решения локальных задач автоматизации в совершенно разных отраслях экономики.

Популярность нашего Центра стала потихоньку набирать обороты.

Другая совсем не маленькая проблема заключалась в том, чтобы определиться с направлением работ и темой будущей Программы.

Согласно требованиям конкурсной документации для участников отбора были определены 14 передовых направлений развития сферы искусственного интеллекта, в том числе «сильного» искусственного интеллекта, систем доверенного искусственного интеллекта и этических аспектов применения искусственного интеллекта, для определения тематик Центров, а именно:

— Направление «Искусственный интеллект для промышленности».

— Направление «Искусственный интеллект для медицины».

— Направление «Биометрические технологии искусственного интеллекта».

— Направление «Искусственный интеллект для оптимизации управленческих решений в целях снижения углеродного следа».

— Направление «Анализ естественного языка методами искусственного интеллекта».

— Направление «Искусственный интеллект для решения задач развития ТЭК и энергетики».

— Направление «Искусственный интеллект для „Умного города“ и транспорта».

— Направление «Искусственный интеллект для робототехники и управления беспилотными системами».

— Направление «Искусственный интеллект в сельском хозяйстве и производстве продуктов питания».

— Направление «Искусственный интеллект в биотехнологиях и генной инженерии».

— Направление «Доверенный искусственный интеллект».

— Направление «Межотраслевые технологии искусственного интеллекта и искусственный интеллект для иных приоритетных отраслей экономики и социальной сферы».

— Направление «Этические аспекты применения искусственного интеллекта».

— Направление «Искусственный интеллект для обеспечения кибербезопасности».

Проблема заключалась даже не столько с выбором какого-то направления (каждое из них по-своему интересно), сколько с тем, что в программе Центра в разделе «Описание тематики программы Центра» необходимо было привести научное обоснование выбранного направления и темы Центра, основанное на конкретных прикладных задачах, в том числе сформулированных индустриальным партнером, который, по своей сути, и определял основной вектор развития Центра искусственного интеллекта.

И, здесь, с выбором темы Программы центра, мне немного повезло.

Во-первых, индустриальным партнером стала компания АО «ЭР-Телеком Холдинг», о знакомстве с которой я расскажу несколько позже.

Во-вторых, тему для индустриального партнера я придумывал уже не просто сам, а со своей маленькой командой, состоящей из четырех человек, и индустриальным партнером в составе двух человек (!). Споров было, как всегда, много, но итоговый вариант был за партнером. Точку в наших дискуссиях поставил Денис Реймер — Директор по продуктам b2b и инновациям АО «ЭР-Телеком Холдинг».

Ну, и в-третьих, потому, что за основу, как самой темы Центра, так и ее Программы, я взял наработки из своей кандидатской диссертации, тема которой: «Анализ и выбор рациональной структуры региональных распределенных сетей передачи, обработки и хранения данных» и докторской диссертации: «Методология определения операционных характеристик и рациональной структуры региональных распределенных сервисных сетей передачи, обработки и хранения данных».

Таким образом «пазл», как говорят, начался складываться и мы определились со следующим:

Направление: «Межотраслевые технологии искусственного интеллекта и искусственный интеллект для иных приоритетных отраслей экономики и социальной сферы».

Тема 12: «Создание платформы машинного обучения для автоматизации интеллектуальных сетей передачи, обработки и хранения гетерогенных данных на основе технологий доверенного искусственного интеллекта».

Но, самое главное в том, что мы все-таки создали «Центр разработки и внедрения сильного и прикладного искусственного интеллекта МГТУ им. Н. Э. Баумана», но об этом мы также поговорим подробнее немного позже.

Первые страницы написаны. Работа закипела. Идем дальше…

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я