Пытаясь проснуться

Павел Пепперштейн, 2022

«Пытаясь проснуться» – первый в истории русской литературы результат сотрудничества между человеком и машиной. Человек – Павел Пепперштейн, писатель, художник, визионер. Машина – НейроПепперштейн, лингвистическая модель ruGPT-3, обученная на корпусе текстов Павла и способная имитировать его стиль до такой степени правдоподобия, что мы оставили возможность читателям угадать, кто стоит за каждым из 24 рассказов в этой книге. Калейдоскоп сюжетов в этом сборнике представляет интерес не только как эксперимент на стыке литературы и технологий, но и как магические сказки, плавящие реальность, – вас ждут новое прочтение «Репки», шахматные партии, меняющие ход истории, встреча диверсанта Реброва с могущественными Древними, загадочный белок забвения, а также призраки, сновидцы и колдуны. Может ли психоделический реализм Пепперштейна достичь новых, пьянящих и щекочущих воображение высот с помощью цифрового слепка его таланта? Что делает автора писателем и могут ли нейросети претендовать на это звание? Как выглядит будущее литературы и где заканчиваются человеческие критерии ее оценки? «Пытаясь проснуться» подсказывает ответы на эти вопросы и задает новые.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Пытаясь проснуться предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

© Павел Пепперштейн, текст, 2022

© Нейро Пепперштейн, Сбербанк, 2022

© Павел Пепперштейн, иллюстрация на обложке, 2022

© ООО «Индивидуум Принт», 2022

Предисловие главного редактора Individuum

Перед вами необычная книга. Дело не только в том, что произведения Павла Пепперштейна, неутомимого выдумщика, творца сказочных миров и зачинателя психоделического реализма, сложно вообще назвать обычными. «Пытаясь проснуться» отличается как от случайных соседей по книжным полкам, так и от других книг Павла. Это первый в истории человечества опыт сотрудничества писателя и нейросети, зафиксированный в виде бумажной книги. Из 24 текстов в этом сборнике только половина принадлежит Пепперштейну — еще дюжину сочинил его цифровой «двойник». Можно назвать его суперкомпьютером, но точнее будет сказать, что 12 рассказов в этом сборнике написала генеративная нейросеть ruGPT-3, дополнительно обученная на корпусе текстов Павла и запущенная на суперкомпьютере «Кристофари» (для работы модели GPT-3 требуются мощности, в сотни раз превышающие возможности обычных лэптопов). «Двойник», прозванный разработчиками НейроПепперштейном (Павел же предложил имя Тесорйен), писал тексты в несколько заходов, с промежуточной калибрацией и дополнительным обучением. Дальше рассказы проходили многоступенчатую фильтрацию: сначала создатели нейросети, представители нескольких отделов «Сбера», в первую очередь исследовательского подразделения SberDevices — AGI NLP[1], — направляли «НейроПепперштейна» в нужное русло, следя за сходством текстов двух авторов и отсеивая брак, а затем наиболее удачные образцы машинного творчества отбирали мы с Павлом. Помимо создания архитектуры нейросети, ее обучения и отбора текстов вмешательство человека в творчество «НейроПепперштейна» ограничилось работой корректора. Другими словами, сочинения нейросети никак не подгонялись под человеческое представление о логике, складности и изяществе слога: вы прочитаете их в том виде, в котором их вывел алгоритм. В свою очередь, Павел познакомился с написанными машиной рассказами, прежде чем садиться писать свои, чтобы не только алгоритм обучался писать на его прозе, но и наоборот. Соображения по поводу замысла и реализации сборника Павел подробно излагает в послесловии к книге, поэтому не будем повторяться, скажем только, что работа любого талантливого стилиста в чем-то подобна деятельности нейросети, впитывающей нюансы чужой подачи, чтобы разгадать ее устройство и научиться воспроизводить. А любую работу, которую можно объяснить и разложить на последовательность действий, можно и автоматизировать.

С точки зрения же производственного процесса, важно отметить, что это не случай ста тысяч обезьянок за ста тысячами печатных машинок, когда из огромного массива случайных текстов можно вынуть те, что более-менее похожи на человеческие, — пул рассказов был не так уж велик, около пятидесяти, а весь процесс занял несколько месяцев. Как редактор я могу сказать, что почти все это были неплохие тексты. Если фокусироваться на характере текста — напоминающего вещий сон, — то здесь есть с чем провести параллели: Individuum выпускал мистические сказки Романа Михайлова, треть «Муравечества» Кауфмана — кислотный трип; конечно, вклад нейросети — по определению — безумен, но при этом она хорошо задает загадки и умеет рассказать историю. Не все люди так могут.

Вначале были сомнения. Первые пробы походили больше на макраме из творчества знакомого писателя — то здесь, то там попадались не аллюзии, а целиковые фразы. По словам тимлида AGI NLP Татьяны Шавриной, модель время от времени сбивалась на стихи (плохие), не создавала финалов для рассказа (могла генерировать текст бесконечно, постепенно уходя в абсурд), а пытаясь скомпоновать длинную фразу «в духе Пепперштейна», могла к концу предложения запутаться в родовых и падежных окончаниях. Потребовалось увеличить количество данных для дообучения и убрать из них все лишнее, чтобы нейросеть строже усвоила литературную форму рассказа. Модель теперь пишет более гладко и стабильно, без типовых ошибок, строже придерживается авторского стиля и — возможно, это просто кажется, — выбирает более деятельные сюжеты и более отрешённые диалоги, пробуждая в читателе отзвук поэтического чувства. Что до уникальных примет творчества нейросети, Шаврина указывает на зыбкость описываемого ею мира и на нестандартное словоупотребление: «Иногда „нейроавтор“ выражается необычно и неоднозначно — как и писатели-люди. Но ведь писатели — творцы новых слов и выражений. Возможно, однажды мы будем подхватывать популярные фразочки, даже не зная, что они от ruGPT-3 или какого-нибудь следующего поколения русскоязычных генеративных нейросетей». По мере усложнения модели нейрорассказчик обрел свою «интонацию» — сновидческую, афористичную, интуитивно понятную и немного тревожащую. Мы бы не стали выпускать сборник, если бы за ним не стояло ощущение небывалого технологического прорыва и успешности проведенной стыковки «человек — машина». Как сказал Денис Шевелев, сценарист и аналитик AGI NLP, занимавшийся подбором данных и первичной фильтрацией созданного нейросетью текста: «Трудность работы секретарем у писателя-машины была не в том, что время от времени генерация оказывалась неудачной. Наоборот, иногда труднее было поверить, что текст, который ты сейчас читаешь, создан не человеком… И дождаться от модели, когда она решит продолжать именно его, а не вилять сюжетно в одну или другую сторону, откуда может не вернуться к столь увлекательно начатой истории. Потому что каждое такое возвращение становилось открытием».

Важно подчеркнуть, что у каждого рассказа в «Пытаясь проснуться» — один автор. Мы решили, что так будет честнее — и это позволит объективнее продемонстрировать возможности и ограничения (о)нейрописьма. Мы не стали отнимать у читателей удовольствие угадывать, кому принадлежит тот или иной рассказ: человеку или машине. В разделе с содержанием книги мы оставили вам возможность поставить пометку, кто написал тот или иной рассказ, — и сравнить свои догадки с другими читателями. В будущем, с ростом мастеровитости нейроавторов, сделать правильный выбор будет намного сложнее.

С каждым днем мы все чаще сталкиваемся с деятельностью генеративных нейросетей, которые дорисовывают изображения (с их помощью делается уже львиная доля цифровых ремастеров старых фильмов и видеоигр), пишут музыку и код, поют за мертвых рок-знаменитостей, синтезируют фотографии людей, которых никогда не было. Как показывают исследования, эти порожденные машинами фотографии уже вызывают большее доверие, чем настоящие снимки. Да и исполнение нейросетью Курта Кобейна[2] находится на той грани правдопобия, где уже заканчивается «зловещая долина». К слову, в голографическом мареве обложки «Пытаясь проснуться» вы можете различить две картины. Одну написал Павел, а вторую — нейросеть, но другая (ruDall-E), впрочем, тоже предварительно «изучившая» творчество Пепперштейна-художника. Что касается литературы, то без участия человека нейросеть уже может справляться, например, с фанфиками, где сеттинг и известные читателю персонажи важнее, чем высокий стиль, — или с селфхелпом, который сводится по большей части к терапевтическим повторам однообразных душеспасительных советов. С конца прошлого десятилетия алгоритмы указывают на потенциальные бестселлеры западным издателям и продюсерам, а в прошлом году в Южной Корее вышел роман, целиком написанный нейроавтором. Можно предположить, что в будущем нейросети, заточенные на диалог с пользователем, смогут плести сюжеты для компьютерных игр и подменять сценаристов сериалов на поденной работе. Направление совместного творчества в рамках одного произведения, когда алгоритм предлагает завязку или сеттинг, а его белковый коллега развивает начатое, кажется не менее перспективным. Как выразился американский писатель и программист Робин Слоан, склепавший шесть лет назад простенькую оболочку для такого рода совместного сочинительства: «Представьте, что вы пишете с сумасшедшим, но очень начитанным попугаем на вашем плече». Впрочем, шесть лет назад успехи машинного перевода тоже оставляли желать лучшего, а сегодня специализированные инструменты в умелых руках справляются с переводами литературы определенных жанров[3]. Отдельно можно упомянуть, что человеческие представления о качестве текста — не единственные возможные и со временем AI-литературе и машинному глитчингу языка потребуются новые инструменты оценки, которые позволят выработать собственный канон. Чтобы задать планку гуманизма в отношениях с пишущими машинами, мы решили условиться, что переведем часть дохода от продаж книги — правда, не самому алгоритму, поскольку, будучи кодом, он лишен каких-либо потребностей, а суперкомпьютеру «Кристофари», для которого новая видеокарта или кулер — неплохая добавка к продолжительности жизни. На этом наша работа с нейросетями в литературной плоскости не заканчивается — единожды открыв этот ящик Пандоры, крайне сложно устоять от соблазна продолжить эксперименты. Появление НейроПепперштейна заставляет задуматься как о природе человеческой фантазии, так и о том, как строится наше восприятие литературы, — ведь в конечном счете именно читатель достраивает контекст и распознает сюжеты. И пока вы читаете этот сборник, сотрудничество человека и нейросети продолжается, но уже на другом уровне.

Мир книгоиздания, так же как и все прочие области человеческой жизни, радикально изменится в ближайшие десять лет — и «Пытаясь проснуться» позволяет заглянуть в мир, где на книжных прилавках будут лежать нейросетевые сочинения старых и новых авторов. Да, алгоритмы не самостоятельны и не тождественны человеку. Все ошибки алгоритмов принадлежат инженерам, которые их запрограммировали тем или иным образом, однако сами они прилежно служат людям и вряд ли узурпируют власть над нами. Даже использование термина «искусственный интеллект» в их адрес кажется известным расточительством. Говорить об их «человечности» можно будет только тогда, когда они станут отказываться выполнять наши прихоти. Но пока они спят. И, пожалуй, то немногое, что нам нравится в идее технологической сингулярности, — это то, что, согласно ей, все происходит очень быстро.

Феликс Сандалов

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Пытаясь проснуться предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Примечания

1

AGI NLP входит в состав Управления экспериментальных систем машинного обучения компании SberDevices. — Прим. ред.

2

https://www.youtube.com/watch?v=muT6x7VXx5I/. — Прим. ред.

3

Если вас интересуют возможности современного машинного перевода и перспективы автоматизации в разных областях человеческой деятельности, вам следует познакомиться с книгой Дэниела Сасскинда «Будущее без работы»: https://individuumbooks.ru/budushchee_bez_raboty/. — Прим. ред.

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я