GPT студентам. 580 промптов способных решить любую проблему. Промпт-инжиниринг для написания исследований, от плана до списка литературы, решения задач, генерации исследовательских идей, ускорения рутинных процессов, успешного и честного прохождения антиплагиат вуз

Вячеслав Мустакимов

Технологии искусственного интеллекта должны быть массово внедрены во все отрасли в текущем десятилетии. Такую задачу поставил президент России В. В. Путин.Внедрением ИИ гордятся корпорации и продвинутые компании, однако высшая школа на появление ИИ отреагировала плохо.ИИ – это наше светлое будущее, неужели наших студентов не возьмут строить светлое будущее?В сборник вошёл текст, ранее опубликованный в книге «GPT маркетологу. 337 промптов повышающих производительность в 1000 раз».

Оглавление

* * *

Приведённый ознакомительный фрагмент книги GPT студентам. 580 промптов способных решить любую проблему. Промпт-инжиниринг для написания исследований, от плана до списка литературы, решения задач, генерации исследовательских идей, ускорения рутинных процессов, успешного и честного прохождения антиплагиат вуз предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

АНТИПЛАГИАТ, ТОТ, КОТОРЫЙ ВУЗ

1.1. Что было до антиплагиат

ВУЗы и студенты (в Древнем Риме и в Средние века студентами назывались любые лица, занятые процессом познания) появились задолго до антиплагиата. Веками, находясь в процессе познания, студенты искали способы обхода рутины, беспроблемной сдачи зачетов, письменных работ и экзаменов, тем самым оживляли скучный учебный процесс некой новацией.

Тридцать лет назад будучи студентом, я искал пособие, в котором в сжатой и понятной форме излагается техника быстрого написания исследовательских работ. Читая Умберто Эко — философа и специалиста по семиотике, я понял, что скоростной методики не существует, зато есть классические правила: прийти в библиотеку, набрать тонну литературы, почитать источники, расставить в книгах закладки, сделать выписки, конспекты, скомпилировать текст, вычитать его и связать логически. С таким подходом, нормативное время написания дипломной работы составляло 3—4 месяца.

В 1994 г. в России появился Интернет, в который можно было выйти, применяя dial-up (англ. dial-up — «набор номера, дозвон»). Интернет стал наполняться электронными книгами, использование которых давало заметное ускорение при написании письменных работ.

В 2005 году в научном мире «блеснула» мысль, что работы студентов зачастую пишут не на основании источников, а на основании коллекций рефератов, поэтому было задумано бороться с такими работами, на свет появилась система «Антиплагиат», живущая в доменной зоне РУ.

Антиплагиат пошел по пути, который сейчас проходит OpenAI, да и многие другие разработчики ИИ, он начал индексировать коллекции рефератов, сетевые библиотеки и места скопления текстовой информации, понятно, что после такой индексации множество отечественных библиотек потеряли ценность своего фонда, потому что библиотеки из источника знаний превратились в источник плагиата.

Кроме добротных библиотек, имеющих отношение к академической сфере, антиплагиат, в погоне за показателями проиндексировал ресурсы, не имеющие отношения к научной деятельности, в это число попали эротические библиотеки. Разгорелся скандал, о котором писал ИД «Коммерсантъ» — один из старейших издательских домов и одна из самых авторитетных и влиятельных медиаструктур в стране. В статье «Антиплагиат» не пройдет, «Коммерсантъ» написал о казусе с индексацией Антиплагиатом РУ порно-ресурсов, рис. 1 и скандале в министерстве образования РФ.

Рисунок 1 — Антиплагиат не пройдет, ИД «Коммерсантъ»

Параллельно Антиплагиату начали развиваться другие проекты, посчитавшие возможным монетизировать данную сферу. Появилась разработка СерчИнформ (SearchInform) — Плагиат-Информ — система для определения плагиата в документах.

Наша идея технологии скоростного написания работ получила свое развитие в 2009 г. К этому времени в рамках деятельности научного объединения «ГУМАНИТАРИЙ», силами членов объединения, была собрана довольно приличная научная электронная библиотека (ЭБ), которая, по объему фонда, в несколько раз превосходила классические университетские библиотеки. Проблемой являлось библиографическое описание книг, так как имея неприлично много книг, в них было необходимо ориентироваться.

Решение подвернулось случайно. Компания «СерчИнформ» — ныне ведущий российский разработчик средств информационной безопасности, резидент Инновационного центра «Сколково», входящая в АРПП «Отечественный софт» и НП «Руссофт» — в 2008—2010 гг. разрабатывала локальную поисковую систему промышленного класса и осваивала на ее базе Плагиат-Информ — систему для определения плагиата в документах. Стресс-тестирование поисковика проводили на базе фонда ЭБ НИО «ГУМАНИТАРИЙ» (рис. 2). Плагиат-Информу мы пожертвовали свой фонд рефератов и курсовых, который насчитывал ок. 3 млн. работ.

Рисунок 2 — Пресс-релиз СёрчИнформ

В 2010 г. идея скоростного написания научных исследований получила свое развитие с новой силой. «СерчИнформ» не только предлагал возможность разнообразного поиска в локальных файлах, но и реализовывал функцию «поиска похожих» — поиск больших текстов на основании маленьких. Используя продукт СерчИнформ, мы научились извлекать необходимые данные из текстовых неструктурированных массивов, добавляя к заимствованиям библиографическую запись. Это позволяло компилировать теоретические разделы исследований за считанные часы. Генезис антиплагиата, который РУ, несколько замедлил развитие компилятивной технологии, поскольку все тексты, извлекаемые из любой электронной библиотеки, были плагиатом. В 2015 г. мы начали работы по автоматизации процесса перефразирования текстов, с целью повышения их уникальности, рис. 3. Чистовое решение было найдено в 2020 году, представлено Интернет-общественности в 2021 г., в виде проекта КонтрПлагиат.

Рисунок 3 — Перефразирование, рерайт, перепечатывание текста «другими словами»

КонтрПлагиат, академическая нейронная сеть. Цель проекта — повышение уникальности академических текстов методом глубокого перефразирования (рерайтинг), перегенерация текстов (копирайтинг).

В 2022 г. КонтрПлагиат научился работать с файлами, имеющими сложную структуру — текст, математический аппарат, таблицы, рисунки, подстрочный ссылочный аппарат.

В 2023 г. Антиплагиат РУ вывел на рынок решение — детектор генеративных текстов, созданных с помощью больших языковых моделей (LLM). На следующий день КонтрПлагиат объявил, что умеет работать с большими текстами, имеющими статус: «Внимание, документ подозрительный: в документе присутствует сгенерированный текст».

Этот статус КонтрПлагиат убирает благодаря перефразированию и компилятивным умениям, доставшимся в наследство от НИОО «ГУМАНИТАРИЙ», рис. 4.

Рисунок 4 — Генеративный текст, созданный с помощью GPT, «ДО» и «ПОСЛЕ» очеловечивания КонтрПлагиат

Как видно из краткого исторического экскурса, проблема скоростного написания исследовательских работ не нова, борьба с плагиатом в той или иной форме ведется почти два десятилетия, появление GPT заметно оживило этот процесс, наполнив академическую среду паническими настроениями. Паникуют все, профессорско-преподавательский состав, который захлестнула волна генеративных работ. Студенты, которые сгенерировали примитивные работы и не могут пройти проверку в антиплагиат версии ВУЗ.

Большие языковые модели (LLM) приходят к нам надолго и проникают во все инструментальные среды, интерфейсы, приложения и практики. Правильным, по нашему мнению, является не запрет их применения, а приобретение навыков их использования в исследовательской деятельности, что снижает рутинную составляющую и дает достаточно времени для творческого процесса.

Примером применения ИИ GPT и КонтрПлагиат выступает данное пособие, которое обобщает практический опыт и рассматривает процесс написания исследований с точки зрения — как упростить, а не с позиции классической методологии — как усложнить.

1.2. Антиплагиат — игровая или экспертная система?

За долгие годы наблюдения за тысячами отчетов антиплагиат ВУЗ мы выявили ряд интересных моментов:

— Не смотря на наличие модуля шаблонных фраз, антиплагиат определяет их не корректно, например относит к цитированию, рис. 5 и 6.

Рисунок 5 — Шаблонные фразы определяются как цитирование?

Рисунок 6 — Антиплагиат считает шаблонные фразы цитированием

— Одно слово и фраза из двух слов может быть плагиатом, рис. 7—9.

Рисунок 7 — Некорректное определение плагиата в тексте

Рисунок 8 — Некорректное определение плагиата в тексте

Рисунок 9 — Некорректное определение плагиата в тексте

— Зачастую антиплагиат бездоказателен, вас обвиняют в плагиате, но не показывают источник плагиата, на скрине рис 10, плагиат — фраза «этих операций», переход по ссылке 22, рис. 11, ведет на целую статью, которая, вероятно, содержит фразу «этих операций».

Рисунок 10 — Внешняя ссылка антиплагиата

— Модуль цитирования работает не корректно, путая фразы из Конституции РФ с шаблонными фразами;

Рисунок 11 — Текст конституционной статьи — шаблонная фраза?

— Титульные листы, заголовки работы, названия ВУЗов и кафедр, фамилии научных руководителей на титульном листе, оглавление — плагиат, рис. 12 и 13.

Рисунок 12 — Заголовки — плагиат

Рисунок 13 — Оглавление — плагиат

— Целостная фраза может быть на 50% цитированием, а на 50% плагиатом, хотя, правильней отнести ее к цитированию из белого источника, рис. 14.

Рисунок 14 — Разрыв при идентификации фразы

— Вас обвиняют в плагиате, указывают источник, рис. 15.

Рисунок 15 — Целостное понятие цитирование-плагиат

— Внешняя ссылка ведет на пустую страницу, рис. 16, это называется — отсутствие доказательности при обвинении в плагиате, сколько таких, указывающих в пустоту ссылок, в миллиардном индексе?

Рисунок 16 — Антиплагиат дает ссылку на пустую страницу

С началом работы модуля поиска генеративного текста антиплагиат начал чудить, отчет, который хранится на сервере меняет свои показания, рис. 17—20.

Рисунок 17 — Отчет Антиплагиат от 07.06.2023 — 10:14:19

Рисунок 18 — Отчет Антиплагиат от 07.06.2023 — 10:14:19, спустя 1 час

Рисунок 19 — Отчет Антиплагиат от 27.06.2023 — 08:51:39

Рисунок 20 — Отчет Антиплагиат от 27.06.2023 — 08:51:39, спустя 1 сутки

Студенты, которые приобрели платные проверки за 472 рубля могли видеть в своих отчетах, что генеративной является нумерация страниц, рис. 21 и 22. Технически Антиплагиат прав, нумерация проставляется в Word автоматически, но как вернуть деньги за некорректную проверку?

Рисунок 21 — Нумерация страниц отнесена Антиплагиатом к генеративному тексту ИИ

Рисунок 22 — Нумерация страниц отнесена Антиплагиатом к генеративному тексту ИИ

Антиплагиат берет на себя смелость относить текст, написанный человеком к генеративному, рис. 23.

Рисунок 23 — Человеческий текст отнесен к генеративному

Ну а это наш любимый скриншот, пустая страница — это генеративный текст, рис. 24.

Рисунок 24 — Пустая страница — это генеративный текст

Мы не разбираем результаты проверок конкретных работ, как правило это не делают и преподаватели высшей школы. Единственный критерий оценки студенческих работ в ВУЗах и это не единичный случай — показатель уникальности. В некоторых ВУЗах такой подход узаконен, на оценку «отлично» — 75% оригинальности, на оценку «хорошо» — 65%.

Против студента играет системная организация, в виде правил ВУЗа и машинно-алгоритмической мощи коммерческого сервиса. Тексты некоторых работ, не содержат достаточного количества изменяемого текста, но от студентов требуют «отжать» показатель уникальности, поэтому приходится перефразировать устоявшиеся в научном мире термины, определения и цитаты. Вероятно, это «натягивание уникальности» не совсем то, что можно связать с академическим подходом.

Если против студентов начали играть нейросети, о применении которых заявил антиплагиат, то справедливо дать студентам аналогичные средства, дабы сражение шло в равных весовых категориях.

1.3. Метод шинглов в повышении уникальности текстов

Шингл (далее — Ш) — последовательность количества слов (2, 3, 4, 5 и т.д.), используемая в алгоритме проверки уникальности текста, рис. 25. Уникальность проверяется путем сравнения текста источника с текстом, который был перефразирован. Данную сверку можно проводить локально, используя бесплатный продукт AntiPlagiarism.NET.

Рисунок 25 — Лемматизированный текст, как выглядят шинглы, состоящие из 2 слов (Ш2)

При проверке в антиплагиат ВУЗ, текст работы сверяется с данными базы (другими текстами, проиндексированными ранее).

При определении уникальности текста проверяемой работы, в системе Антиплагиат происходит следующее:

— Нормализация (канонизация) текста — удаление из текста элементов, не несущих смысловой нагрузки, шаблонных фраз, предлогов, союзов, знаков препинания и др.

— Лемматизация — приведение слов к нормальной форме, рис. 25.

— Разбиение текста на фрагменты — шинглы, конец каждого фрагмента является началом предыдущего, рис. 25.

— Вычисление хэш-значения фрагмента слова — на этом этапе начинается сравнение текста. Точность сравнения напрямую зависит от количества операций — это достаточно ресурсоемкий процесс. Чтобы увеличить производительность метода сверки шинглов, сравнение текстов по контрольным суммам может осуществляться на случайных выборках.

— Определение результата — на основе сравнения выдается результат, указывающий на уникальность проверяемого текста. Результаты отражаются в процентах: 100% — полностью уникальный текст, 0% — полностью неуникальный текст, т.е. такой текст уже существует.

На что опирается методология КонтрПлагиат, при использовании метода шинглов?

1) Мы исходим из того, что:

— уникальных текстов в академической среде не осталось. Все, что может исследовать студент, уже исследовано.

— любой текст, скомпилированный из Интернет-источников и печатных библиотек — плагиат.

— если текст скомпилирован поабзацно, и компиляция показывает уникальность, это связано с уникальным сочетанием абзацев. Изменение порядка следования абзацев или правка текста, внутри абзаца, может привести к появлению плагиата.

— показатель уникальности, это совокупная оценка всей работы, «хитрый» метод правки мест плагиата, при следующей проверке выявляет плагиат в тех местах, которые в предыдущей проверке плагиатом не являлись.

В процессе проверки первого варианта работы, она попадает в индекс антиплагиата. С этого момента она считается первой версией. Все последующие проверки учитывают первую версию, и отслеживают процент изменения 2, 3, 4 версии работы по отношению к первой версии. Другими словами, повышая уникальность текста методом глубокого перефразирования вы, в том числе, противостоите первой версии своей работы и должны показать, что текст после перефразирования существенно отличается от первой версии.

2) Любой текст перед первой проверкой должен подвергаться глубокому рерайту — это снижает последующие трудозатраты, т.к. вы не противостоите первой, второй, третьей и т. д. версиям своей работы. В процессе перефразирования, рерайта, необходимо добиться отличия текстов источника и перефразированного текста. Данное отличие, при сверке по показателю Ш2 должно составлять более 80%.

Поверхностный рерайт

Поверхностный рерайт обеспечивает двойной перевод текста — на любой иностранный язык и обратно на рис. 26 показан перевод текста с русского на английский язык и обратный перевод с английского на русский. Текст, при сверке по шинглам, состоящим из 2 слов (показатель Ш2) показывает отличие на уровне 20—40%, рис. 27.

Рисунок 26 — Перевод текста в направлении: русский-английский; английский-русский, с помощью translate.google.com

Рисунок 27 — Сверка текста источника (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 30%

Применение GPT также обеспечивает поверхностный рерайт, на рис. 28 приведен интерфейс, в котором выполняется перефразирование с помощью GPT, применяется промпт 1.

Пример GPT-промпта 1

Перефразируйте текст [ваш текст]

Рисунок 28 — Перефразирование текста с помощью GPT

На рисунке 29 представлена сверка текста по методу Ш2, как видно тексты отличаются на 40%.

Рисунок 29 — Сверка текста источника (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 40%

Известно, что GPT допускает ошибки, поэтому с целью их частичного исправления, дальнейшего повышения уникальности, а также удаления маркеров генеративного текста, можно выполнить вторичный перевод текста в направлении: русский-английский; английский-русский, с помощью translate.google.com, рис. 30.

Рисунок 30 — Перевод текста, после GPT-обработки, в направлении: русский-английский; английский-русский, с помощью translate.google.com

Рисунок 31 — Сверка текста источника (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 55%

Все последовательности действий, приведенные выше дают поверхностное перефразирование, практикой доказано, что это не позволяет добиваться нужного показателя уникальности всего текста.

Глубокий рерайт

Глубокий рерайт, обеспечивает существенное отличие текстов, на основании практического опыта установлено, что текст источника должен отличаться от перефразированного текста, при сверке по показателю Ш2 на 80 и более процентов. Рассмотрим, как этого можно добиться.

Шаг 1 — выполнить перевод текста в направлении: русский-китайский (традиционный); китайский (традиционный) — русский, с помощью translate.google.com. Это даст нам показатель Ш2 — 64%, рис. 32.

Рисунок 32 — Сверка текста источника (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 64%

Шаг 2 — написание нового текста на основании текста перевода, с помощью GPT. Источником является текст после перевода: русский-китайский (традиционный); китайский (традиционный) — русский.

Пример GPT-промпта 2

Напишите новый текст, используя источник [текст после перевода: русский-китайский (традиционный); китайский (традиционный) — русский]

Рисунок 33 — Сверка текста источника (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 74%

Как видно, в результате GPT-генерации нового текста мы использовали текст источника, после перевода: русский-китайский (традиционный); китайский (традиционный) — русский, это дало показатель отличия Ш2 — 74%.

Шаг 3 — вторичный перевод генеративного GPT-текста: русский-китайский (традиционный); китайский (традиционный) — русский. Вторичный перевод обеспечивает частичное исправление ошибок GPT-генерации, дальнейшее повышение уникальности, а также удаление маркеров генеративного текста, рис. 34.

Рисунок 34 — Сверка текста источника (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 78%

Шаг 4 — согласно карте шинглов, в левом окне программы производится ручная правка не измененных шинглов, состоящих более чем из 2 слов, методом впечатывания, подходящих по смыслу новых слов, рис. 35.

Рисунок 35 — Ручное изменение Ш2

Обратите внимание, в силу несовершенства технологий Google и GPT, текст содержит ошибки, поэтому, разбивая шинглы их нужно исправлять. Текст после перефразирования уменьшил объем и потерял ссылки на источники цитирования, значит это тоже предстоит подправить.

Почему не рекомендуется использовать другие переводчики:

— Deepl — позволяет переводить 1500 знаков в интерфейсе, при переводе файлом, он защищен от копирования, главный недостаток в том, что Deepl старается обеспечить высокую точность перевода, а значит отличие текстов минимизируется и все усилия по перефразированию снижаются, рис. 36.

Рисунок 36 — Интерфейс Deepl

— Переводчик Промт (translate.ru) — обладает собственным пониманием текста, уникальность повышается, но смысл теряется, поэтому предстоит много правки, рис. 37.

Рисунок 37 — Переводчик Промт (translate.ru)

С образовательной точки зрения, данный подход к перефразированию несет обучающий потенциал, т.к. при компиляции текстов из учебников, студент читает правильный текст, а при прочтении текста после двойного перевода и GPT генерации, приходится вычитывать текст, вдумываться в смысл и исправлять неточности. Тем не менее, это значительно быстрей чем перефразировать текст полностью руками.

Почему тексты, перефразированные указанным способом, не определяются как генеративные:

— GPT и программа-переводчик — это совершенно разные модели, Антиплагиат детектирует GPT-подобные модели;

— текст, после перефразирования содержит шинглы, состоящие из 2 слов, их последовательности похожи на последовательности текста источника, при генерации в GPT, согласно примитивным запросам, таких последовательностей достаточно мало, другими словами, Антиплагиат не понимает откуда копипаста текста.

Глубокое академическое перефразирование КонтрПлагиат

Глубокий рерайт, рассмотренный выше выполнялся с применением переводчика Google и GPT, пришлось применить ручной труд для исправления ошибок и достижения необходимого показателя отличия текстов Ш2.

Заметно упрощает процесс глубокого перефразирования академическая нейросеть КонтрПлагиат. Перефразирование осуществляется следующим образом:

Шаг 1 — перегенерация текста, с одновременной сверкой по методу Ш2. В процессе перегенерации используется модель не известная GPT-подобным системам и антиплагиат РУ, в частности, в этом заключено несомненное преимущество нейросети КонтрПлагиат.

На рис 38 приведены результаты опроса, где мы попросили наших читателей найти текст, перефразированный с помощью КонтрПлагиат, результаты опроса показательны, текст, после рерайта КонтрПлагиат человеческим глазом идентифицирован не был.

Рисунок 38 — Опрос, проведенный нами ВК

Шаг 2 — исправление ошибок перегенерации, с одновременной сверкой по методу Ш2. Исправление ошибок не должно возвращать Ш2, как в тексте источнике.

В результате перефразирования получается текст, который соответствует критериям перефразирования, показатель Ш2 — больше 80%, рис. 39.

Рисунок 39 — Сверка текста источника (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 92%

Пример полученного, рис. 39 текста

Анализ особенностей менеджмента и финансирования современных российских энергетических компаний и предприятий является важным аспектом диссертационного исследования, поскольку определяет не только уровень новационности, адаптивности, рыночной устойчивости, энергетической защищенности и безопасности, энерго-экономической эффективности самого предприятия, но и функционирования обслуживаемого им сектора экономики (в основном промышленности). Использование энергоносителей при производстве и поставке товаров и услуг является важным фактором, определяющим добавленную стоимость товаров и услуг. Переход к более экологичным и экономически эффективным методам промышленного производства возможно начать с анализа и изучения динамики изменения системы энергоснабжения. Эти выводы основаны на результатах большого числа исследований, проведенных в России и за рубежом по различным проблемам развития промышленности [9, 10, 12, 14, 16, 17, 25, 26].

Так, ученый Н. Г. Борисюк считает, что ресурсные возможности и потенциал целого ряда энергетических предприятий и всей целостности ТЭК (топливно-энергетического комплекса) в целом является основой устойчивого развития и выступает драйвером реструктуризации отечественной экономики. По его данным, на долю отраслей ТЭК в России приходится около 80% промышленного воспроизводства [31,C.73], а 16% промышленно-производственной рабочей силы страны занято на предприятиях и в субъектах экономической деятельности, относимых к ТЭК [34,C.73]. Одним из направлений изменений и реструктуризации отечественной экономики, рассматриваемых данным исследователем, является кластеризация, в которой предприятия топливной энергетики выделяются в качестве центра кластеров.

Сегодня, когда все большее значение приобретает стратегия перехода к низко углеродной (зеленой) экономике и более устойчивым моделям производства и потребления энергии, необходимо анализировать передовой опыт повышения энергоэффективности в различных отраслях и изучать инвестиционные и технологические возможности в ТЭК [60, C. 34]. Отметим, что в то же время энергетический рынок формируется под воздействием спроса и предложения на все виды энергоносителей, включая традиционные носители энергии — углеводороды и возобновляемые источники энергии. Сегодня структура потребительских предпочтений и реальный спрос на энергию претерпевают значительные изменения. В результате энергетическим компаниям приходится искать новые организационные и технологические решения на всех этапах технологических процессов и производственных цепочек — от добычи ископаемых до распределения энергетических ресурсов между потребителями.

Применение современных теорий и практик управления позволяет эффективно организовывать и координировать ресурсы субъектов отрасли топливной энергетики, энергетических компаний для обеспечения их устойчивого и динамичного развития. Прежде чем внедрять новые технологии, необходимо приобрести нематериальные ресурсы, такие как опыт и знания, характерные для отечественного ТЭК. Для того чтобы создать необходимую базу для этих ресурсов, необходимо развивать человеческие ресурсы энергетических подразделений и компаний. Специфика развития ТЭК требует определения его структуры, субъектного состава участников и четкое выделение их места в общей организационной структуре.

Очевидными достоинствами КонтрПлагиат выступают:

— целостность процесса, все происходит в «одном окне» или в «одном файле». Файл загружается в интерфейс, выгружается в формате. docx, следовательно сохраняется оформление документов и уменьшается объем ручных манипуляций;

— скорость обработки — 1 млн. знаков в час, что заметно превышает скорость генерации текста в GPT;

— качество текста выше, чем у всех известных моделей, показатель Ш2 превосходит показатели всех известных моделей, рис. 40.

Рисунок 40 — Сравнительная характеристика нейросетей, 2023 г.

Таким образом, процесс повышения уникальности текста прост, перевод с русского на иностранный язык и обратно; GPT-перегенерация; повторение операции перевода с русского на иностранный язык и обратно; правка не изменённых шинглов; вычитывание и правка неточностей.

Как убрать статус — «Внимание, документ подозрительный: в документе присутствует сгенерированный текст»

Что делать при наличии в Антиплагиат уведомления о генеративном тексте? Есть два подхода, рекомендуется применение обоих, в любой последовательности.

Текст может генерироваться на основании примитивного запроса, это когда всю мощь ИИ используют как поисковик, например, «перечисли методы анализа конкурентоспособности, дай характеристику каждому методу». В результате сложной перегенерации задаются условия генерации и предоставляется прототип текста, на основании которого GPT пишет новый текст.

На момент написания данного пособия Антиплагиат проверял текст, выделяя генеративный кусками по 3000 знаков.

Первый метод — «разбавление» текстов ИИ аналогичными по смыслу абзацами, текста, написанным человеком. Таким образом, текст ИИ не будет выглядеть «формальным и искусственным», а будет более убедительным и доверительным.

Как вставить нужные абзацы? Вы можете найти в Интернете соответствующие статьи и выбрать из них подходящие абзацы. В качестве альтернативы можно воспользоваться поисковым сервисом, который подберет похожие справочные статьи, и вы сможете из них заимствовать человеческий текст, рис. 41.

Рисунок 41 — Поиск справочных статей

Вставляя абзацы из интернета, вы должны убедиться, что они относятся к теме вашей работы и датируются периодом до 2021 года.

Схема добавления интернет текстов проста, — добавление 2 абзацев, по 2—4 предложения в каждом, через 2—3 абзаца текста ИИ или добавление 1 абзаца, через 2—3 абзаца текста ИИ.

Второй метод, генеративный текст подвергается синонимизации, на выходе мы получаем классический синонимизированный текст, рис. 42.

Рисунок 42 — Текст, после синонимизации, процент замен — 19,7%

Синонимизированный текст переводим с русского на китайский и обратно, получаем отличие генеративного текста к тексту после синонимизации и перевода — 44%.

Рисунок 43 — Сверка генеративного текста (правое окно) с перефразированным текстом (левое окно) по методу шинглов, состоящим их 2 слов (Ш2), отличие текстов 44%

Пример текста после синонимизации и восстановления методом двойного перевода

Для достижения целей и задач диссертационного исследования необходимо исследовать особенности управления и финансирования российских энергетических компаний, развивающихся в современных условиях, с точки зрения их роли в обеспечении инновационности, адаптивности, устойчивости, энергетической безопасности, энергетической и экономической производительности. Добавленная стоимость любых товаров и услуг зависит, в том числе, и от энергии, затраченной на их производство или предоставление. Переход к более экологичным и экономически устойчивым методам промышленного производства также начинается с пересмотра и реформирования системы энергоснабжения. Эти утверждения основаны на понимании многочисленных отечественных и международных исследований, посвященных теме формирования различных промышленных секторов [9, 10, 12, 14, 16, 17, 25, 26].

Так, по мнению ученого Н. Г. Борисюка, ресурсный потенциал как отдельных энергетических предприятий, так и топливно-энергетических комплексов является основой устойчивого развития и реструктуризации экономики. По его данным, в России «на долю топливно-энергетических комплексов приходится около 80% промышленного производства» [31, С. 73], «ТЭК — основа устойчивого развития и реструктуризации экономики [31, C. 73], которые являются основой устойчивого развития и реструктуризации экономики [31, C. 73], а на предприятиях и организациях ТЭКа занято «16% промышленно-производственной рабочей силы страны» [34, С. 73]. В качестве одного из направлений реструктуризации экономики, по мнению данного исследователя, предприятия топливно-энергетического комплекса выбраны в качестве центрального звена кластера.

Отлично зарекомендовала себя комбинация, синонимизация + двойной перевод + вставка абзацев, рис. 44.

Рисунок 44 — Текст, после очеловечивания

1.4. Как студентам и ВУЗам сэкономить на проверках в Антиплагиат

Для того, чтобы пройти антиплагиат ВУЗ требуется одна или две проверки. Антиплагиат — коммерческая система, с хорошим маркетингом и административным ресурсом. Заметного роста монетизации Антиплагиат добился после начала эксплуатации модуля перефразирования, а теперь, модуля поиска генеративных текстов. Как любая система, опирающаяся на маркетинг Антиплагиат, эксплуатирует человеческие слабости:

— я написал работу, вдруг у нее высокая уникальность. Чудо не произойдет, вы не наберете нужную уникальность, даже если набрали весь текст «из головы», это доказано статистически.

— я проверю работу, поправлю места плагиата и пройду проверку со второго раза. Не пройдете, т.к. то, что раньше не было плагиатом, станет плагиатом при второй проверке. Антиплагиат учитывает совокупное изменение, а не фрагментарное. Доказано статистически.

Тексты, которые используются в академической сфере — специфичны тем, что базовое знание, определения, распространённые подходы, методы, порядок изложения и т. д. многократно используются в разных работах, разными ВУЗами, на протяжении десятилетий. С введением в практику ВУЗов антиплагиата все студенческие тексты смело можно отнести к высокочастотным (часто употребляются в работах), их сотни и тысячи раз перефразировали, пытаясь добиться уникальности и каждый текст, сходной тематики в новой работе, должен быть перефразирован вновь так, чтобы он не напоминал предыдущие, а проверка будет осуществляться по таким крошечным частям текста, как шинглы.

Обоснование метода подготовки текстов для проверки в Антиплагиат ВУЗ

Библиотеки, из источника знаний, превратились в источники плагиата. Проблему усугубляет ограниченность формулировок знаний, как правило все учебные программы унифицированы (однообразны) и опираются на официальный перечень учебной литературы, термины и базовые определения. В этой связи, любой текст, опирающийся на источники, имеет низкий показатель уникальности, т.к. текст пишется с использованием метода научной компиляции, используются общеизвестные знания и распространённые формулировки. Использование новых учебников проблему не решает, т.к. их тексты — с низкой уникальностью.

В этой связи проверять свеженаписанный (скомпилированный) текст в Антиплагиат ВУЗ не имеет смысла, т.к. чуда не случится, и он покажет недостаточную уникальность.

Вновь созданный текст (первичный) необходимо подвергнуть глубокому перефразированию. Проверку в Антиплагиат ВУЗ следует выполнять после получения показателя отличия вторичного текста от первичного по показателю Ш2 составит 80 и более процентов.

Данный подход может привести к двум возможным результатам:

— требуемая уникальность достигнута;

— необходимая уникальность не достигнута.

В случае недостижения уникальности, руководствуясь отчетом о полной проверке, необходимо места плагиата подвергнуть вторичному глубокому перефразированию, с показателем Ш2 — 90—95%.

После вторичной глубокой переработки, текст может быть проверен в системе поиска заимствований, как правило второй проверки достаточно, для получения необходимого уровня уникальности.

Инструментальная среда глубокого перефразирования

Мы не касаемся практики реализации процесса глубокого перефразирования, смысл которого заключается в изложении текста «своими словами». Технически мы преследуем цель изменения шинглов, состоящих из 2 слов, на 80 и более процентов.

Измерить данный показатель возможно используя бесплатный продукт AntiPlagiarism.NET, доступный для скачивания на сайте: etxt.

Работать в программе достаточно просто, в левое окно помещается текст рерайта (подвергнут глубокому перефразированию), в правое окно помещается первичный текст (источник, текст до рерайта). Снизу, слева интерфейса программы выбирается «Параметр сравнения» — «Метод обнаружения копий» — «Число слов в шингле».

За считанные секунды программа выдает процентное значение показателя отличия текста, по методу Ш2 или с учетом определения рерайта (показатель параметра расположен в нижнем, правом углу интерфейса программы).

Если тексты отличны по показателю Ш2 на 80 и более процентов, это является основанием для проверки текста в Антиплагиат ВУЗ, если данный показатель не получен, то повода отдавать текст на платную проверку — нет.

1.5. Легальные и нелегальные способы обхода Антиплагиат ВУЗ

Условно, способы обхода антиплагиата можно разделить на две группы, легальные и нелегальные.

Повысить уникальность текстов с помощью технического кодирования (знаков в тексте) нельзя. Разбивая слова знаками на кусочки, «кодировщик» наполняет текст мусором, куски слов воспринимаются системой проверки на плагиат как уникальные шинглы.

Техническое кодирование уникальность текстов не поднимает, оно обманывает скрипт проверки, поэтому данный метод относится к мошенническим и преследуется всеми ВУЗами, без исключения.

Техническое кодирование текстов — это попытка обойти алгоритмы проверяющего программного обеспечения, антиплагиат, используя внутреннюю часть файла. Поэтому, визуально, текст после кодирования смотрится как обычный текст, но при удалении стилей и форматирования, например копировании закодированного текста в блокнот, все эти знаки видны, рис. 45—52.

Системы проверки на плагиат, борются с техническим кодированием, поэтому если закодированная работа сегодня не определяется как подозрительная, завтра она уже может определяться системой проверки как подозрительный документ, в котором применены методы обхода.

Рисунок 45 — Техническая уникальность, в текст вставлен знак

Рисунок 46 — Техническая уникальность, разбивка шинлов, нарушен порядок слов в предложении

Рисунок 47 — Техническая уникальность, разбивка слов вставкой знака

Рисунок 48 — Техническая уникальность, разбивка слов нечитабельным знаком

Рисунок 49 — Техническая уникальность, разбивка слов на мелкие фрагменты

Рисунок 50 — Техническая уникальность, разбивка слов, вставлен знак

Рисунок 51 — Техническая уникальность, разбивка слов с помощью точки

Рисунок 52 — Техническая уникальность, даже если все слова смешать, изменив текст до неузнаваемости, Антиплагиат ВУЗ все равно покажет такой участок — плагиатом

Как видно из скринов, технические методы уникальности используются, но они давно не приносят нужного эффекта. Все эти хитроумные методы известны специалистам Антиплагиат ВУЗ и они с ними успешно борются.

Легкий рерайтинг и перефразирование. Этот метод основан на переписывании текста, примером легкого рерайтинга является перевод текста в Google на английский язык и обратно, что дает отличие текстов на уровне 20—40%.

Следует отметить, что данный подход неэффективен, т.к. не достигается показатель нормативного отличия текстов. При соблюдении определенного темпа работы, можно отредактировать до 40 страниц в день. Этот метод позволяет повысить оригинальность текста до 40%.

Глубокий рерайтинг и перефразирование. Данный метод подходит для всех типов работ, однако он требует много времени и ресурсов. Суть глубокого рерайтинга заключается в фундаментальной переработке текста, например замене каждого второго-третьего слова. При использовании этого метода можно отредактировать до 20 страниц в день. В результате применения глубокого рерайтинга и перефразирования оригинальность текста повышается до нужного процента.

Все остальные методы, описанные в Интернет, являются составными элементами метода глубокого перефразирования.

1.6. Как проверить самостоятельность студента, без антиплагиата

В нашей статье «Простой хак для преподавателей и научных, как в считанные секунды узнать, как и кем писалась студенческая работа».

Идея очень простая, перед проверкой работы проверять историю версий или историю исправлений (стандартная функция Ворд). Это позволяет видеть все этапы написания письменных работ, т.е. научный руководитель просто видит, составление, обдумывание и написание письменной работы.

Используя Google Drive возможно полностью исключить такую практику как написание работ на заказ, т.к. это совершенно другая среда прозрачности процесса.

Поскольку ChatGPT используется студентами для генерации письменных работ и обходит процедуры антиплагиата, среди преподавателей начинается паника. Возникает вопрос: что теперь будет с оценками за письменные задания? Ответ на этот вопрос не однозначен. Однако давайте рассмотрим проблему более подробно.

В зарубежных странах активно работают фабрики эссе, множество фрилансеров готовы помочь сделать рерайт по цене 5—6 евро за страницу или написать работу по цене от 50 евро за страницу.

Все эти студенческие помощники с нового года начали терять работу и все благодаря ChatGPT, который пристально посматривает в этом направлении, предполагая в последствии монетизировать помощь писателям.

ChatGPT, при грамотном подходе может написать отличное эссе или ВКР для бакалавриата, а также успешно справиться с различными академическими и профессиональными экзаменами. Потрясающе… И что теперь делать? Одно из возможных решений — вернуться к традиционным экзаменам. Противники данного подхода ссылаясь на дороговизну метода традиционных экзаменов и наличие носимых девайсов, на которых можно читать ответы на экзаменационные вопросы или подсматривать нужные ответы — категорически против этого метода.

Что же делать, если мы хотим сохранить все необходимые компоненты, сопутствующие написанию письменной работы, написание, правка и при этом обеспечить жесткий контроль, как на экзамене? А также учитывать самостоятельность работы студента?

КонтрПлагиат задумалась над возможным решением и в итоге нашел обоснование ответ на этот вопрос. Ключ к тому, чтобы держать все этапы написания письменных работ — на должном уровне контроля, заключается в использовании малоизвестной функции Google Drive — «истории версий».

Изложим классический сценарий: вы работаете над файлом в Google Drive и хотите отслеживать все изменения, которые вы внесли в этот файл, в среде Ворда этот функционал называется «Записывать исправления». Как реализуется процедура — выделите файл, нажмите на меню «Файл», затем перейдите в раздел «История версий» и выберите опцию «Просмотреть историю версий». На экране появится подробный журнал всех изменений, внесенных в файл. Если изменения в файл вносили несколько пользователей, то будет хорошо видно, кто внес каждое изменение. Стоит еще раз отметить, что аналогичная функция имеется и в MS Office.

Детальное изучение журнала изменений позволит отследить каждое добавленное предложение, исправленную опечатку или удаленный фрагмент текста. Это очень полезный инструмент, помогающий как при создании текста, так и при восстановлении случайно удаленного содержимого. Однако стоит отметить, что эта функция оставляет специфический и очень человеческий след.

Когда студенты пишут свои работы, они неизбежно перемещают, добавляют или удаляют фрагменты текста. Все эти действия будут отражены в истории версий с соответствующими временными метками и отметками о каждом изменении, внесенном каждым пользователем. Следовательно. если в файл добавлен большой кусок текста, то это говорит о том, что он скопирован и вставлен, а не написан методом научной компиляции.

Однако если работа была написана для студента машиной или автором-фрилансером, то предоставленный текст будет представлять собой уже готовый материал, который можно просто вставить в документ. Даже если бы пользователю пришлось вводить этот текст вручную, история версий все равно показала бы, что текст был введен дословно от начала до конца. Такой способ составления текста невозможен для человека.

Как видно, предлагаемый метод эффективно решает главный недостаток письменных работ, он приоткрывает завесу над процессом, как велась работа. Можно сказать, что метод является панацеей от широкого круга проблем. Для научных руководителей, использование данного подхода обозначает возможность действительно проверять, получая значительную экономию времени: проверка журналов активности гораздо проще, чем трудоемкая детективная работа по выявлению «заказных» работ, созданных фрилансером или машиной. При использовании системы регистрации активности студентов у преподавателей появляется больше времени для подготовки более качественных комментариев и выполнения других задач, не отвлекаясь на длительные проверки.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги GPT студентам. 580 промптов способных решить любую проблему. Промпт-инжиниринг для написания исследований, от плана до списка литературы, решения задач, генерации исследовательских идей, ускорения рутинных процессов, успешного и честного прохождения антиплагиат вуз предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я