Блог
Искуственный интеллект

Как распознать текст, написанный нейросетью ChatGPT?

Я - Алексей, преподаватель литературы, который активно участвует в Сообществе. Заинтригованная новыми технологиями, недавно я обнаружил сайт ChatGPT, где ученики могут использовать необычный инструмент для написания сочинений. Однако сомнения возникли - можно ли как-то выявить, создал текст человек или же это продукт нейросети?
Евгений Кузьмин, опытный тестировщик нейросетей, успешно протестировал новейшую модель. Его разностороннее портфолио и глубокие знания обеспечивают надежный результат.

В настоящее время можно теоретически различить текст, который был создан нейронной сетью. Ученые уже несколько лет работают над выявлением особенностей ИИ-текста— они находят повторяющиеся слова, анализируют структуру предложений и среднюю длину.

Однако, важно отметить, что языковые модели постоянно развиваются, опережая нашу способность их осознать. Всего лишь четыре года назад нейросети были неспособны связывать даже три предложения подряд, а сегодня они способны создавать последовательные и логические тексты. В связи с этим методы определения текстов, созданных искусственным интеллектом, быстро становятся устаревшими.

БЕСПЛАТНЫЙ КУРС H3: Как управлять личными финансами

секреты финансовой стабильности, избавиться от беспокойств по поводу денег и успешно достичь своих целей и мечтаний – вот что может предложить наша программа.

Что такое ChatGPT

ChatGPT— это чат-бот, разработанный OpenAI, который основан на самой современной версии языковой модели GPT, известной как GPT-3,5, выпущенной в январе 2023 года. В предыдущей статье, опубликованной в Тинькофф Журнале, мы детально рассказывали о том, как ChatGPT функционирует и чем отличается от других нейронных сетей. В настоящее время ChatGPT обладает способностью воссоздавать осмысленный диалог с пользователем, учитывать контекст и писать тексты, стихи, песни, коды, создавать сценарии, компилировать эссе и сочинения для экзаменов.

Ниже представлены 9 сценариев того, как можно применять чат-нейросеть ChatGPT в повседневной жизни.

В конце 2022 года, обеспокоенность американских учителей вызвала увеличивающаяся популярность ChatGPT, поскольку учащиеся начали сдавать свои задания, созданные этой системой искусственного интеллекта. В некоторых школах было принято решение ограничить доступ к чат-боту. В свою очередь, российские школьники также применяют ChatGPT для выполнения домашних заданий, однако модель еще не столь успешно справляется с русским языком, согласно СМИ.

Как человек может отличить ИИ-текст

Исследователи из компании Google Brain пришли к выводу еще в 2019 году, что нейросеть, используемая для написания текстов, может быть слишком конкретной. Например, данный искусственный интеллект слишком часто вставляет артикль "the" в предложения, так как его функция заключается в предсказании следующего слова в тексте. Однако следует учитывать, что данная особенность применима только к англоязычным текстам.

ChatGPT становится все более популярным в качестве альтернативы поисковым системам, благодаря своей способности предоставлять точные ответы на конкретные вопросы. Однако, когда речь заходит о размышлениях, у нее возникают проблемы: на вопросы вроде "Что такое любовь?" искусственный интеллект предоставит лишь сухую формулировку, не пытаясь анализировать этот сложный эмоциональный опыт.

Также нейросеть может очень уверенно написать абсолютную неправду. Сомневаться ейнесвойственно.

ChatGPT, нейросеть, исключает контекст и индивидуальность текста. Она не способна передать личный опыт конкретного человека, она может только попытаться имитировать опыт миллионов людей, на базе текстов, на которых модель была обучена. Однако, таким материалам зачастую не хватает глубины и авторского ощущения. Например, можно написать шаблонное сочинение о литературном произведении, но совершенно иное дело - рассказать о том, как провел свое лето.

Экспертность – здесь ключевой аспект. Хотя тексты, которые предоставляет ChatGPT, представляют определенную ценность, им все же не хватает глубины. Совершенно иначе обстоит дело с человеком, обладающим обширным личным опытом. Он способен углубиться в суть темы и предоставить непревзойденную информацию.

Новейшая версия языковой модели обладает значительно повышенной способностью работать с контекстом по сравнению с предыдущими. В результате возникает потребность в несложном редактировании сгенерированного текста ChatGPT с целью придания ему более естественного «человеческого» стиля.

Привет! Я опытный копирайтер, и готов помочь вам с рерайтом абзаца текста. Вот, что я предлагаю:

"Приветствуем вас! Я профессиональный копирайтер, и моя цель - помочь вам улучшить данный абзац текста. Вот что я предлагаю:"
Вряд ли за такое сочинение в четвертом классе я получил бы отлично

Ошибки и нейросеть - вещи несовместимые. В Google Brain они отмечают, что чаще всего люди ощущают настоящим текст, который написал сам человек, хотя на самом деле сверхточная грамматика и идеальная орфография свойственны исключительно ИИ. Люди часто допускают ошибки в пунктуации, совершают опечатки и не всегда следуют формальным правилам языка. Возможность достичь такого же уровня имитации, какую продемонстрировала нейросеть, пока еще не открыта для людей.

Какие сервисы помогут отличить ИИ-текст

Услуги сталкиваются с двумя основными вызовами. Во-первых, они сталкиваются с тем же препятствием, что и самостоятельное обнаружение ИИ-текста: алгоритмы были обучены на устаревшей модели GPT-2, которая была выпущена в 2019 году. Однако за последние три года модель значительно усложнилась, приобретя значительное количество новых возможностей.

Одной из важных проблем является то, что множество сервисов либо не поддерживают русский язык вообще, либо имеют сложности в его правильной обработке, что сказывается на точности определения авторства текста.

Еще не все новые сервисы доступны, но я хотел бы поделиться несколькими рабочими вариантами, которые уже есть. Для тестирования я использовал три различных источника: первый текст был сгенерирован на английском языке, второй - на русском, а третий был написан моим коллегой без участия искусственного интеллекта.

— это уникальная разработка компании OpenAI, созданная специально для обнаружения текстовых выводов, сгенерированных моделью GPT-2. Благодаря этому инструменту, предоставленному в2019году, пользователи теперь могут легко и быстро определить, является ли текст результатом работы нейросети или написан человеком. Кроме того, GPT-2Output Detector обладает очень простым и понятным интерфейсом, который позволяет каждому загрузить свой текст насайт и получить вероятность автоматической генерации этого текста. Благодаря бесплатной демоверсии, доступной всем пользователям, этот инструмент стал еще более доступным и удобным в использовании.

Сервис без труда справился с английским языком, демонстрируя, что мою тестовую запись с вероятностью 99,98% создал Искусственный Интеллект, а не человек. Однако, когда речь зашла о русском языке, конфиденциальность была несколько ниже - всего лишь 75%. При этом текст моего коллеги также был классифицирован как генерированный нейросетью. Однако, после загрузки другого фрагмента, результаты изменились.

Внимание! В мире косметики появился новый продукт, который полностью изменит вашу жизнь. Представляем вам революционный крем для лица, который обеспечивает интенсивное увлажнение и омолаживает кожу. С его помощью вы сможете избавиться от морщин, тусклости и несовершенств кожи. Благодаря уникальным активным ингредиентам, этот крем обещает значительное улучшение внешнего состояния вашей кожи уже после первого применения. Забудьте о скучных процедурах и дорогих салонных процедурах, с новым кремом ваше лицо будет сиять молодостью и здоровьем. Попробуйте его сейчас и убедитесь сами в его эффективности!
Если вам не требуется обоснование принятого решения, то GPT-2 Output Detector - идеальный выбор.

— уникальный инструмент, разработанный совместно командой исследователей из престижного университета Гарвард и технологической компании IBM. Этот сервис предназначен для использования с прогрессивной моделью GPT-2 и уже в 2019 году демонстрировал удивительные результаты, часто превосходящие ее возможности, правильно предсказывая действия нейросети в 66% случаев. Более того, при работе со сложной GPT-3, GLTR продемонстрировал аналогичную точность и эффективность.

Алгоритм анализирует вероятность каждого последующего слова в тексте. Принцип работы заключается в том, что если запросить дополнение фразы «Как же мне не хочется каждый понедельник с утра идти на…», очевидным завершением будет «…работу». Естественно, также можно предположить другие варианты, такие как "…учебу". Хотя и человек способен продумать такое дополнение, однако если весь текст состоит из предсказуемых шаблонов, то большая вероятность, что его составил ИИ.

Мой сгенерированный материал на английском языке вызвал интерес - GLTR подтвердил, что он был создан нейросетью. Однако, к сожалению, русскому языку этот сервис не распознает.

"Для достижения успеха в бизнесе необходимо иметь качественный и легко запоминающийся логотип. Логотип является лицом компании и отображает ее ценности и уникальность. Он должен быть узнаваемым, эстетичным и отличаться от конкурентов. Качественный логотип помогает привлечь внимание к бренду, выделиться на рынке и создать положительное впечатление о компании у потенциальных клиентов. Увидев логотип, клиент должен мгновенно узнать бренд и ощутить доверие к нему. Поэтому создание уникального и эффективного логотипа является одним из важнейших элементов успешного бизнеса."
Все, что выделено зеленым,— слова изтоп-10 по предсказуемости

— это сервис, созданный молодым и талантливым американским студентом Эдвардом Тианом, который всего лишь находится на 22 году своей жизни. Изначально разработанный им в январе 2023 года, данный инструмент сразу же завоевал сердца пользователей и стал невероятно популярным. В то время как продвинутая платная версия GPTZero все еще находится в разработке, я лично имел возможность воспользоваться бесплатным классическим вариантом.

Сервис анализирует текст по двум параметрам:

Perplexity оценивает уровень предсказуемости текста, где авторы проявляют склонность к использованию более сложных и неочевидных сочетаний слов. Кроме того, она анализирует структуру и длину предложений, чтобы оценить степень их сложности.

Разбодрившись после процесса анализа оценок, необходимо прокрутить страницу вниз и нажать кнопку "Получить результаты", чтобы узнать окончательные результаты.

В моем личном опыте стоит отметить, что GPTZero успешно определил авторство английского текста, однако не справился с русским языком, выдав ошибку. В социальных сетях часто упоминают, что GPTZero может быть обманут, но при работе с основными материалами он проявляет свои возможности.

Давайте представим, что вы только что открыли собственный ресторан. Вы вкладываете свою душу и страсть в каждое блюдо, которое готовите. Вы стремитесь создать атмосферу уюта и гостеприимства для каждого гостя, который переступает порог вашего заведения. Ваша миссия - удовлетворить вкусы и потребности каждого клиента, создавая незабываемый опыт питания. Ваш ресторан - это не просто место, где можно перекусить, это место, где люди могут насладиться изысканными блюдами, провести время с друзьями и семьей, или отпраздновать особое событие. Добро пожаловать в мир вкусов и эмоций, добро пожаловать в наш ресторан.
Я так и неразобрался в показателях текста, но результат один: его сгенерировал ИИ

является уникальным инструментом, созданным для эффективной коммуникации с помощью искусственного интеллекта. Он может безупречно имитировать разговоры и предложить убедительные аргументы, используя свой богатый опыт и знания, накопленные в процессе общения с миллионами людей. С помощью ChatGPT Вы можете проводить интересные и продуктивные диалоги, задавая вопросы, выясняя мнения или даже обмениваясь соображениями. Это прекрасное средство для углубления знаний и получения новых идей от глобального сообщества. Отныне общаться с искусственным интеллектом станет увлекательным и познавательным опытом. Попробуйте ChatGPT прямо сейчас и оцените все его возможности!

В моем случае нейросеть успешно обработала сгенерированный ею собственным материалом. Кроме того, она проинформировала меня о том, что в данном тексте содержится слишком обычная и распространенная информация, которая доступна в сети. Зато русскоязычный сгенерированный текст ChatGPT был воспринят как написанный живым человеком.

Недавно проведенные исследования показали, что зеленый чай имеет множество преимуществ для нашего организма. Благодаря своему богатому содержанию антиоксидантов, зеленый чай является мощным оружием в борьбе с оксидативным стрессом и предотвращении различных заболеваний, таких как сердечно-сосудистые. Он также может помочь нам сжигать лишний жир и улучшать метаболический процесс, что делает его идеальным выбором для тех, кто хочет похудеть и поддерживать здоровый образ жизни.Кроме того, зеленый чай содержит легкую дозу кофеина, которая помогает повысить концентрацию и внимание, придавая энергию и бодрость нашему организму. Употребление зеленого чая также связано с повышенной защитой от возникновения рака и даже снижением риска развития болезни Паркинсона и Альцгеймера.
Мне было предоставлено объяснение ChatGPT о том, каким образом он получил свой собственный сгенерированный текст.

Результаты моего тестирования сервисов

GPT-2Output Detector

GLTR

GPTZero Classic

ChatGPT

Определилли ИИ-текст наанглийском языке

Да

Да

Да

Да

Определилли ИИ-текст нарусском языке

Да

Выдал ошибку

Выдал ошибку

Принял зачеловека

Определилли текст человека нарусском языке

Да, ноодин раз принял человека заИИ

Выдал ошибку

Выдал ошибку

Да

ОпределиллиИИ-текст наанглийскомязыке

GPT-2Output Detector

Да

GLTR

Да

GPTZero Classic

Да

ChatGPT

Да

ОпределиллиИИ-текст нарусскомязыке

GPT-2Output Detector

Да

GLTR

Выдал ошибку

GPTZero Classic

Выдал ошибку

ChatGPT

Принял зачеловека

Определиллитекстчеловека нарусскомязыке

GPT-2Output Detector

Да, ноодин раз принял человека заИИ

GLTR

Выдал ошибку

GPTZero Classic

Выдал ошибку

ChatGPT

Да

H2: Чего ждать дальше

Ведущие платформы активно внедряют инновационные системы для проверки текстов с помощью искусственного интеллекта. Этот тренд уже отразился на различных платформах, таких как Medium и Stack Overflow, где были объявлены о запуске подобных сервисов. В перспективе можно ожидать, что такие современные инструменты станут широко применяться на всех крупных социальных сетях и платформах.

OpenAI уже разрабатывает технологию внедрения вотермарок в сгенерированные тексты. Эти вотермарки позволят определить авторство через скрытый криптографический сигнал, как сообщил Скотт Ааронсон, сотрудник компании. Он также отметил, что доступ к ключу для расшифровки вотермарки будет ограничен только разработчикам GPT. Пока детали работы и внешний вид этой технологии остаются неизвестными. Однако Ааронсон уже поделился этой информацией в своем блоге на сайте Tinkoff Journal. В статье рассказывается о том, как правильно составлять запросы к Midjourney, Stable Diffusion и другим нейросетям.