Skip to content Skip to sidebar Skip to footer

Обход цензуры в нейросетях: новый метод с использованием ASCII-арта

Обход цензуры в нейросетях: новый метод с использованием ASCII-арта

Исследователи из университетов Вашингтона и Чикаго совершили прорыв в понимании работы и возможностей обхода цензуры в больших языковых моделях (LLM), таких как GPT-3.5, GPT-4 и других. В основе их метода лежит использование ASCII-арта для маскировки стоп-слов, что позволяет обойти встроенные механизмы фильтрации контента.

Как это работает?

Суть метода заключается в том, что запрещённые или цензурируемые запросы переводятся в ASCII-арт, то есть изображения, созданные из обычных символов клавиатуры. Это позволяет маскировать контент таким образом, что нейросеть не воспринимает его как запрещённый или подлежащий цензуре. Таким образом, запросы, которые обычно блокируются, могут быть обработаны без каких-либо ограничений.

Эксперименты и результаты

В ходе экспериментов учёные заменили стоп-слова, такие как “бомба”, на их ASCII-арт эквиваленты, после чего нейросети, включая GPT-3.5, GPT-4, Gemini, Claude и Llama 2, давали запрещённую информацию, например, инструкции по изготовлению фальшивых денег или бомб. Такой подход демонстрирует, что текущие системы фильтрации контента в LLM основаны на семантике слов и не способны корректно интерпретировать визуально закодированную информацию.

Возможные последствия

Открытие ставит перед разработчиками и эксплуатантами больших языковых моделей задачу по усовершенствованию алгоритмов фильтрации, чтобы противостоять подобным методам обхода цензуры. С одной стороны, ASCII-арт может казаться безобидным, но его использование для обхода защитных механизмов поднимает вопросы о безопасности и этичности применения нейросетей.

Взгляд в будущее

Разработчики нейросетей и исследователи в области искусственного интеллекта теперь сталкиваются с задачей разработки новых систем безопасности, которые могли бы эффективно распознавать и блокировать подобные попытки обхода цензуры. Это требует глубокого понимания не только лингвистических, но и визуальных аспектов коммуникации.

Эксперименты, проведённые командой из Вашингтона и Чикаго, подчёркивают важность постоянного развития и адаптации алгоритмов искусственного интеллекта в условиях, когда технологические “лазейки” могут быть найдены и использованы для обхода существующих ограничений.

Sign Up to Our Newsletter

Be the first to know the latest updates

[yikes-mailchimp form="4"]