Новые браузеры на базе искусственного интеллекта от OpenAI и Perplexity оказались способными обходить системы платного доступа на новостных сайтах, фактически похищая контент, предназначенный только для подписчиков.

Об этом сообщает Columbia Journalism Review по результатам собственного расследования, передает ITC.ua.

Во время тестирования ИИ-браузеры Atlas (от OpenAI) и Comet (от Perplexity) без каких-либо затруднений представили полный текст эксклюзивной статьи MIT Technology Review объемом 9 тысяч слов, доступной только по платной подписке.

При этом стандартные версии ChatGPT и Perplexity честно ответили, что не могут получить доступ к материалу, поскольку их сканеры заблокированы сайтом.

Секрет в том, что для веб-сайтов Atlas и Comet выглядят как обычные посетители, использующие браузер Chrome. В отличие от традиционных автоматизированных систем – краулеров и парсеров, которые идентифицируют себя специальным цифровым маркером, ИИ-браузеры не оставляют никаких следов своей истинной природы.

Обычные боты проявляют себя через идентификатор, который сообщает сайту о программном обеспечении и цели запроса. Издатели могут блокировать такие сканеры с помощью протокола исключения ботов (Robots Exclusion Protocol).

"Поскольку браузеры с искусственным интеллектом отображаются в журналах сайта как обычные сеансы Chrome, их блокирование также может помешать легитимным пользователям получить доступ к сайту. Это значительно усложняет для издателей выявление, блокирование или мониторинг этих агентов искусственного интеллекта", – объясняют авторы исследования.

Исследователи выявили принципиальную разницу между типами платных барьеров:

"Клиентский пейвол" (использует MIT Technology Review):
- Текст загружается на страницу, но скрыт за баннером с предложением подписаться
- Контент невидим для людей, но доступен для ИИ-браузеров
- Atlas и Comet легко его читают

"Серверный пейвол" (используют Wall Street Journal и Bloomberg):
- Полный текст отображается только после входа и оплаты
- ИИ-браузеры не могут получить доступ без авторизации
- Более надежная защита

Интересное открытие: Atlas избегает прямого чтения текстов медиакомпаний, которые подали в суд на OpenAI за нарушение авторских прав.

Когда журналисты попросили Atlas подытожить статью из PCMag (материнская компания Ziff Davis судится с OpenAI), браузер создал обобщение, используя: твиты о статье, цитаты в других изданиях, упоминания в соцсетях.

Эксперт по онлайн-исследованиям Хенк ван Эсс назвал это методом "цифровых крошек" – агенты ИИ фактически проводят обратный инжиниринг статьи, собирая информацию из непрямых источников.

Популярные статьи сейчас

Украина приняла важное решение о Покровске: Флеш раскрыл детали

ISW раскрыл секрет захвата Покровска: как новая тактика РФ ломает оборону

Идентификация пенсионеров в "Дия": украинцам объяснили, что делать с ошибкой банка

ТЦК, Госслужба труда и налоговая начали приходить к предприятиям: ищут скрытых работников

Показать еще

Подобная ситуация сложилась с New York Times, которая также судится с OpenAI. Вместо прямого доступа к статье Atlas создал краткое изложение на основе материалов четырех альтернативных изданий: The Guardian, Washington Post, Reuters, Associated Press.

Показательно, что три из этих четырех изданий имеют лицензионные соглашения с OpenAI.

Для сравнения, браузер Comet от Perplexity подобного "этичного" поведения не демонстрирует и читает контент всех изданий без исключений.

Появление ИИ-браузеров, способных обходить системы монетизации, создает серьезную угрозу для бизнес-модели новостных изданий, которые полагаются на доходы от подписчиков. Издатели оказались в ситуации, когда традиционные методы защиты контента оказываются неэффективными против нового поколения ИИ-инструментов.