ChatGPT обвиняют в нарушении прав миллионов людей, чьи данные были использованы без их согласия
Юридическая компания Clarkson направила коллективный иск в федеральный суд северного округа Калифорнии против OpenAI, разработчика популярного ИИ-бота ChatGPT. Предполагается, что OpenAI нарушил права миллионов интернет-пользователей, используя их публично доступные данные для обучения больших языковых моделей, на которых основаны ИИ-алгоритмы.
Компания Clarkson, представляя интересы пострадавших пользователей, утверждает, что данные были украдены и несанкционированно использованы для создания мощной технологии. Эти данные включают общедоступную информацию, такую как комментарии в социальных сетях, сообщения в блогах, статьи на веб-страницах, включая «Википедию» и другие источники. Представители OpenAI в настоящее время воздерживаются от комментариев по данному вопросу.
Судебный иск Clarkson касается главной нерешенной проблемы, которую имеют генеративные нейросети, включая ИИ-боты и генераторы изображений. Обучение таких инструментов основывается на использовании огромного объема данных, доступных в Интернете. Большие языковые модели, по завершении этого обучения, способны взаимодействовать с людьми, сочинять стихи и рассказы, вести сложные беседы и выполнять другие задачи. Однако пользователи, чьи данные использовались в обучении, не давали согласия на такое использование информации разработчиками, такими как OpenAI.
Как уточнил Райан Кларксон, управляющий партнер компании Clarkson, «вся эта информация используется масштабно, хотя она никогда не была предназначена для обучения больших языковых моделей». Он также ожидает, что суд установит определенные ограничения для обучения ИИ-алгоритмов и определит возможность получения компенсации пользователями за использование их данных. Компания уже имеет группу истцов и активно ищет новых клиентов.
Данный иск Clarkson к OpenAI не является первым случаем, когда разработчиков ИИ-алгоритмов обвиняют в незаконном использовании данных. В прошлом ноябре был подан иск против OpenAI и Microsoft в связи с использованием ими программного кода, размещенного на платформе GitHub, для обучения ИИ-инструментов. В феврале платформа Getty Images также подала в суд на Stability AI, обвиняя компанию в незаконном использовании изображений, предоставляемых сервисом, для обучения собственной генеративной нейросети.