OpenAI звинувачує The New York Times у маніпуляціях з ChatGPT

Компанія OpenAI подала клопотання до суду з проханням відхилити частину позову від видання The New York Times на адресу OpenAI. Розробник штучного інтелекту стверджує, що медіакомпанія, ймовірно, сплатила стороннім особам за несанкціонований доступ до сервісу ChatGPT. Метою нібито було отримати 100 прикладів порушення авторських прав для обґрунтування власного позову.

Зокрема, у документах поданих до суду в Манхеттені OpenAI наголошує, що The New York Times знадобилися «десятки тисяч спроб» для генерування ChatGPT текстів з ознаками плагіату. І це досягалося за допомогою «оманливих підказок», які порушують умови використання сервісу.

«Звичайні користувачі не взаємодіють з ChatGPT таким чином», — йдеться у претензії.

Тобто йдеться про можливі цілеспрямовані маніпуляції задля отримання потрібних результатів. Подібну практику ще називають «red teaming» — коли команда фахівців навмисно намагається зламати чи обійти систему заради виявлення слабких місць. Це досить поширені методики у сфері кібербезпеки та ШІ.

Втім The New York Times поки що не прокоментували звинувачення на свою адресу.

Ця суперечка відбувається на тлі все більшого протистояння OpenAI з видавцями та медіа щодо використання захищеного авторським правом контенту для навчання штучного інтелекту.

Зокрема у грудні The New York Times подали позов з вимогою заборонити угоду Microsoft з OpenAI через ймовірні багатомільярдні збитки через неправомірне використання їхніх матеріалів. Багато хто вважає цей позов визначальним для подальшого регулювання галузі ШІ.

Сама OpenAI раніше неодноразово визнавала, що неможливо створити прогресивні моделі штучного інтелекту без використання величезних масивів даних, у тому числі текстів та зображень, захищених авторським правом. Адже вони становлять більшість творів сучасного суспільства — статті, блоги, фото, коди програм, навіть державні документи.

Втім нещодавно СЕО OpenAI Сем Альтман заперечив, що саме дані саме The New York Times є критично важливими для функціонування його компанії та моделей на кшталт ChatGPT.

«Нам не потрібно тренуватися саме на їхніх даних. Будь-яке конкретне джерело навчання не дуже впливає на нас», — сказав він.

Однак при цьому OpenAI активно укладає угоди про ліцензування контенту з іншими провідними видавцями та медіа. А у заяві до суду компанія визнала, що все ще потребує доступу до захищених матеріалів для подальшого прогресу штучного інтелекту.

Тож наразі суперечка OpenAI та The New York Times триває. І може мати далекосяжні наслідки для усієї індустрії штучного інтелекту. Адже для створення й вдосконалення ШІ необхідний все більший обсяг даних. І це дані, створені людьми у вигляді текстів, зображень, аудіо та відео.

За інформацією ресурсу: internetua

Читати також:

Видання The New York Times подало позов проти виробників штучного інтелекту, звинувативши їх у порушенні авторських прав

Світлина з відкритих джерел