OpenAI Запрашивает Реальные Рабочие Образцы для Обучения ИИ-Агентов

3

OpenAI активно запрашивает реальные рабочие задания у подрядчиков, чтобы оценить производительность своих ИИ-моделей нового поколения по сравнению с человеческой. Компания просит подрядчиков загружать прошлые или текущие результаты работы — документы, презентации, таблицы и даже репозитории кода — в качестве обучающих данных. Эта инициатива, по всей видимости, является ключевой частью стремления OpenAI к достижению Общего Искусственного Интеллекта (AGI), в котором ИИ-системы превосходят человеческие возможности в экономически значимых задачах.

Человеческая Производительность как Эталон

OpenAI стремится установить измеримый человеческий эталон для различных задач. Сравнивая результаты работы ИИ с реальными образцами человеческой работы, компания может оценить прогресс своих моделей. Подрядчиков просят предоставлять подробные описания задач и соответствующие результаты — готовый продукт работы. Этот подход ставит на первое место аутентичность: OpenAI прямо запрашивает «реальную рабочую деятельность», а не симуляции.

Проблемы Конфиденциальности

Несмотря на инструкции удалять конфиденциальные данные, эта практика создает значительные юридические риски. Юрист по интеллектуальной собственности Эван Браун предупреждает, что ИИ-лаборатории могут столкнуться с исками о неправомерном присвоении коммерческой тайны, если конфиденциальная информация утечет. Подрядчики, предоставляющие образцы работы, даже после анонимизации, могут нарушать соглашения о неразглашении с предыдущими работодателями. Сама OpenAI признает необходимость удаления конфиденциальных данных и даже упоминает внутренний инструмент, «Superstar Scrubbing», для этой цели.

Расширяющийся Рынок Обучения ИИ

Эта практика является симптомом более широкой тенденции: ИИ-лаборатории все больше зависят от высококачественных обучающих данных. Такие компании, как OpenAI, Anthropic и Google, нанимают целые армии подрядчиков через фирмы, такие как Surge, Mercor и Handshake AI, для генерации этих данных. Спрос на квалифицированных подрядчиков привел к росту цен, создав прибыльную подиндустрию стоимостью в миллиарды долларов. OpenAI даже изучала возможность прямой закупки данных у обанкротившихся компаний, хотя опасения по поводу полной анонимизации данных остановили одно такое расследование.

ИИ-лаборатория возлагает большое доверие на своих подрядчиков в определении того, что является, а что нет конфиденциальным… Если что-то все же проскользнет, действительно ли ИИ-лаборатории тратят время на определение того, что является, а что нет коммерческой тайной? Похоже, что ИИ-лаборатория подвергает себя огромному риску.

Зависимость от сторонних подрядчиков подчеркивает растущее давление на ИИ-компании с целью улучшения своих моделей с использованием реальных данных. Хотя OpenAI подчеркивает безопасность данных, неотъемлемые риски обработки конфиденциальных образцов работы остаются серьезной проблемой как для подрядчиков, так и для их бывших работодателей.