Google и социальная платформа Reddit заключили партнерство, в рамках которого Reddit предоставляет свой контент для помощи в обучении моделей искусственного интеллекта (ИИ) поискового гиганта.

Reddit объявил о предоставлении Google улучшенных методов для обучения моделей.

В сообщении о сделке Reddit говорится:

В соответствии с нашей верой в то, что каждый должен иметь возможность найти нужную ему информацию и получить желаемый опыт в Интернете, мы расширили наше сотрудничество с Google, чтобы упростить поиск и доступ к сообществам и обсуждениям, которые люди ищут на Reddit.

Reddit

В рамках этого сотрудничества Google получает доступ к данным Reddit по API, что позволяет использовать контент Reddit в реальном времени.

Этот дает Google возможность интегрировать большой объем контента Reddit в свои продукты.

Взамен, Reddit будет использовать Vertex AI от Google — сервис на базе искусственного интеллекта и нацеленный на улучшение результатов поиска для бизнеса.

Reddit подчеркнул, что это партнерство не изменяет условия использования его данных по API. По прежнему сохраняются ограничения на коммерческий доступ к данным без предварительного одобрения для разработчиков или компаний.

Сообщение о партнерстве с Reddit последовало вслед за сообщениями Bloomberg о том, что Reddit заключил сделку по обучению искусственного интеллекта на 60 миллионов долларов с неуказанной ИИ-компанией.

Ранее Reddit заявлял о намерении взимать плату за использование своего API. Сотрудничество с Google является первым известным соглашением Reddit с крупным разработчиком ИИ.

В 2023 году Google обновил свою политику конфиденциальности, разрешив использование публично доступных данных для целей обучения ИИ.

Это изменение последовало вскоре после того, как OpenAI, разработчик ChatGPT, столкнулся с коллективным иском в Калифорнии, в котором его обвиняли в несанкционированном сборе частных пользовательских данных из интернета.

Тем не менее, согласно обновлениям коммерческих условий использования для разработчиков Claude от Anthropic, стартапа в области генеративного ИИ, компания пообещала воздерживаться от использования данных клиентов для обучения больших языковых моделей, начиная с января 2024 года.

Ранее Reddit угрожал заблокировать доступ к своему сайту для поисковых систем Google, выражая опасения, что компании могут использовать его данные для обучения моделей ИИ.

Многие разработчики моделей ИИ в последнее время пытаются договориться с поставщиками контента и данных, чтобы расширить свои данные для обучения. Это происходит на фоне заявлений многих владельцев контента о том, что их материал использовался разработчиками ИИ без разрешения.

Переход к партнерству с владельцами контента отражает тенденцию среди разработчиков моделей ИИ, направленную на диверсификацию источников данных для обучения, выходящую за рамки парсинга открытых источников. Владельцы контента все чаще говорят о несанкционированном использовании их материалов для обучения ИИ, что побуждает разработчиков искать официальные соглашения о легальном доступе к контенту.