DeepSeek підозрюють у використанні даних Google Gemini для навчання нової моделі ШІ

Сергій Красовський04.06.2025

217 1 хвилина читання

DeepSeek підозрюють у використанні даних Google Gemini для навчання нової моделі ШІ — Джерело: Unsplash

Китайська компанія DeepSeek може бути причетна до використання результатів роботи Google Gemini для тренування власної системи. Про це заявили незалежні дослідники ШІ, які помітили схожість стилю й формулювань між відповідями DeepSeek та Gemini 2.5 Pro.

Розробник Сем Пак з Мельбурна опублікував результати аналізу, які вказують на можливе копіювання поведінкових патернів Gemini. Інший дослідник під псевдонімом SpeechMap також стверджує, що «роздуми» моделі DeepSeek R1 під час генерації відповідей нагадують логіку роботи моделей Google.

Це не перша подібна підозра: у грудні 2024 року модель DeepSeek V3, за свідченнями користувачів, іноді називала себе ChatGPT. У OpenAI заявляли, що виявили спроби копіювання через техніку “дистиляції” — навчання на відповідях інших ШІ. Крім того, Microsoft фіксувала витік даних через акаунти розробників, які, ймовірно, були пов’язані з DeepSeek.

Попри те, що багато сучасних моделей можуть випадково схожим чином формулювати відповіді через “засміченість” інтернету ШІ-контентом, експерти вказують: сценарій навчання DeepSeek на даних Gemini — цілком імовірний. Низка великих компаній, серед яких OpenAI, Google та Anthropic, вже почали впроваджувати заходи безпеки, щоб захистити власні моделі від копіювання.

Компанія Google поки що не дала офіційного коментаря.

Позначки