11 февраля 2025 18:00
177
Время прочтения: 1 мин

DeepSeek: Китайская нейросеть, меняющая правила игры

Фото: Alex Knight Pexels

Сегодня отмечается День безопасного интернета — напоминание о том, как важно защищать данные в цифровую эпоху. Однако даже ведущие технологические компании не застрахованы от утечек. Недавний пример — китайская языковая модель DeepSeek, созданная компанией DeepSeek при финансовой поддержке хедж-фонда High-Flyer. Эта модель, сравнимая по возможностям с GPT-4o от OpenAI, а в некоторых тестах даже превосходящая её, была представлена в январе 2025 года. Она вызвала бурную реакцию в индустрии благодаря своей открытости, эффективности и низким затратам на использование.

Почему DeepSeek оказалась в центре внимания

До 2025 года о DeepSeek знали немногие, но в этом году она совершила настоящий прорыв. Разработчики смогли создать конкурентоспособную языковую модель, потратив на её обучение всего 5,5 млн долларов — в разы меньше, чем OpenAI на GPT-4. Причём китайские специалисты работали в условиях санкций, ограничивающих доступ к мощным видеокартам NVIDIA и AMD. Несмотря на это, DeepSeek-R1 продемонстрировала результаты, сопоставимые с западными аналогами.

Запуск модели также сказался на финансовых рынках: сразу после релиза акции ведущих американских технологических компаний, включая NVIDIA, пошли вниз, а аналитики заговорили о том, что Китай укрепляет позиции в сфере искусственного интеллекта.

Что умеет DeepSeek-R1

DeepSeek-R1 обладает широкими возможностями:

Генерация текстов и ответов на вопросы;
Поиск информации в интернете в режиме реального времени;
Написание и отладка кода;
Анализ документов и распознавание текста на изображениях;
Возможность работы без подключения к облаку, если у пользователя достаточно мощное оборудование.

Главное преимущество DeepSeek-R1 — это механизм логического рассуждения перед генерацией ответа, что делает её схожей с GPT-4o и позволяет получать более точные результаты.

Как воспользоваться DeepSeek

Доступ к DeepSeek возможен через веб-версию, мобильное приложение или локальный запуск. Однако из-за высокой нагрузки регистрация на платформе временно приостановлена, и пользователям советуют попробовать позже.

Другие нейросети от DeepSeek

Кроме R1, компания представила:

DeepSeekCoder-V2 — мощную нейросеть для генерации кода;
DeepSeek-Math — модель для решения математических задач;
Janus-Pro — инструмент для генерации и анализа изображений, способный конкурировать с DALL-E 3 и Stable Diffusion 3 Medium.

Утечка данных и вопросы безопасности

29 января 2025 года специалисты Wiz Research выявили утечку данных пользователей DeepSeek. Более миллиона строк из базы ClickHouse, содержащие секретные ключи, логи серверов и чаты пользователей, оказались в открытом доступе. Этот инцидент вызвал серьёзные опасения по поводу безопасности платформы и оставил открытым вопрос о том, какие ещё данные могли быть скомпрометированы.

Кроме того, компании OpenAI и Microsoft начали расследование, связанное с методами обучения DeepSeek. Ходят слухи, что китайская модель могла использовать дистилляцию инференса ChatGPT, копируя механизмы работы западных ИИ. В пользу этой гипотезы говорит и тот факт, что в русскоязычных ответах DeepSeek иногда ошибочно называет себя YandexGPT, что может указывать на неочищенные датасеты.

Заключение

DeepSeek — это одна из самых мощных и доступных языковых моделей на сегодняшний день, способная составить серьёзную конкуренцию западным разработкам. Её успех уже повлиял на технологический рынок и вызвал политические дискуссии. Однако инцидент с утечкой данных ставит под сомнение уровень безопасности платформы, что может повлиять на её будущее.