AI News

DeepSeek инициирует прямой вызов Google с планами по мультимодальной поисковой системе на базе искусственного интеллекта (AI)

В мировой сфере искусственного интеллекта происходят значительные изменения: ханчжоуский стартап DeepSeek активно поворачивает своё направление в сторону рынка поисковых систем. Недавние объявления о вакансиях и стратегические шаги показывают, что компания разрабатывает многоязычную (multilingual), мультимодальную (multimodal) поисковую систему на базе AI, способную обрабатывать текст, изображения и аудио. Это развитие знаменует собой прямое нарастание конкуренции с устоявшимися гигантами отрасли, такими как Google и OpenAI.

Инициатива опирается на быстро растущую репутацию DeepSeek в области высокоэффективной тренировки моделей и вкладов в open-source. Ориентируясь на «ориентированный на телефон» (phone-first) опыт поиска, способный обрабатывать сложные входные данные вроде скриншотов и голосовых команд, DeepSeek стремится нарушить традиционную парадигму поиска, основанную на ключевых словах.

Штабная кампания по найму раскрывает амбиции

В январе DeepSeek опубликовал серию вакансий, которые дают ясное представление о дорожной карте продукта. В отличие от предыдущих кампаний по найму, ориентированных на общее исследование больших языковых моделей (large language model, LLM), эти новые роли специально нацелены на инфраструктуру поиска и разработку автономных агентов.

Компания ищет «инженеров по поисковым алгоритмам (Search Algorithm Engineers)» и full-stack разработчиков с опытом работы с постоянными агентами (persistent agents). В описаниях вакансий описывается система, способная функционировать при минимальном человеческом надзоре, что указывает на движение за пределы простых чат-ботов в сторону полностью автономных ассистентов. Ключевые обязанности, перечисленные в материалах по найму, включают:

  • Поддержка многоязычных запросов: Построение движка, который изначально может понимать и обрабатывать запросы на десятках языков.
  • Мультимодальная интеграция: Разработка конвейеров для обработки не текстовых входных данных, с оптимизацией для мобильных сценариев, где пользователи могут искать с помощью скриншота или голосовой записи.
  • Агентная инфраструктура (Agentic Infrastructure): Создание платформ для размещения постоянных агентов, которые могут выполнять задачи на длинном горизонте, например собирать информацию в сети для ответа на сложные вопросы.

Эта кампания по найму согласуется с более широкой стратегией компании по расширению своей полезности за пределы ассистентов по кодированию и интерфейсов чата в прибыльную область извлечения информации — сектор, который в настоящее время доминирует у Alphabet Inc.’s Google.

Технологическая основа: Janus-Pro и DeepSeek-R1

Уверенность DeepSeek в возможности бросить вызов титанам Кремниевой долины проистекает из его недавних прорывов в архитектуре моделей. Две ключевые технологии, по-видимому, формируют основу этой новой поисковой системы: ориентированная на рассуждение DeepSeek-R1 и мультимодальная Janus-Pro.

Хотя DeepSeek-R1 привлёк внимание заголовков за сопоставление с моделями высшего уровня из США при меньших затратах на обучение, Janus-Pro, вероятно, станет движком для визуальных и аудио возможностей поиска. Недавно выпущенный Janus-Pro — это объединённая мультимодальная (multimodal) модель, которая разделяет визуальное кодирование и генерацию. Эта архитектурная инновация позволяет модели «видеть» и «понимать» изображения с высокой точностью, при этом сохраняя способность генерировать текст или изображения в ответ.

Сравнение ключевых архитектур DeepSeek

Model Name Primary Function Key Architectural Feature Target Application
DeepSeek-R1 Мышление и логика Смесь экспертов (Mixture-of-Experts, MoE) Разрешение сложных запросов и анализ данных
Janus-Pro Мультимодальное понимание Разделённое визуальное кодирование Поиск по изображениям/аудио и генерация контента
DeepSeek-V3 Общие языковые задачи Протокол эффективного обучения Базовый слой для многоязычной обработки текста

В бенчмарках, как сообщается, Janus-Pro превзошёл таких конкурентов, как DALL-E 3, по ряду метрик генерации и понимания. Интегрируя эту возможность в поисковую систему, DeepSeek мог бы позволить пользователям загрузить фотографию сломанного прибора и спросить: «Как это починить?» — при этом ИИ идентифицировал бы модель, находил бы руководство и суммировал шаги по ремонту в одном плавном взаимодействии.

За пределами ключевых слов: рост автономных агентов

Включение постоянных агентов в описания вакансий указывает на то, что DeepSeek стремится опередить текущее поколение AI-поиска. Современные инструменты AI-поиска часто выступают в роли суммаризаторов — читают топовые результаты и синтезируют ответ. Видение DeepSeek, по-видимому, предполагает агентов, которые могут перемещаться по сети, выполнять действия и сохранять контекст в течение длительного времени.

«Агентная» поисковая система (agentic) не просто извлекает ссылки; она выполняет задачи. Например, вместо поиска «цены на рейсы» постоянному агенту можно дать указание «отслеживать рейсы в Токио в течение следующего месяца и бронировать, если цена упадёт ниже $800». Эта возможность требует надёжной инфраструктуры для предотвращения «галлюцинаций» (hallucinations) и обеспечения надёжного выполнения, задачу, которую DeepSeek решает путём найма специалистов в области оценочных фреймворков и надёжности обучающих данных.

Дестабилизация рынка за счёт эффективности затрат

Одно из самых грозных преимуществ DeepSeek — его структура затрат. Компания шокировала отрасль, сообщив, что её модель V3 была обучена примерно за $6 миллионов, что резко контрастирует с оценочными ~$100 миллионами, необходимыми для GPT-4 от OpenAI.

Эта эффективность позволяет DeepSeek предлагать свои сервисы по значительно более низким API-стоимостям, агрессивно подсиживая конкурентов. Если эта модель низких затрат будет применена к поиску, это может инициировать ценовую войну на рынке AI-API, делая продвинутые возможности поиска доступными для более широкого круга разработчиков и компаний.

Стратегия «ориентированная на телефон» (phone-first) также эксплуатирует потенциальную слабость Google. Хотя Google доминирует в веб-поиске, переход к AI-нативному, мультимодальному взаимодействию на мобильных устройствах всё ещё находится в начальной стадии. Оптимизировав обслуживание запросов со скриншотов и голосом — естественных способов для мобильных пользователей — DeepSeek пытается захватить следующее поколение поведения при поиске.

Заключение

Шаг DeepSeek в направлении AI-поиска — это не просто эксперимент; это рассчитанное расширение, поддержанное специализированным наймом и проверенными архитектурами моделей, такими как Janus-Pro. Комбинируя высокоэффективные модели рассуждения с продвинутым мультимодальным пониманием, компания создаёт платформу, которая напрямую конкурирует с основными бизнес-моделями Google и OpenAI. По мере созревания этих технологий определение «поиска» должно эволюционировать от списка синих ссылок к динамичному, мультимодальному диалогу с интеллектуальными агентами.

Рекомендуемые
ThumbnailCreator.com
Инструмент с искусственным интеллектом для быстрого и легкого создания впечатляющих профессиональных миниатюр YouTube.
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
Diagrimo
Diagrimo мгновенно преобразует текст в настраиваемые диаграммы и визуализации, созданные искусственным интеллектом.
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
Yollo AI
Общайтесь и творите с ИИ-партнером. Превращение фото в видео, генератор ИИ-изображений.
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
HappyHorseAIStudio
Браузерный генератор видео на базе ИИ для текста, изображений, референсов и видеомонтажа.
InstantChapters
Создавайте захватывающие главы книг мгновенно с Instant Chapters.
NerdyTips
Платформа прогнозов на футбол на базе ИИ, предоставляющая основанные на данных советы по матчам в лигах по всему миру.
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
happy horse AI
Open-source AI-генератор видео, создающий синхронизированные видео и аудио из текста или изображений.
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
AI Video API: Seedance 2.0 Here
Унифицированный AI API для видео, предлагающий топовые модели генерации через один ключ по более низкой цене.
wan 2.7-image
Управляемый генератор изображений на базе ИИ для точных лиц, палитр, текста и визуальной непрерывности.
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Atoms
Платформа с поддержкой ИИ, которая с помощью мультиагентной автоматизации за считанные минуты создает полнофункциональные приложения и сайты без необходимости кодирования.
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
AirMusic
AirMusic.ai генерирует качественные музыкальные треки с помощью ИИ по текстовым подсказкам с настройкой стиля и настроения и экспортом стемов.
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
ainanobanana2
Nano Banana 2 генерирует изображения 4K профессионального качества за 4–6 секунд с точной отрисовкой текста и согласованностью объектов.
Free AI Video Maker & Generator
Бесплатный AI создатель и генератор видео – безлимитный, без регистрации
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.
Telegram Group Bot
TGDesk — универсальный бот для групп в Telegram, позволяющий собирать лиды, повышать вовлечённость и развивать сообщества.

DeepSeek создает поисковую систему с ИИ, чтобы бросить вызов доминированию Google

Вакансии DeepSeek раскрывают планы по созданию мультимодальной поисковой системы с ИИ, поддерживающей текст, изображения и аудио, напрямую нацеленной на долю Google на рынке поиска.