DeepSeek обогнала ChatGPT и обвалила акции ИТ-гигантов.

Как это повлияло на перфоманс фонда AGS Global Equities?

Дата обзора: 31 января 2025

20 января китайский стартап DeepSeek-AI представил свою языковую модель DeepSeek-R1. Компания была основана в июле 2023 года Лян Вэньфэном, выпускником Чжэцзянского университета, одного из ведущих университетов Китая. Стартап принадлежит китайскому хедж-фонду High-Flyer (Вэньфэн входит в число его сооснователей). Эта же компания выступает единственным инвестором DeepSeek.

Первая модель была представлена в ноябре 2023 года и предназначен для решения задач, связанных с написанием программного кода. Стоимость доступа к ней, равно как и ко всем последующим релизам, была низкой. Релиз универсальной языковой модели DeepSeek V3 состоялся в конце декабря 2024 года.

Спустя месяц вышла последняя DeepSeek-R1, созданная на основе «обучения с подкреплением» (в рамках этого метода систему поощряют или наказывают за результат выполнения задачи, обычно организовано как соревнование двух или нескольких моделей, выполняющих задание и оценивающих результат). R1 предназначена для задач, в которых требуются логические рассуждения, поэтому она должна лучше справляться с вопросами, касающимися математики. Рост популярности R1 пришелся на 25-26 января, когда о ней начали писать западные СМИ.

В чем уникальность модели?
  • В технической документации, доступной на GitHub, говорится, что обучение V3 заняло всего два месяца, затраты составили около 5,6 млн долл. (против расходов в 100 млн долл. для обучения GPT-4 OpenAI) и в 20–30 раз меньше вычислительных мощностей, чем для запуска ChatGPT и Claude от Anthropic.
  • Разработчикам DeepSeek почти в 11 раз удалось сократить количество вычислительных ресурсов на обучение базовой модели V3. Для обучения последней модели DeepSeek потребовалась одна десятая вычислительной мощности сопоставимой модели Llama 3.1 от Meta, согласно исследовательскому институту Epoch AI.
  • В вычислениях модели используют числовые типы с плавающей запятой пониженной точности: 16- и 8-битных. Теоретически это позволяет снизить требования по использованию памяти в вычислениях. Сотрудники Nvidia предлагали использовать такой подход и разрабатывали алгоритмы на его основе еще в 2022 году.
  • В модели используется одновременное предсказание не одного, а нескольких следующих токенов, что позволяет ускорить и удешевить генерацию текста. Такое изменение в исходной архитектуре трансформера в индустрии обсуждали еще с 2020 года, но его неохотно внедряли в современные модели.
  • Технология multi-headed latent attention, позволяющая акцентировать внимание на определенных частях предложения и эффективнее использовать вычислительные ресурсы при обучении.
  • У DeepSeek открыт исходный код (open source) и открытые веса (числовые параметры, которые определяют силу влияния входных данных на результат). Это дает возможность компаниям использовать DeepSeek-R1 на своих собственных мощностях и адаптировать под разные бизнес-задачи, что пока что выгодно отличает его от ChatGPT.
  • Китайская модель не предполагает подписок или одноразовых покупок — для основной массы пользователей приложение бесплатно.

Что важно учитывать?
1. Некоторые заявления DeepSeek, например, о стоимости обучения модели, невозможно проверить. В действительности затраты могли быть кратно больше.
2. Модель R1 обучалась на наборе данных предыдущей V3. V3, в свою очередь, могла обучаться на общедоступных данных, в том числе сгенерированных чат-ботами OpenAI (в ряде случаев DeepSeek V3 идентифицирует себя как ChatGPT). То есть без OpenAI и, соответственно, огромного объема GPU-ресурсов V3 и DeepSeek-R1 могли бы вовсе не появиться. К тому же Лян, по сообщениям, имел запас в размере 10 тыс. чипов Nvidia A100, которые сейчас запрещены к экспорту в Китай. Не исключено, что на их основе и созданы модели DeepSeek.
3. Китайское происхождение R1 может помешать наращивать популярность в США (учитывая активную борьбу США с китайскими приложениями, в том числе с TikTok). Тем более DeepSeek собирает довольно много информации о пользователе, которые могут направляться и храниться в КНР (чего не скрывают разработчики в пользовательском соглашении).
4. DeepSeek еще не решила проблему галлюцинаций и по общему набору инструментов пока уступает разработкам OpenAI. Например, у R1 нет функции памяти, которая позволяет добавлять контекст, восстанавливая детали прошлых бесед.

В чем основные опасения рынка?
  • То, что DeepSeek обучена на базе менее продвинутых и более дешевых чипов в сравнении с OpenAI и Anthropic, поставило под сомнение необходимость в дорогостоящих процессорах и, соответственно, справедливость завышенных оценок американских производителей GPU. Риск падения спроса на графические процессоры спровоцировал падение акций Nvidia (2% в нашем фонде), AMD, Intel и ASML.
  • Снижение необходимости в больших вычислительных мощностях потенциально сократит спрос на дата-центры. Из-за этого под давлением оказались и акции разработчиков программного обеспечения и оборудования для дата-центров Broadcom (одна из крупнейших позиций в нашем фонде, 7%), Oracle (2%), Micron Technology (менее 1% в нашем фонде), Arista Networks, Nebius N.V.

Как мы смотрим на перспективы индустрии?
Долгосрочно появление таких моделей, как DeepSeek-R1, окажет сбалансированное влияние на технологическую индустрию.

В ближайшей перспективе полупроводниковые компании и поставщики оборудования и ПО для дата-центров действительно могут столкнуться с откатом интереса инвесторов. В среднесрочной и долгосрочной перспективе опасения рынка могут быть сглажены появлением новых технологий. Ускорение развития и внедрение ИИ, стимулы для дальнейших инноваций из-за усиления конкуренции и появление новых стартапов – для всего этого в любом случае будут необходимы вычислительные мощности (которые будут поставлять именно Nvidia и другие чипмэйкеры).

Бенефициарами появления новых моделей считаем разработчиков корпоративных ПО, которые уже имеют продукты на базе ИИ – Salesforce, Inc. (CRM) ServiceNow, Inc. (NOW), Snowflake Inc. (SNOW), Intuit Inc. (INTU), Autodesk, Inc. (ADSK) и Adobe (ADBE). Компании в этом секторе получат преимущества за счет сокращения затрат на разработку и вычисления, тогда как внедрение и адаптация новых моделей повысит качество ПО. С другой стороны, снижение стоимости обучения ИИ и работы с моделями снизит барьеры для входа на рынок и появлению новых стартапов. Это усилит конкуренцию в индустрии и может подтолкнуть компании к снижению цен, чтобы удержать позиции, что негативно для выручки.

Для Microsoft и Meta Platforms, активно инвестирующих в ИИ, многое будет зависеть от предстоящих корпоративных отчетностей – результаты и комментарии менеджмента дадут большую ясность в части оценки перспектив и пересмотра бизнес-стратегий.
© Abylai Global Solutions AFSA-A-LA-2023-0001
ABYLAI GLOBAL SOLUTIONS LTD. частная компания Международного финансового центра "Астана", находящаяся по следующему адресу: Z05T3E5, Казахстан, Астана, Мангилик Ел 55/22 оф 232, С4.3 E-mail: info@abylaigs.kz, https://abylaigs.kz/, под идентификационным номером 220440900175. Лицензия AFSA-A-LA-2023-0001. Предоставляемые услуги доступны только профессиональным клиентам и рыночным контрагентам в соответствии с Правилами ведения бизнеса МФЦА.

Указанная информация не является исчерпывающей и подготовлена только в информационных целях и носит исключительно ознакомительный характер. Информация не содержит описания всех рисков, присущих инвестированию на рынке ценных бумаг, равно как в информации не принимаются во внимание личные инвестиционные цели, финансовые условия или нужды каждого конкретного инвестора. Информация не является какого-либо рода офертой, не подразумевалась в качестве оферты или приглашения делать оферты, не является прогнозом событий, инвестиционным анализом или профессиональным советом, не имеет целью рекламу, размещение или публичное предложение любых ценных бумаг, продуктов или услуг, если прямо не предусматривается иное. Настоящее сообщение не является призывом к отказу от приобретения услуг/продуктов иных финансовых организаций, банков, прочих организаций и учреждений и не преследует цели формирования негативной деловой репутации иных финансовых организаций, банков, прочих организаций и учреждений, и их продуктов. Любые оценки и/или сведения, касающиеся деятельности иных финансовых организаций, банков, прочих организаций и учреждений, выражают субъективную оценку ситуации в соответствии с информацией, легально полученной и доступной на момент подготовки настоящего сообщения. Не является индивидуальной инвестиционной рекомендацией. Упоминаемые финансовые инструменты могут не подходить соответствующему клиенту. Предполагаемое отдельными инвестиционными стратегиями в рамках деятельности по доверительному управлению ценными бумагами размещение активов в ценные бумаги, предназначенные для профессиональных клиентов или рыночных контрагентов, в том числе в ценные бумаги иностранных эмитентов, не допущенных к обращению на биржах, а также иностранные финансовые инструменты, не квалифицированные в качестве ценных бумаг в соответствии с Актами МФЦА возможно исключительно в случаях, если клиент признан профессиональным клиентом или рыночным контрагентом в соответствии с Правилами ведения бизнеса МФЦА. Прежде чем приобрести инвестиционный продукт, следует внимательно ознакомиться с повышенными рисками, связанными с финансовыми инструментами, с ограничениями, установленными Актами МФЦА в отношении финансовых инструментов, предназначенных для профессиональных клиентов или рыночных контрагентов, и особенностями оказания услуг квалифицированным профессиональным клиентам или рыночным контрагентам. Налогоплательщик обязан осуществлять выплату налогов в соответствие с применимой юрисдикцией.
За определенный вид финансовых услуг, Компания может начислять комиссии. С подробной информацией о размерах и условиях комиссионных сборов можно ознакомиться самостоятельно через корпоративный сайт компании или получить полную информацию от представителей Компании.

Ответственность за содержание и достоверность материалов третьих лиц, в том числе, но не ограничиваясь, новостных, аналитических, несут источники материалов. Информация для получателей финансовых услуг и клиентов: https://abylaigs.kz/disclosure