Революция или эволюция: что за нейросеть DeepSeek, которая обвалила американские рынки?
Китайская нейросеть DeepSeek R1 стала главным событием января. Всего за неделю после выхода она умудрилась обвалить американские фондовые рынки. На Западе говорят о так называемом sputnik moment — по важности релиз сравнивают с запуском первого искусственного спутника в космос в 1957 году. Разбираемся, что такое DeepSeek, почему чат-бот шокировал рынки и действительно ли можно говорить о технологической революции?
Что такое DeepSeek и что она умеет?
DeepSeek — это нейросеть, разработанная одноименной китайской компанией, которой руководит предприниматель Лян Вэньфэн. Фирму основали в мае 2023-го, осенью того же года она выпустила первую версию чат-бота. С тех пор их вышло несколько, последняя — DeepSeek R1 — 20 января. Именно ее релиз «разбомбил» западные рынки.
Как и другие нейросети, R1 отвечает на вопросы, пишет и переводит тексты, ищет информацию и делает много чего другого. По функционалу и мощностям она аналогична последней модели ChatGPT o1 от Open AI.
Поскольку DeepSeek разработали в Китае, у нее есть ограничения на политически чувствительные вопросы. Например, R1 всегда будет отвечать, что Тайвань — это Китай, Винни-Пух не имеет отношения к Си Цзиньпину, а на вопрос, что случилось на площади Тяньманьмэнь в 1989 году, нейросеть предложит поговорить о чем-нибудь другом. ChatGPT, чьим конкурентом называют DeepSeek, меняет ответы в зависимости от задаваемого контекста и точки зрения. Но обо всем по порядку.
Чем DeepSeek отличается от ChatGPT?
С чисто технической точки зрения у R1 есть несколько неоспоримых преимуществ. В отличие от ChatGPT китайский ИИ менее требователен к оборудованию и, как следствие, его дешевле обучать. Для обучения DeepSeek R1 требуется 2000 графических процессоров Nvidia H800, тогда как для ведущих моделей OpenAI надо 16000 аналогичных карт. На ChatGPT o1 компания тратит от $80 до $100 млн. DeepSeek, по утверждениям компании, тратит всего $5,6 млн.
Еще в отличие от ChatGPT у R1 полностью открытый исходный код. ML-разработчик Никита Воронухин в беседе с «Постньюс» отдельно отметил, что его выложили под лицензией MIT.
«Она разрешает копировать код и повторно его использовать в коммерческих проектах. Это означает, что вы можете продавать к ней доступ другим людям сами, либо на ее базе сделать свою нейронку, допилив для некоторых специфичных задач», — пояснил эксперт, добавив, что элементами DeepSeek пользуется, например, нейросеть GigaChat. По его словам, конкретно самой DeepSeek это ничего не дает. Открытый код — это больше игра вдолгую.
Можно ли пользоваться DeepSeek в России?
К нейросети DeepSeek имеет доступ любой человек, она бесплатна. Чтобы воспользоваться чат-ботом, нужно зарегистрироваться на сайте или скачать мобильное приложение. Поскольку исходный код нейросети находится в свободном доступе, R1 даже можно установить на персональный компьютер и пользоваться оффлайн (правда, для этого потребуется мощное устройство).
Россияне имеют такой же доступ к DeepSeek, как и все остальные. Нейросеть поддерживает русский язык, для нее не нужно скачивать сторонние приложения для обхода блокировок, как в случае с ChatGPT.
Зарегистрироваться в DeepSeek из РФ можно с помощью электронной почты. Однако на момент написания материала компания временно приостановила регистрацию новых пользователей из-за кибератак. Те, кто уже создал аккаунт, могут пользоваться нейросетью без ограничений.
Почему DeepSeek обвалила фондовые рынки?
В последние годы считалось, что развитие ИИ тормозит нехватка вычислительных мощностей и энергетический голод. Американские компании развивались «вширь»: закупали оборудование, расширяли дата-центры и даже задумывались над использованием атомной энергетики для их подпитки.
Китайцы же предложили новый подход к развитию искусственного интеллекта, радикально отличающийся от того, которому следовали западные компании. Независимый киберэксперт Дмитрий Борщук в разговоре с «Постньюс» пояснил, что DeepSeek пошла по пути оптимизации.
«Все уходит в оптимизацию кода, процессов, команд и работы… Это история про то, что не нужны серьезные вычислительные мощности. Их можно оптимизировать. А европейские и американские рынки, наоборот, делали ставку на увеличение мощностей, на закупку тех же чипов Nvidia и AMD», — сказал он.
Именно по этой причине и обрушились акции американских технологических корпораций. Nvidia одномоментно потеряла свыше $600 млрд, потому что с распространением модели DeepSeek ее продукция станет менее востребованной. В цене потеряли и энергетические фирмы, чьи проекты, связанные с ИИ, теперь под вопросом.
DeepSeek — это революция?
На Западе релиз DeepSeek сравнивают с запуском первого искусственного спутника в космос, имея в виду, что его появление перекроит всю индустрию ИИ.
Однако Борщук настроен не так оптимистично. По его словам, релиз DeepSeek — это нормальный эволюционный процесс, и в будущем неизбежно появятся новые наработки. В конкуренции выиграет тот, кто «будет делать мощнее, умнее и при этом затрачивая меньше ресурсов».
«Ничего нового в нейролингвистических моделях нет. Какую-то магию DeepSeek не устраивает. Она просто делает то, что и многие до этого, но очень хорошо и потребляя меньше мощности», — убежден он.
С этим мнением отчасти согласен независимый финансовый аналитик Юрий Медушенко — в разговоре с «Постньюс» он назвал появление DeepSeek признаком усиления конкуренции на рынке в рамках грядущей технологической «мини-революции».
«Мы еще увидим разгар этой гонки в ближайшие несколько лет. Сегодня новый конкурент появился, послезавтра еще один будет. [ИИ] — это революционная технология, которая изменит все наше представление о быте», — сказал эксперт.