DeepSeek: китайська компанія шокувала світ ШІ
30 січня 2025 р.Китайська компанія DeepSeek представила свою новітню модель штучного інтелекту (ШІ) минулого тижня. За оцінкою виробника, вона може конкурувати з ChatGPT, продуктом провідного американського розробника OpenAI. При цьому китайцям розробка обійшлася набагато дешевше й вона використовує набагато менше дорогих чипів Nvidia.
Вихід на ринок моделі DeepSeek-R1 призвів до падіння курсів акцій американських технологічних компаній, що спеціалізуються на штучному інтелекті. Особливо постраждали акції виробника графічних процесорів Nvidia, що втратили під час торгів 27 січня 17 відсотків, внаслідок чого ринкова вартість компанії впала на 600 мільярдів доларів.
ChatGPT і його конкурент з DeepSeek - це так звані чат-боти, з якими можуть спілкуватися користувачі. Вони засновані на великих мовних моделях (LLM), які обробляють величезні обсяги даних, тому для навчання моделей необхідні потужні чіпи.
ШІ з відкритим кодом
Всупереч назві, американська компанія OpenAI зберігає в секреті принцип роботи ChatGPT, тоді як код китайського конкурента є загальнодоступним. DeepSeek докладно розповів, як було розроблено модель, і відкрив бюджет, який становить невелику частину того, що американські творці ШІ витрачають для досягнення тієї ж продуктивності.
Усе це змусило інвесторів у Кремнієвій долині засумніватися у виправданості високої вартості акцій американських компаній, пов'язаних із ШІ. За останні два роки курси їхніх акцій злетіли, тож нещодавній успіх конкурента з КНР і став причиною обвалу на біржі 27 січня. Примітно, що обвал стався одночасно з появою новини про те, що застосунок DeepSeek обігнав свого конкурента ChatGPT за кількістю завантажень в Apple App Store і тепер є там найпопулярнішим безкоштовним застосунком.
Китай дедалі більше конкурує зі США
Інформація, яку фірма DeepSeek надала про свою модель ШІ, похитнула фундаментальні уявлення про розробку таких моделей і наочно показала, що Китай дедалі більше здатний конкурувати зі США в галузі штучного інтелекту.
DeepSeek є лідером у галузі ШІ в Китаї, розповіла DW Анджела Чжан, професорка права в Університеті Південної Каліфорнії та авторка книги про китайську технологічну індустрію. Однак, за її словами, "є щонайменше чотири китайські компанії, які стверджують, що розробили моделі штучного інтелекту, здатні змагатися з американськими конкурентами з Кремнієвої долини". "DeepSeek - не виняток, а, скоріше, свідчення розвиненості всієї індустрії штучного інтелекту в Китаї", - вважає експертка.
Вартість розробки DeepSeek викликає питання
Річард Віндзор, технічний аналітик і засновник британської дослідницької фірми Radio Free Mobile, не сумнівається, що модель DeepSeek дійсно є настільки просунутою, наскільки стверджує виробник. "Це реально. Якби вони не випустили її повністю з відкритим вихідним кодом, було б набагато більше сумнівів у її продуктивності", - сказав Віндзор у розмові з DW.
Примітно, що компанія DeepSeek змогла домогтися прориву попри те, що Вашингтон заборонив Nvidia експортувати новітні чіпи в Китай. DeepSeek стверджує, що розробила свою модель тільки з використанням чипів Nvidia H800 і не використовувала найпотужніші на даний момент чипи H100. За словами Чжан, експортні обмеження означають "дуже важкі часи" для китайських компаній. Але вони також створили "стимули для інновацій" у КНР.
Однак Річард Віндзор сумнівається в інформації DeepSeek про вартість розробки. Компанія стверджує, що загалом використовувала трохи більше ніж 2000 чипів Nvidia H800. Таким чином, витрати на навчання поточної моделі становили б лише 5,6 мільйона доларів. "Це більш ніж на 95 відсотків дешевше, ніж OpenAI", - зазначив Віндзор, зазначивши, що йому невідомо, яку підтримку отримала компанія від влади Китаю. Зокрема, це могли бути компенсації витрат на електроенергію, заробітну плату або навіть на навчання моделі ШІ.
Цікаво також, що дата публікації подробиць про останню модель DeepSeek припала на день інавгурації президента США Дональда Трампа. Це передбачає певну політичну мотивацію з китайського боку, вважає Віндзор. Лян Веньфен, засновник DeepSeek, зараз є чимось на кшталт національного героя в КНР. Минулого тижня він був єдиним керівником компаній, що займаються розробкою ШІ, якого разом з іншими підприємцями запросили на зустріч із прем'єр-міністром Китаю Лі Цяном.
Наскільки DeepSeek пов'язаний із державою?
DeepSeek виник на основі дослідницького проєкту хедж-фонду High Flyer. Фонд засновано 2016 року Ляном Веньфеном, якого з часом дедалі більше стали захоплювати дослідження алгоритмів штучного інтелекту. У 2023 році проєкт було перейменовано на DeepSeek.
Анджела Чжан пояснює значну частину успіху DeepSeek тим фактом, що виробник не керувався суто комерційними цілями. Вона не вірить, що фірма мала тісні зв'язки з китайською державою. "Справжні інновації в Китаї походять від приватного сектора, а не від держави, - каже вона. - Якщо уряд щось фінансує, я очікую, що проєкт, швидше, зазнає невдачі. Але, звісно, DeepSeek зараз перебуває в полі зору китайської влади, враховуючи його величезний, неймовірний успіх".
Прорив компанії в галузі штучного інтелекту означає, що в галузі може виникнути новий глобальний гравець. Технологічний аналітик Річард Віндзор наразі бачить велику невизначеність щодо того, як розвиток DeepSeek вплине на ринок. На його думку, тепер інші компанії можуть спробувати скопіювати методи DeepSeek. Якщо їм це вдасться, навчання систем штучного інтелекту може стати дешевшим.
"Основне питання полягає в тому, чи призведе це до різкого збільшення кількості навчених систем ШІ, якщо врахувати, що тепер їхнє навчання стане набагато дешевшим. І, можливо, досі всі переоцінювали потребу в центрах обробки даних (для роботи ШІ. - Ред.)?" - зазначає Віндзор.
Читайте також: Чи варто боятися штучного інтелекту?