Після того, як презентація DeepSeek-R1 20 січня спричинила різке падіння цін на акції виробника мікросхем Nvidia та різке падіння інших технологічних компаній, деякі спостерігачі негайно оголосили цю подію «моментом Sputnik» у китайсько-американській гонці за першість у штучному інтелекті (ШІ). Хоча американська галузь штучного інтелекту явно потребувала перебудови, ця подія викликає складні питання.
Американські технологічні компанії вкладають величезні гроші в штучний інтелект. Згідно з оцінками Goldman Sachs, «мегатехнологічні фірми, корпорації та енергетичні компанії витратять близько 1 трильйона доларів на капітальні інвестиції, пов’язані з ШІ, у найближчі роки». Однак багато спостерігачів (включаючи мене) давно сумніваються в правильності напряму інвестицій і розвитку штучного інтелекту в США.
Усі провідні компанії мають по суті однакову стратегію (хоча Meta дещо виділялася, вибравши модель із частково відкритим кодом), що змусило всю галузь покладатися на єдиний підхід. Американські технологічні фірми без винятку одержимі масштабом. Посилаючись на ще не доведений «закон масштабування», вони вважають, що збільшення обсягу даних і обчислювальної потужності в їхніх моделях є ключем до відкриття нових, величезних можливостей. Вони навіть стверджують, що «масштабування — це все, що вам потрібно».
До 20 січня американські компанії не бажали розглядати альтернативи своїм основним моделям, які попередньо навчалися на величезних наборах даних, щоб передбачити наступне слово в рядку. Після встановлення пріоритетів вони зосередилися майже виключно на дифузійних моделях і чат-ботах, призначених для виконання людських (або схожих на людину) завдань. Підходи DeepSeek багато в чому схожі, але, здається, компанія більш активно використовує такі методи, як «навчання з підкріпленням», «суміш експертів» (з використанням кількох менших, але більш ефективних моделей), уточнення («дистиляція») і тонке налаштування «процесу міркування (ланцюжка)». Як повідомляється, ця стратегія дозволила йому розробити конкурентоспроможну модель за значно нижчою ціною.
Хоча точаться дискусії про те, чи DeepSeek розповів нам усе, ця подія оголила проблему «групового мислення» в американській індустрії ШІ. Сліпе ігнорування альтернативних, дешевших і перспективніших підходів у поєднанні з ажіотажем у ЗМІ — це саме те, що ми з Саймоном Джонсоном передбачили в книзі «Сила і прогрес», написаній перед початком ери генеративного штучного інтелекту. Тепер виникає питання – чи є в американській індустрії ШІ ще більш небезпечні «сліпі плями»? Наприклад, чи втрачають провідні американські технологічні компанії можливість спрямувати свої моделі в більш «гуманне» русло? Я підозрюю, що відповідь «так», але час покаже.
Є й друге, ще більш важливе питання: чи почав Китай обганяти Америку? Якщо так, то чи означає це, що авторитетні структури управління «зверху донизу» (які ми з Джеймсом Робінсоном назвали «екстрактивними інституціями») можуть бути такими ж хорошими чи навіть кращими, ніж домовленості «знизу вверх» у стимулюванні інновацій?
Я схильний вірити, що контроль зверху уповільнює інновації (як ми з Джеймсом Робінсоном стверджували в книзі «Чому нації зазнають краху»). Хоча успіх DeepSeek, здається, заперечує це твердження, він не є переконливим доказом того, що інновації під контролем інституцій видобутку можуть бути такими ж потужними чи тривалими, як у системах з інклюзивними інституціями. Крім того, DeepSeek базується на багаторічному прогресі в США та Європі. Всі основні методи спочатку були розроблені в США. «Експертна суміш» і «навчання з підкріпленням» виникли в науково-дослідних інститутах десятиліття тому, тоді як великі американські технологічні компанії першими запровадили «модельний трансформатор», «ланцюжок міркувань» і «дистиляцію».
Те, що DeepSeek продемонстрував, — це інженерна досконалість — йому вдалося поєднати ті самі методи ефективніше, ніж це зробили американські компанії. Однак ще невідомо, чи вдасться китайським компаніям і дослідницьким інститутам зробити наступний крок і розробити власні революційні методи, продукти та підходи.
Крім того, DeepSeek явно не є типовою китайською компанією штучного інтелекту. Більшість інших китайських компаній штучного інтелекту розробляють технології для уряду або з державним фінансуванням. Проте DeepSeek виник із хедж-фонду та успішно працював непомітно. Але чи зможе він зберегти свою креативність і динамізм тепер, коли він у центрі уваги? Що б не сталося, успіх однієї компанії не можна вважати переконливим доказом того, що Китай може перемогти більш відкриті суспільства в інноваціях.
Існує також геополітичне питання: чи означає справа DeepSeek, що заходи експортного контролю США та інші стратегії обмеження китайських проектів ШІ зазнали невдачі? Тут відповідь теж не зовсім зрозуміла. DeepSeek навчив свої нові моделі (V3 і R1) на старих, менш потужних чіпах, але для подальшого прогресу та масштабування йому можуть знадобитися найпотужніші чіпи.
Однак очевидно, що американський підхід, заснований на грі з нульовою сумою, не працює. Така стратегія мала б сенс, лише якщо б ми були впевнені, що наближаємось до створення загального штучного інтелекту — моделей, які могли б конкурувати з людьми в будь-якому пізнавальному завданні — і що той, хто розробить його першим, матиме величезну геополітичну перевагу. Дотримуючись цих припущень (жодне з яких не підтверджено), США відмовилися від плідної співпраці з Китаєм у багатьох сферах. Наприклад, якщо одна з країн розробляє моделі, які підвищують продуктивність людини або допомагають регулювати енергетичний сектор, такі інновації будуть вигідні обом країнам, особливо якщо їх широко застосовувати.
Як і його американські аналоги, DeepSeek прагне створити штучний інтелект загального призначення (AGI), тому розробка моделі, навчання якої значно дешевше, здається важливою віхою. Однак скорочення витрат на розробку за допомогою вже відомих методів не призведе нас магічним чином до появи AGI в найближчі кілька років. Питання в тому, чи можливе створення AGI найближчим часом. Ще більш суперечливим є те, чи це взагалі бажано.
Хоча ми ще не знаємо всіх подробиць того, як DeepSeek розробляв свої моделі, і ми не розуміємо значення його очевидного успіху для майбутнього індустрії штучного інтелекту, ясно одне: через китайського новачка одержимість технологічного сектора масштабом тепер кидається виклик і може навіть змусити їх вийти із зони комфорту.
Автор – лауреат Нобелівської премії з економіки 2024 року; є професором економіки в Массачусетському технологічному інституті (MIT)
Copyright: Project Syndicate, 2025. (переклад: NR)
Бонусне відео: