Генеральний директор IBM Арвінд Крішна не вірить, що сучасний штучний інтелект (AI) знаходиться на чіткому шляху до створення штучного загального інтелекту (AGI). Незважаючи на багату історію IBM в обчислювальній техніці — від основоположних технологій 20-го століття до недавнього суперкомп’ютера Watson — Крішна визнає минулі помилки та пояснює, чому нинішній перехід до генеративного штучного інтелекту одночасно багатообіцяючий і принципово інший.
Еволюція ШІ в IBM
Протягом десятиліть IBM була ключовим гравцем у дослідженнях ШІ. Перемога Вотсона в телевізійному шоу Jeopardy! у 2011 році продемонструвала перші можливості обробки природної мови, але Крішна визнає, що звернення Вотсона до медичного закладу занадто рано було «недоречним». Початковий підхід був занадто монолітним; інженери прагнули до модульності та можливості налаштування.
Ключовою відмінністю зараз є перехід від спеціалізованих моделей глибокого навчання, які вимагали величезних, позначених наборів даних і постійного перенавчання, до великих мовних моделей (LLM). Магістратури LLM використовують сиру обчислювальну потужність, щоб досягти 100-кратного покращення швидкості, налаштування та можливості розгортання.
Поворотний момент LLM
Незважаючи на те, що Google започаткував деякі основні технології LLM (наприклад, «Увага — це все, що вам потрібно»), поворот галузі до LLM став визначальним моментом. Крішна зазначає, що LLM зменшує потребу в постійній ручній розмітці, що робить їх значно більш масштабованими та адаптованими.
Цей перехід не обходиться без витрат. Інфраструктура для LLM вимагає величезних інвестицій у графічні процесори (GPU) і центри обробки даних, і повернення інвестицій не гарантується. Однак Крішна вважає, що досягнення в області напівпровідників і альтернативних архітектур (наприклад, від Groq і Cerebras) дозволять знизити витрати протягом наступних п’яти років.
За межами LLM: Ставки на квантові обчислення
Незважаючи на нинішній ажіотаж навколо LLM, Крішна підкреслює, що це не «кінцева точка». IBM продовжує інвестувати значні кошти в квантові обчислення, визнаючи, що LLM є лише одним із кроків у довшій технологічній еволюції. Квантові обчислення залишаються довгостроковою ставкою, але Крішна вірить, що вони тримають ключ до вирішення проблем, недосяжних для класичного ШІ.
Зрештою, IBM позиціонує себе для майбутнього, в якому штучний інтелект – це не просто швидші обчислення, а принципово нові можливості.
Перехід дорогий і невизначений, але Крішна впевнений, що IBM не залишиться позаду.
