Генеральний директор IBM про те, чому сучасний ШІ далекий від AGI

1

Генеральний директор IBM Арвінд Крішна не вірить, що сучасний штучний інтелект (AI) знаходиться на чіткому шляху до створення штучного загального інтелекту (AGI). Незважаючи на багату історію IBM в обчислювальній техніці — від основоположних технологій 20-го століття до недавнього суперкомп’ютера Watson — Крішна визнає минулі помилки та пояснює, чому нинішній перехід до генеративного штучного інтелекту одночасно багатообіцяючий і принципово інший.

Еволюція ШІ в IBM

Протягом десятиліть IBM була ключовим гравцем у дослідженнях ШІ. Перемога Вотсона в телевізійному шоу Jeopardy! у 2011 році продемонструвала перші можливості обробки природної мови, але Крішна визнає, що звернення Вотсона до медичного закладу занадто рано було «недоречним». Початковий підхід був занадто монолітним; інженери прагнули до модульності та можливості налаштування.

Ключовою відмінністю зараз є перехід від спеціалізованих моделей глибокого навчання, які вимагали величезних, позначених наборів даних і постійного перенавчання, до великих мовних моделей (LLM). Магістратури LLM використовують сиру обчислювальну потужність, щоб досягти 100-кратного покращення швидкості, налаштування та можливості розгортання.

Поворотний момент LLM

Незважаючи на те, що Google започаткував деякі основні технології LLM (наприклад, «Увага — це все, що вам потрібно»), поворот галузі до LLM став визначальним моментом. Крішна зазначає, що LLM зменшує потребу в постійній ручній розмітці, що робить їх значно більш масштабованими та адаптованими.

Цей перехід не обходиться без витрат. Інфраструктура для LLM вимагає величезних інвестицій у графічні процесори (GPU) і центри обробки даних, і повернення інвестицій не гарантується. Однак Крішна вважає, що досягнення в області напівпровідників і альтернативних архітектур (наприклад, від Groq і Cerebras) дозволять знизити витрати протягом наступних п’яти років.

За межами LLM: Ставки на квантові обчислення

Незважаючи на нинішній ажіотаж навколо LLM, Крішна підкреслює, що це не «кінцева точка». IBM продовжує інвестувати значні кошти в квантові обчислення, визнаючи, що LLM є лише одним із кроків у довшій технологічній еволюції. Квантові обчислення залишаються довгостроковою ставкою, але Крішна вірить, що вони тримають ключ до вирішення проблем, недосяжних для класичного ШІ.

Зрештою, IBM позиціонує себе для майбутнього, в якому штучний інтелект – це не просто швидші обчислення, а принципово нові можливості.

Перехід дорогий і невизначений, але Крішна впевнений, що IBM не залишиться позаду.