Dyrektor generalny IBM o tym, dlaczego nowoczesna sztuczna inteligencja jest daleka od AGI

6

Dyrektor generalny IBM, Arvind Krishna, nie wierzy, że współczesna sztuczna inteligencja (AI) jest na dobrej drodze do stworzenia sztucznej inteligencji ogólnej (AGI). Pomimo bogatej historii IBM w dziedzinie informatyki – od podstawowych technologii XX wieku po najnowszy superkomputer Watson – Krishna przyznaje się do błędów z przeszłości i wyjaśnia, dlaczego obecne przejście na generatywną sztuczną inteligencję jest zarówno obiecujące, jak i zasadniczo odmienne.

Ewolucja sztucznej inteligencji w IBM

Od dziesięcioleci IBM jest kluczowym graczem w badaniach nad sztuczną inteligencją. Zwycięstwo Watsona w programie telewizyjnym Jeopardy! w 2011 roku pokazało wczesne możliwości przetwarzania języka naturalnego, ale Krishna przyznaje, że zbyt wczesne skierowanie Watsona do służby zdrowia było „niewłaściwe”. Oryginalne podejście było zbyt monolityczne; inżynierowie dążyli do modułowości i możliwości dostosowania.

Kluczową różnicą jest obecnie przejście od wyspecjalizowanych modeli głębokiego uczenia się, które wymagały ogromnych, oznakowanych zbiorów danych i ciągłego przekwalifikowywania, na rzecz dużych modeli językowych (LLM). LLM wykorzystują surową moc obliczeniową, aby osiągnąć 100-krotną poprawę szybkości, dostosowywania i możliwości wdrażania.

Punkt zwrotny LLM

Choć Google był pionierem w zakresie niektórych podstawowych technologii LLM (np. „wystarczy uwaga”), zwrot branży w kierunku LLM był decydującym momentem. Krishna zauważa, że ​​LLM zmniejszają potrzebę ciągłego ręcznego oznaczania, dzięki czemu są znacznie bardziej skalowalne i elastyczne.

To przejście nie jest pozbawione kosztów. Infrastruktura dla LLM wymaga ogromnych inwestycji w procesory graficzne (GPU) i centra danych, a zwrot z inwestycji nie jest gwarantowany. Jednak Krishna wierzy, że postęp w półprzewodnikach i alternatywnych architekturach (takich jak te firm Groq i Cerebras) obniży koszty w ciągu najbliższych pięciu lat.

Poza LLM: zakłady na obliczenia kwantowe

Pomimo obecnego szumu wokół LLM, Kryszna podkreśla, że nie jest to „punkt końcowy”. IBM w dalszym ciągu intensywnie inwestuje w obliczenia kwantowe, uznając, że LLM to tylko jeden krok w dłuższej ewolucji technologicznej. Obliczenia kwantowe pozostają rozwiązaniem długoterminowym, ale Kryszna wierzy, że stanowią one klucz do rozwiązywania problemów wykraczających poza zasięg klasycznej sztucznej inteligencji.

Ostatecznie IBM przygotowuje się na przyszłość, w której sztuczna inteligencja to nie tylko szybsze przetwarzanie, ale także zasadniczo nowe możliwości.

Przejście jest kosztowne i niepewne, ale Kryszna ma pewność, że IBM nie pozostanie w tyle.