Dyrektor generalny IBM o tym, dlaczego nowoczesna sztuczna inteligencja jest daleka od AGI

20

Dyrektor generalny IBM, Arvind Krishna, nie wierzy, że współczesna sztuczna inteligencja (AI) jest na dobrej drodze do stworzenia sztucznej inteligencji ogólnej (AGI). Pomimo bogatej historii IBM w dziedzinie informatyki – od podstawowych technologii XX wieku po najnowszy superkomputer Watson – Krishna przyznaje się do błędów z przeszłości i wyjaśnia, dlaczego obecne przejście na generatywną sztuczną inteligencję jest zarówno obiecujące, jak i zasadniczo odmienne.

Ewolucja sztucznej inteligencji w IBM

Od dziesięcioleci IBM jest kluczowym graczem w badaniach nad sztuczną inteligencją. Zwycięstwo Watsona w programie telewizyjnym Jeopardy! w 2011 roku pokazało wczesne możliwości przetwarzania języka naturalnego, ale Krishna przyznaje, że zbyt wczesne skierowanie Watsona do służby zdrowia było „niewłaściwe”. Oryginalne podejście było zbyt monolityczne; inżynierowie dążyli do modułowości i możliwości dostosowania.

Kluczową różnicą jest obecnie przejście od wyspecjalizowanych modeli głębokiego uczenia się, które wymagały ogromnych, oznakowanych zbiorów danych i ciągłego przekwalifikowywania, na rzecz dużych modeli językowych (LLM). LLM wykorzystują surową moc obliczeniową, aby osiągnąć 100-krotną poprawę szybkości, dostosowywania i możliwości wdrażania.

Punkt zwrotny LLM

Choć Google był pionierem w zakresie niektórych podstawowych technologii LLM (np. „wystarczy uwaga”), zwrot branży w kierunku LLM był decydującym momentem. Krishna zauważa, że ​​LLM zmniejszają potrzebę ciągłego ręcznego oznaczania, dzięki czemu są znacznie bardziej skalowalne i elastyczne.

To przejście nie jest pozbawione kosztów. Infrastruktura dla LLM wymaga ogromnych inwestycji w procesory graficzne (GPU) i centra danych, a zwrot z inwestycji nie jest gwarantowany. Jednak Krishna wierzy, że postęp w półprzewodnikach i alternatywnych architekturach (takich jak te firm Groq i Cerebras) obniży koszty w ciągu najbliższych pięciu lat.

Poza LLM: zakłady na obliczenia kwantowe

Pomimo obecnego szumu wokół LLM, Kryszna podkreśla, że nie jest to „punkt końcowy”. IBM w dalszym ciągu intensywnie inwestuje w obliczenia kwantowe, uznając, że LLM to tylko jeden krok w dłuższej ewolucji technologicznej. Obliczenia kwantowe pozostają rozwiązaniem długoterminowym, ale Kryszna wierzy, że stanowią one klucz do rozwiązywania problemów wykraczających poza zasięg klasycznej sztucznej inteligencji.

Ostatecznie IBM przygotowuje się na przyszłość, w której sztuczna inteligencja to nie tylko szybsze przetwarzanie, ale także zasadniczo nowe możliwości.

Przejście jest kosztowne i niepewne, ale Kryszna ma pewność, że IBM nie pozostanie w tyle.