Генеральный директор IBM Арвинд Кришна не считает, что современный искусственный интеллект (ИИ) находится на прямой дорожке к созданию искусственного общего интеллекта (AGI). Несмотря на богатую историю IBM в области вычислений – от основополагающих технологий XX века до недавнего суперкомпьютера Watson – Кришна признает прошлые ошибки и объясняет, почему текущий переход к генеративному ИИ одновременно многообещающий и принципиально иной.
Эволюция ИИ в IBM
На протяжении десятилетий IBM была одним из ключевых игроков в исследованиях ИИ. Победа Watson в 2011 году в телешоу Jeopardy! продемонстрировала ранние возможности обработки естественного языка, но Кришна признает, что слишком раннее внедрение Watson в здравоохранение было «неуместным». Изначальный подход был слишком монолитным; инженеры стремились к модульности и возможности настройки.
Ключевое отличие сейчас заключается в переходе от специализированных моделей глубокого обучения – которым требовались огромные, размеченные наборы данных и постоянная переподготовка – к большим языковым моделям (LLM). LLM используют грубую вычислительную мощность для достижения 100-кратного улучшения в скорости, настройке и возможности развертывания.
Переломный момент LLM
В то время как Google была пионером в некоторых базовых технологиях LLM (например, в работе «Attention is all you need»), поворот индустрии к LLM стал решающим моментом. Кришна отмечает, что LLM снижают потребность в постоянной ручной разметке, что делает их значительно более масштабируемыми и адаптируемыми.
Этот переход не обходится без затрат. Инфраструктура для LLM требует огромных инвестиций в графические процессоры (GPU) и центры обработки данных, а возврат инвестиций не гарантирован. Однако Кришна считает, что достижения в области полупроводников и альтернативные архитектуры (например, от Groq и Cerebras) снизят затраты в течение следующих пяти лет.
За пределами LLM: ставка на квантовые вычисления
Несмотря на текущий ажиотаж вокруг LLM, Кришна подчеркивает, что это не «конечная точка». IBM продолжает активно инвестировать в квантовые вычисления, осознавая, что LLM – это лишь один шаг в более длительной технологической эволюции. Квантовые вычисления остаются долгосрочной ставкой, но Кришна верит, что они содержат ключ к решению проблем, недоступных для классического ИИ.
В конечном итоге IBM позиционирует себя для будущего, в котором ИИ – это не просто более быстрые вычисления, а принципиально новые возможности.
Переход дорог и неопределен, но Кришна уверен, что IBM не останется в стороне.











































































