Альфа-Банк создал единую платформу для всех ИИ-сервисов банка

32

Альфа-Банк первым на рынке запустил GPUaaS (GPU-as-a-Service) в multi-cloud режиме с поддержкой GPUDirect и применением сетевой сегментации для высокоскоростных сетей Infiniband в среде Kubernetes на базе собственных инженерных решений. Платформа была реализована за три месяца и объединила собственные и облачные вычислительные ресурсы банка в единую управляемую систему. GPUaaS стал технологическим фундаментом для GenAI-сервисов всего банка и обеспечивает высокий уровень ИТ-сопровождения и развития инфраструктуры, сообщается на сайте банка.

 

Решение отвечает на стремительное развитие генеративного ИИ, который становится ключевым драйвером развития рынка и бизнеса. Рост количества ИИ-агентов и интеллектуальных сервисов требует всё больших вычислительных ресурсов и более гибкого управления ими.  Запуск платформы позволил перейти от точечных внедрений к централизованной модели использования ИИ-инфраструктуры. Теперь бизнес-подразделения получают доступ к генеративному ИИ как к сервису — без необходимости закупать оборудование под каждый отдельный проект.

 

Платформа позволяет:

— запускать новые ИИ-сервисы без отдельных технических закупок;

— централизованно и более эффективно использовать вычислительные ресурсы;

— гибко распределять мощности между командами в зависимости от приоритетов и нагрузки;

— обеспечивать стабильную работу ИИ-сервисов при масштабировании.

 

На базе GPUaaS уже работают корпоративная ГенИИ-платформа AlfaGen, сервис Alfa AI, инвестиционные ИИ-агенты, агенты клиентской поддержки, а также ИИ-агенты для повышения эффективности разработки, включая автотестирование и проверку кода. Платформа построена на собственных разработках банка и Open Source-решениях. Это обеспечивает технологическую независимость, высокую производительность при работе с большими языковыми моделями и позволяет гибко масштабировать ИИ-сервисы для разных команд и бизнес-задач.

 

Подобные инфраструктурные решения с использованием микросервисов и высокоскоростных сетей Infiniband, технологии передачи данных между вычислительными узлами с минимальной задержкой, ранее не были представлены на российском рынке. Платформа была создана с нуля на основе собственных разработок и Open Source-технологий.

 

Источник: RFinance

ПОДЕЛИСЬ С ДРУЗЬЯМИ: