Внедрение AI-технологий в различные сферы бизнеса в корне меняет бизнес-процессы и целые отрасли. Какие тренды генеративного искусственного интеллекта (GenAI) существуют в различных областях и какие дальнейшие вызовы стоят перед нами? Почему важно понимать человека и как в этом поможет AI? Как создавать качественные и эффективные сервисы с AI? Как большие языковые модели (LLM) повышают продуктивность сотрудников? Насколько важна регуляторика на быстрорастущем рынке AI-технологий? Об этом шла речь на треке «AI Journey: путешествие в мир искусственного интеллекта» на ICTWEEK в Ташкенте, участие в котором приняли эксперты Сбера, Института AIRI и группы компаний ЦРТ, сообщается на сайте банка.
Денис Димитров, управляющий директор по исследованию данных Сбербанка и руководитель научной группы Sber AI Research, рассказал о трендах и вызовах GenAI, а также о том, как мир движется к построению общего искусственного интеллекта. Сегодня в центре внимания исследователей – генеративные модели, работающие с разными типами данных: это и языковые модели, способные поддерживать полноценный текстовый диалог с пользователем, и мультимодальные модели, способные анализировать изображения, видео, звуки и отвечать на разнообразные вопросы, а также модели, которые генерируют изображения, аудио и даже полноценные видеоролики. Эксперт на примере AI-сервисов Kandinsky, GigaChat и OmniFusion объяснил, чему уже научились генеративные модели, какие типы данных эти модели научились понимать и генерировать и как такие разработки помогают нам приблизиться к созданию AGI.
Евгений Фролов, руководитель группы Personalization Technologies Института AIRI, раскрыл тему применения больших языковых моделей (LLM) в задаче генерации кода и привёл аналогии с рекомендательными системами. Он объяснил, что хуже всего такие языковые рекомендательные AI-системы работают в тех доменах, где текст не играет главенствующую роль. Это может сильно ограничивать их предсказательную силу и вести к нежелательным артефактам, таким как галлюцинации модели, когда она выдаёт правдоподобный, но выдуманный ответ, не имея конкретных знаний. Для решения проблемы эксперт предложил использовать дополнительные RAG-системы с применением абстрактных представлений кода и объединить все три составляющие — LLM, рекомендательную систему и RAG — в единую архитектуру. По словам эксперта, компоненты, позволяющие достичь этой цели, уже существуют. Вопрос в том, как их правильно объединить.
Эльвира Чаче, исполнительный директор Центра человекоцентричного AI Сбербанка, представила обзорный доклад о регулировании искусственного интеллекта в различных странах. Сейчас мир находится в поисках эффективного регулирования, которое позволило бы развивать AI-технологии и одновременно учитывать интересы всех сторон. В 2024 году ООН были опубликованы две важнейших Резолюции международного уровня в сфере AI, а также резолюция, подчеркивающая важность укрепления международного сотрудничества в области наращивания потенциала AI. Вместе с тем Совет Европы принял Рамочную конвенцию — первый в истории международный договор, направленный на защиту прав человека в эпоху AI. Страны Содружества Независимых Государств (СНГ) подготовили концепцию модельного закона об AI, предусматривающего создание благоприятных правовых условий для развития искусственного интеллекта.
Спикер считает, что в регулировании есть три подхода: консервативный, гибридный и проинновационный. При этом в любой стране регуляторы сталкиваются с одними и теми же вопросами: рекомендательные технологии, дипфейки, GenAI, ответственность разработчиков, правосубъектность искусственного интеллекта, доступ к данным, права на сгенерированный контент и так далее. По мнению спикера, в основе эффективного регулирования должны лежать стратегические документы, которые определяют общее направление деятельности страны, и экспериментальные правовые режимы («песочницы»), в которых разработчики могут экспериментировать с новыми технологиями. Также необходима стандартизация (технические требования к AI-системам) и этика (когда разработчики добровольно берут на себя те или иные обязательства). Здесь важно найти компромисс между разработчиками, государством и обществом.
Михаил Войтко, исполнительный директор дивизиона B2C продуктов и технологических сервисов Салют Сбербанка, и Герман Михайлов, руководитель направления по работе с финансовыми институтами группы компаний ЦРТ, описали ход развития LLM в России и в мире: исследования, подходы и её применение в бизнесе.
Михаил Войтко рассказал, что нейросетевую модель Сбера используют как физические, так и юридические лица (причём модель можно установить в закрытом контуре компании). Чаще всего она используется для генерации текстов и заголовков в рекламе, перефразирования текста и сравнения текстов (например, договоров). Герман Михайлов отметил, что группа ЦРТ уже создала спектр решений на основе GigaChat. Более 30 лет опыта во внедрении AI-решений в крупном бизнесе позволяют компании реализовывать проекты по адаптации модели к контексту заказчика, дообучению на корпоративных данных, что закрывает любые потребности бизнеса.
Владимир Попов, исполнительный директор Лаборатории блокчейн Сбербанка, выступил с докладом «Децентрализованные ID: аутентификация без посредников». В нём он обобщил существующие проблемы с сервисами идентификации (риски утечки и отслеживания, сильная зависимость от ключевых провайдеров), проанализировал актуальные тренды по разрешению этих проблем, а также описал текущие и будущие прототипы и исследования Сбера в этой области.