Крупнейшие маркетплейсы используют AI, чтобы создавать инновационные решения, автоматизировать рутину и выполнять сложную аналитику. Для этого используются, в частности, большие языковые модели (LLM).
Этот кейс — о том, как облачный провайдер Cloud.ru поддержал выход Wildberries на новый рынок.
Задачи: зачем Wildberries понадобилось внедрять AI
По итогам 2024 года, Wildberries — крупнейший маркетплейс в России. Доля компании в доле всех маркетплейсов страны — 47%, во всем сегменте e-com — 33%. Для сравнения, доля ближайшего конкурента Wildberries — 24%.
Маркетплейс доставляет товары в несколько стран, в том числе Беларусь, Казахстан, Армению, Израиль, а с октября 2024 года — запустил продажи на одном из новых рынков. Чтобы выйти на него, Wildberries было нужно оперативно решить несколько задач:
1. Закончить обучение русскоязычной LLM, запустить модель на закрытом GPU-кластере.
2. Сделать автоматический перевод карточек товаров с русского на местный и английский языки.
3. Разработать классификатор товаров по кодам Товарной номенклатуры внешнеэкономической деятельности (ТН ВЭД). Этот классификатор используется при оформлении товаров на таможне.
4. Протестировать собственные гипотезы, на их основе — выстроить прогнозы.
В качестве инструмента, которому предстояло решить эти задачи, компания выбрала LLM и графические процессоры (GPU) из облака Cloud.ru.
Почему Wildberries запустил LLM в облаке
Чтобы обучить большие языковые модели, нужно много ресурсов и дорогого дефицитного оборудования. Выгоднее и проще — сотрудничать с компаниями, которые работают в сфере AI, LLM и машинного обучения (ML).
Cloud.ru предоставил в аренду инфраструктуру с GPU, вычислительные мощности и сервисы для машинного обучения. Также у Wildberries был выбор между разными моделями и конфигурациями графических процессоров.
Кроме этого, при аренде оборудования можно платить по принципу pay-as-you-go. Если закупать свою инфраструктуру, придется рассчитаться за все ресурсы — даже те, которые в данный момент не используются. При аренде мощностей у провайдера клиент платит только за те ресурсы, которые использовал по факту.
Результаты: как языковые модели решили задачи маркетплейса
Предварительно Wildberries обучил свои языковые модели на GPU в облаке Cloud.ru. Такое решение оптимизировало затраты, так как не пришлось разворачивать LLM в собственной инфраструктуре и тратиться на ее обслуживание.
С помощью модели IT-команда маркетплейса получила инструмент, с которым смогла быстро решить задачи, важные для выхода на новый рынок.
Автоперевод карточек товаров и отзывов на местный и английский
Сложность заключалась в том, что местный язык распространен меньше английского, а в описаниях товаров на местном языке есть терминологические и стилистические особенности. Чтобы решить эту проблему, модель дообучили на специфическом корпусе текстов на местном. По расчетам, это обошлось дешевле, чем пришлось бы заплатить за готовый сторонний сервис.
Благодаря этому Wildberries смог автоматически переводить описания товаров, их названия и отзывы сразу на два языка.
Дообучение и запуск русскоязычной LLM
Требовалось, чтобы большая языковая модель самостоятельно размечала данные, которые бы потом использовались для обучения более простых моделей. Такой подход был применен при разработке классификатора кодов ТН ВЭД.
В итоге маркетплейс с помощью LLM разработал классификатор. Для дообучения команда Cloud.ru дала доступ к большой языковой модели — это ускорило процесс, повысило точность других моделей.
Автоматизация выбора кода ТН ВЭД
Если продавать товары за границу, то каждому товару надо присвоить таможенный код. Продавцы часто ошибаются, неверно выбирают последовательность цифр. Из-за этого приходится выплачивать штрафы и терпеть убытки из-за нереализованного товара.
Ошибиться в присвоении кода легко. В классификаторе — более десяти тысяч категорий, и все они распределены по четырехуровневой иерархии. Чтобы упростить этот процесс, Wildberries «поручили» его отдельной языковой модели.
Команда маркетплейса с помощью LLM самостоятельно разметила данные, которые потом использовала для обучения модели попроще. Это понадобилось для экономии ресурсов: модель, которая определяет коды ТН ВЭД для товаров, работает на обычных процессорах (CPU), в то время как LLM — на мощных GPU.
Тестирование гипотез и выстраивание прогнозов
Облачные решения помогли оптимизировать ресурсы, которые тратились на выдвижение и проверку гипотез. Cloud.ru быстро предоставлял вычислительные мощности, а Wildberris не пришлось закупать дополнительное оборудование. В результате дата-сайентисты смогли быстрее проверять предположения и делать точные прогнозы.
Итого: как работа с облаком помогла Wildberries
Благодаря мощным GPU-ресурсам от Cloud.ru у маркетплейса появилась эластичная инфраструктура. Команда Wildberries использовала эту инфраструктуру для глубокого машинного обучения (Deep Learning), автоматизации множества задач и экономии ресурсов при построении гипотез.
Благодаря AI у Wildberries существенно сократился time to market. Увеличенная скорость разработок и развертывания продуктов позволили быстрее выйти на международный рынок.
«Оценивая эффект от оптимизации с помощью GPU, мы отслеживаем влияние на показатель общего объема оборота товаров, или GMV, просчитывая его в случае каждой решаемой задачи. Такого рода метрики — часть KPI нашей ML-команды. Если говорить о GPU-ресурсах, то сотрудничество с лидирующим облачным провайдером Cloud.ru помогает нам сделать так, чтобы ML-команда могла эффективно реализовать сразу несколько приоритетных проектов и сбалансированно подойти к распределению нагрузки, используя и собственные ресурсы, и сторонние» — Николай Устинов руководитель ML-команды в Wildberries.
«Наш пилотный проект наглядно демонстрирует, как облачные услуги помогают в развитии бизнеса крупнейшему российскому маркетплейсу. Изначально придерживаясь стратегии in-house first в построении IT-инфраструктуры, Wildberries в отдельных случаях использует внешние GPU-ресурсы. В условиях быстро меняющегося рынка и растущих требований к вычислительным мощностям в компании приняли решение выйти за рамки данной стратегии.
В постоянном контакте с командой клиента мы подбираем оптимальные облачные и AI-решения, которые помогают маркетплейсу адаптироваться к рыночным вызовам, реализовывать инновационный потенциал и конкурировать с ведущими мировыми eCom-компаниями. Сотрудничество Wildberries и Cloud.ru закладывает фундамент для будущих проектов, результаты которых охватят десятки миллионов пользователей» — Родион Будченко руководитель направления «Ритейл» в Cloud.ru.