ML-инженер (GigaChat Data)

  • Москва
  • Постоянная работа
  • Полная занятость
  • 2 мес. назад
Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:
  • Core модели - базовые модели;
  • Продукты B2C - WEB-версия GigaChat, персонализированные интеллектуальные ассистенты и пр.;
  • Внутренние банковские задачи - автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников и пр.;
  • Внешние заказчики - кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы и пр.
Обязанности
  • сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.)
  • улучшение пайплайнов предобработки данных для разметки и обучения
  • работа в плотной связке с командой ML, LoRA-finetuning
  • взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций и пр.)
  • расчет метрик и принятие решений по улучшению качества данных на их основе.
Требования
  • знания Python на очень высоком уровне
  • опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и пр.)
  • понимание процессов работы с данными для больших языковых моделей
  • способность решать проблемы и организовывать работу в условиях многозадачности
Будет плюсом:
  • опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).
Условия
  • комфортный офис в Москве на Кутузовском проспекте (Sber City)
  • возможность выбрать удобный график - офис/гибрид
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 4%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

Хабр Карьера

Похожие вакансии

  • QAA-инженер (Python) в команду Data Mining

    • Москва
    Компании-партнёры 2ГИС делятся с нами данными о себе: где находятся их филиалы, по какому расписанию они работают, как с ними можно связаться и прочей ценной информацией. А мы - ко…
    • 8 д. назад
  • Ведущий инженер по решениям Data Security

    • Москва
    Мы команда К2 Кибербезопасность! Реализуем комплексные проекты и используем широкий перечень современных решений и подходов. Обеспечиваем безопасность веб-сервисов и приложений на …
    • 21 д. назад
  • Data-инженер DWH в Маркет

    • Москва
    О компании и команде Яндекс Маркет - один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобрета…
    • 2 мес. назад