Наш новый митап, посвященный научным исследованиям в NLP. Если вам интересно послушать про самые актуальные проблемы в LLM Alignment и Mechanistic Interpretability, а также по-хардкору закопаться в их решения, то мы вас ждем!

А еще, в этот раз вместо традиционных трех докладов мы готовим два больших, в которых рассмотрим все детали. И после основной программы у нас будет больше времени на общение в кулуарах и поразгонять спорные моменты.

  • Начало регистрации в 18:30 и до 19:30
  • Начало программы в 19:00
  • Место проведения: башня Б2 (низкая), 2й этаж

Доклады

19:00 – 19:55
Mechanistic Interpretability
До недавнего времени область интерпретируемости языковых моделей была больше похожа на гадание и поиска голов в атеншине. 
Сейчас, во многом благодаря исследованиям антропика и дипмайнд, мы, наконец, можем говорить о том, что с помощью интерпретируемости можем не только понимать как работают трансформеры, но и изменять их поведение в нужном для нас направлении.
Расскажу про то, чем наша группа занимается прямо сейчас в направлении механистик интерпретабилити.
Никита Балаганский
Лид направления Foundations, команда Research, Т-Банк
20:00 – 20:55
Как находить темы для исследований в условиях высокой конкуренции
Обсудим, как изменилась область алаймента за 2 года: от единственного RLHF до нескольких десятков разных методов. 
Посмотрим, что происходит в офлайн алайменте: расскажу про то, как мы писали TR-DPO, и почему переписывали статью несколько раз. 
Поделюсь, что интересного раскопали в онлайн алайменте и куда смотрим сейчас. В конце узнаете, как мы работаем, как генерируем идеи, и почему тесно сотрудничаем с RnD командой.
Борис Шапошников
Лид направления AI Alignment, команда Research, Т-Банк
Регистрация на митап
Все поля обязательны для заполнения
Регистрируясь, я соглашаюсь с правилами поведения на мероприятии

Подписывайтесь на Т-Банк