T-Meetup: Hyper NLP Research

2 презентации

Наш новый митап, посвященный научным исследованиям в NLP. Если вам интересно послушать про самые актуальные проблемы в LLM Alignment и Mechanistic Interpretability, а также по-хардкору закопаться в их решения, то мы вас ждем!

А еще, в этот раз вместо традиционных трех докладов мы готовим два больших, в которых рассмотрим все детали. И после основной программы у нас будет больше времени на общение в кулуарах и поразгонять спорные моменты.

Начало регистрации в 18:30 и до 19:30
Начало программы в 19:00
Место проведения: башня Б2 (низкая), 2й этаж

Дата и время

11 ноября 2024, 19:00 (МСК)

Место проведения

Офлайн, Москва, Грузинский Вал, д.7, T-Space

Доклады

Mechanistic Interpretability

До недавнего времени область интерпретируемости языковых моделей была больше похожа на гадание и поиска голов в атеншине.

Сейчас, во многом благодаря исследованиям антропика и дипмайнд, мы, наконец, можем говорить о том, что с помощью интерпретируемости можем не только понимать как работают трансформеры, но и изменять их поведение в нужном для нас направлении.

Расскажу про то, чем наша группа занимается прямо сейчас в направлении механистик интерпретабилити.

Никита Балаганский

Лид направления Foundations, команда Research, Т-Банк

Как находить темы для исследований в условиях высокой конкуренции

Обсудим, как изменилась область алаймента за 2 года: от единственного RLHF до нескольких десятков разных методов.

Посмотрим, что происходит в офлайн алайменте: расскажу про то, как мы писали TR-DPO, и почему переписывали статью несколько раз.

Поделюсь, что интересного раскопали в онлайн алайменте и куда смотрим сейчас. В конце узнаете, как мы работаем, как генерируем идеи, и почему тесно сотрудничаем с RnD командой.

Борис Шапошников

Лид направления AI Alignment, команда Research, Т-Банк

Презентации