YATI расшифровывается как Yet Another Transformer with Improvements. Это нейросеть на архитектуре трансформера, которую Яндекс представил в ноябре 2020 года как одно из крупнейших обновлений ядра ранжирования за десятилетие. До YATI основным ранжировщиком был MatrixNet (с 2009), но он работал на классических признаках; YATI же читает запрос и документ как тексты.
Что YATI делает иначе
YATI учитывает контекст: он понимает, что «купить пуховик зимой» и «выбрать тёплую куртку на минусовую погоду» — запросы из одного интента, даже если слова не совпадают. Это закрыло огромный класс полу-релевантных страниц, которые раньше держались за счёт точного вхождения ключа.
Почему это важно для русского контента
YATI хорошо работает с морфологически богатым русским языком — модель тренировалась преимущественно на русских парах «запрос-документ-клик». Поэтому переведённый с английского контент, даже если он лексически совпадает, часто проигрывает оригинально-русскому: морфология, синтаксис и сочетаемость отличаются на уровне статистик.
См. также Яндекс vs Google: чем отличается философия ранжирования.