1. Яндекс Инфраструктура внедряет QoS в InfiniBand для ML-обучений: борьба с вендорскими ограничениями
Команда Яндекс Инфраструктуры столкнулась с нетривиальной задачей: внедрить систему качества обслуживания (QoS) в высокопроизводительных сетях InfiniBand для приоритизации машинного обучения, имея лишь скудную документацию и ограниченную поддержку вендора. Это не академическое упражнение, а ответ на растущее давление в...