[Разработка специализированных моделей машинного обучения]
[1] Построение нейросетевых архитектур под специфические задачи бизнеса
[2] Обучение моделей на собственных данных с fine-tuning под метрики заказчика
[3] Оптимизация моделей для inference: квантизация, pruning, knowledge distillation
[4] Разработка систем real-time обработки с латентностью < 100мс
[5] Развёртывание на edge-устройствах и мобильных платформах
Технологии: PyTorch, TensorFlow, ONNX, TensorRT, Triton Inference Server, MLflow