Translumo is capable of translating text that appears in a selected area in real time (for example, subtitles).
Translumo uses several OCR engines for text recognition. By using a trained machine learning model, the mechanism selects the best result at each iteration.
The main development principle was to make an extremely universal application without the need to adjust settings for each individual image case.
The implementation uses various optimization mechanisms and results caching between frames to minimize real-time translation latency.
Translumo способен переводить появляющийся текст в выбранной области в режиме реального времени (например, субтитры).
Translumo использует сразу несколько OCR движков для распознавания текста. За счет обученной модели машинного обучения механизм выбирает лучший результат на каждой итерации.
Основным принципом разработки было сделать предельно универсальное приложения без необходимости подгонки настроек под каждый отдельный случай изображения.
В реализации используются различные механизмы оптимизации и кэширования результатов между фреймами, чтобы минимизировать задержку перевода в реальном времени.
Useful links: