Anno OCR — это инструмент аннотирования исторических документов, разработанный для подготовки качественных обучающих данных для OCR и HTR моделей. Платформа создавалась как часть экосистемы Manuscript OCR и предназначена для работы с архивными рукописными и печатными документами. Проблема Для обучения качественных OCR/HTR моделей необходимы большие объёмы размеченных данных. Однако аннотирование исторических документов осложняется: сложной структурой страниц; нестандартной типографикой; рукописн…