54

Быстрая оцифровка данных для государственных сервисов

Июль, 2020 год.

Распознавание рукописного текста для создания электронного архива документов с помощью платформы Beorg Smart Vision.

alt

Какую проблему решали

В соответствии с требованиями законодательства РФ органам ЗАГС необходимо перевести все документы в электронный формат.
В течение шести месяцев потребовалось оцифровать 1 млн записей актов гражданского состояния Тамбовской области с 1926 по 1999 год. Документы содержали ветхие записи и смазанные печати, без технологий «Биорг» на базе ИИ, c помощью которых распознавание рукописного текста происходит автоматически, понадобилось бы большое количество специалистов с конкретными навыками, организовать работу которых в короткий срок и в условиях пандемии не представлялось возможным.
Важна определенная квалификация специалистов в расшифровке ветхих и нечетких записей, которые велись от руки.
Решение проблемы
Оцифровку документов провела компания «Биорг», используя возможности инновационной платформы Beorg Smart Vision и краудсорсингового сервиса. Это позволило задействовать меньше персонала и решить проблему его квалификации.
Операторы снимают скан-образы актовых записей, которые поступают в систему для распознавания. В сложных случаях документы верифицируются операторами краудсорсингового сервиса «Биорг».

Если возможно, система распознает весь документ. Если нет — происходит декомпозиция на отдельные поля (дата, адрес, фамилия).
Применяемые технологии

Интегрированная онлайн-платформа Beorg Smart Vision на базе искусственного интеллекта — собственная разработка компании «Биорг». Она позволяет работать с различными типами рукописных документов.

В основе платформы — нейросетевые алгоритмы, обученные под конкретные типы задач.

Платформа объединяет следующие технологии:

  • Конвейер обработки материалов
  • Проприетарные алгоритмы обработки источников данных
  • Нестандартные ансамбли специализированных нейросетей
  • Natural language processing для обработки ошибок и автоматизированной классификации сущностей в базе знаний проекта
  • Собственная краудсорсинговая платформа
  • Конволюционно-рекуррентные нейронные сети (CNN + RNN [LSTM]) на базе архитектуры Faster-RCNN глубокого обучения на всех этапах обработки входной информации

Как это ?

Бизнес-процесс

До проекта:

  • Ручной ввод информации.
  • Сложность работы с ветхими документами.
  • Длительный процесс оцифровки.

После проекта:

  • Качественная оцифровка документов любой сложности.
  • Сокращение сроков реализации проекта.

Результаты

Команда ЗАГС Тамбовской области

Ольга Горохова
Начальник управления

Команда «Биорг»

Георгий Зуев
Президент компании
Александр Миронов
Директор направления государственных программ
Александр Новиков
Аналитик IT