Наполнение ЭА и ретроконверсия

Не печалься о том, что никто не знает тебя, А стремись быть тем, кого могут знать. © Конфуций в раздел...

Версия для печатиВерсия для печати

Содержание

  1. Наполнение ЭА и ретроконверсия
  2. Наполнение ЭА
  3. Виды ретроконверсии
  4. Объекты ретроконверсии
  5. Этапы ретроконверсии
  6. Организация сканирования
  7. Выводы

Электронный архив: Наполнение

Наполнение ЭА и ретроконверсия Наполнение ЭА и ретроконверсия

Наполнение ЭА Наполнение ЭА и ретроконверсия

Основная функция ЭА - хранение архивных документов в электронном виде. Вновь созданная система ЭА должна быть наполнена такими документами. Существуют два различающихся по технологии способа подобного наполнения (см. Рис. 1):

  1. Ввод текущих документов
  2. Залповый ввод документов

Ввод текущих документов в ЭА обычно осуществляется в течение всего срока функционирования ЭА в рамках организационно-технологического модуля обработки текущих поступлений. В этом модуле входящие документы сканируются и подвергаются прочей необходимой обработке (индексация, которой будет посвящена лекция "Индексация и имиджинг") по мере их поступления в ЭА.

На начальном этапе функционирования ЭА часто возникает задача разового (залпового) перевода накопленного до момента создания ЭА архивного фонда в электронный вид. Эта задача решается посредством применения технологии ретроконверсии, являющейся предметом настоящей лекции.

В ходе лекции будут рассмотрены следующие вопросы:

  1. Суть технологического процесса ретроконверсии
  2. Виды ретроконверсии
  3. Этапы процесса ретроконверсии

Что такое ретроконверсия?

Ретроконверсия - это массовое преобразование информации, содержащейся в документах на традиционных носителях, в электронный вид. Подобное преобразование, как правило, носит одноразовый, залповый характер.

Ретроконверсию следует отличать от рекаталогизации. При ретроконверсии осуществляется перенос информации с бумажных документов в электронный вид, однако (за исключением, и то не во всех случаях, явных ошибок) информация не модифицируется. При рекаталогизации одновременно производится изменение переносимой информации. Далее будет рассматриваться именно ретроконверсия.

Виды ретроконверсии Наполнение ЭА и ретроконверсия

Рассмотрим основные варианты возможной обработки информации при переводе ее в электронный вид:

1. Имиджинг. Документы хранится в виде набора графических образов отсканированных страниц. Для организации доступа к ним производится индексация документов по минимальному набору полей, идентифицирующих документ или даже группу документов. Это самый дешевый способ обработки, однако, и самый непритязательный с точки зрения возможности поиска.

2. Полная ретроконверсия. Формирование записей базы данных на основе входных документов, после чего образы уже не нужны, а возможности поиска определяются программным обеспечением, работающим с базой данных.

3. Компромиссный вариант. Производится индексация по части полей для увеличения возможностей поиска. Результат поиска - просмотр имиджей.

Выбор вида ретроконверсии

Как именно обрабатывать тот или иной вид документов, решается на стадии постановки задачи. Это зависит и от вида документов, и от типов распространенных запросов к архиву. Понятно, что чем больше трудозатраты на обработку документа, тем дороже она обходится. Любая ошибка при принятии решения может отразиться как на стоимости проекта создания ЭА, так и на его эффективности. Полное распознавание (т.е. перевод из графического вида в текстовый) автоматическим путем требует высокого качества исходного документа, и, кроме того, веских аргументов для перевода документа в текстовый режим. Основные из них - необходимость контекстного поиска и объем электронного документа.

Если эти аргументы не актуальны, распознавание текстов может быть нецелесообразным.

Объекты ретроконверсии Наполнение ЭА и ретроконверсия

Объектом ретроконверсии в общем случае является массив документов. Результатом ретроконверсии является массив электронных документов. Технологический процесс ретроконверсии описывается в терминах единичного документа (процедуры его сканирования, выделения частей и т.п.), поэтому до начала обработки документов должно быть определено, что собственно является документом в конкретном случае.

При наличии в архивном деле описи наиболее распространенный вариант решения - один документ - один пункт описи. При обработке выделяются листы документа, а в качестве поисковых индексов берется информация из колонок описи.

Если же опись отсутствует или, что нередко бывает, не соответствует содержимому дела, задача сильно усложняется. Поточный метод обработки требует принятия стандартных решений в соответствии с четко выработанными правилами. Поэтому для каждого типа информации должны быть сформулированы правила вычленения и индексации документа без применения специальных знаний. Вопросы индексации документа будут подробно рассмотрены в лекции "Индексация и имиджинг".

Из хаотически лежащей груды бумаг автоматически не получится стройного электронного архива. В то же время при наличии структурированного бумажного архива можно быстро получить электронные документы с эффективным доступом к ним.

Этапы ретроконверсии Наполнение ЭА и ретроконверсия

В процессе ретроконверсии обычно выделяют следующие этапы:

  1. Постановка задачи. Формулируется задача ретроконверсии: перевести заданный архивный фонд в электронный вид для использования в качестве наполнения целевого ЭА
  2. Экспертиза и уточнение задачи. Этап, предваряющий основные работы по ретроконверсии
    1. Экспертиза массивов бумажных документов. Производится исследование переводимого в электронный вид архивного фонда на предмет определения технологических параметров процесса ретроконверсии (количество и номенклатура документов, качество бумаги, сложность структуры документов, их читаемость и т.п.)
    2. Уточнение задачи и этапности работ. На основе результатов экспертизы уточняется постановка задачи ретроконверсии, определяются состав и характеристики этапов работ по ретроконверсии (продолжительность, трудозатраты, стоимость и т.п.)
    3. Выбор техники. На основе результатов экспертизы бумажных документов определяется наиболее подходящее по техническим и стоимостным параметрам аппаратное обеспечение для перевода документов в электронный вид (сканеры, станции сканирования и др.)
  3. Разработка технологического маршрута обработки документов. Определяется последовательность обработки документов в ходе ретроконверсии и технологические параметры этапов этой обработки. Выделяются следующие этапы:
    1. Сканирование, то есть получение электронных графических образов документов (будет подробно рассмотрено далее в настоящей лекции)
    2. Индексация, то есть извлечение значимой информации из электронных образов документов и занесение этой информации в структуру хранения данных (этот и последующие этапы, в силу их сложности и значимости в процессе ретроконверсии, будут рассмотрены позже в отдельной лекции "Индексация и имиджинг")
    3. Верификация, то есть проверка качества индексации
    4. Формирование выходных массивов, то есть приведение формата полученных в ходе индексации данных к требованиям наполняемого ЭА
  4. Пилотный проект. На этом необязательном этапе выделяется некоторая часть архивного фонда с целью отработки технологического процесса ретроконверсии, и производится полная обработка этой части
  5. Корректировка технологического маршрута. При наличии этапа пилотного проекта после его завершения по результатам обработки части архивного фонда может быть произведена корректировка технологических параметров процесса ретроконверсии с целью оптимизации обработки массива документов в целом
  6. Запуск и производство работ. Собственно выполнение обработки архивного фонда
  7. Генерация и экспорт конечного продукта. Получение цельного готового массива данных в электронном виде и загрузка этих данных непосредственно в целевой ЭА, после чего они становятся полностью доступными для использования в составе ЭА

Организация сканирования Наполнение ЭА и ретроконверсия

Сканирование документов в процессе ретроконверсии, то есть создание их электронных графических образов, предшествует прочим этапам обработки документов в электронном виде, которые будут рассмотрены в лекции "Индексация и имиджинг". Сканирование документов осуществляется в следующем порядке:

1. Получение документов из места их постоянного хранения (если сканирование производится не по месту хранения), подготовка к сканированию:

  1. расшивка документов, изъятие металлических скрепок
  2. вставка технологических разделителей (специальных листов, предназначенных для разграничения групп документов), формирование пачек (то есть отдельных групп документов) для сканирования
  3. распределение документов по сканерам в соответствии со свойствами документов: расшитые, сшитые, цветные, ветхие и др.

2. Сканирование документов и проверка качества:

  1. собственно сканирование документов
  2. отбраковка некачественных образов, повторное сканирование плохо отсканированных документов с другими настройками сканера или на других сканерах
  3. запись полученных образов документов на носитель оперативного хранения (жесткий диск) в соответствии с правилами рубрикаторов или СУБД ЭА

3. Возврат документов:

  1. восстановление первоначального вида документов (например, если сложенный документ был раскрыт, его обратное складывание)
  2. сшивка исходно сшитых документов и изъятие технологических разделителей
  3. возврат документов на место их постоянного хранения

4. Запись информации на DVD диски:

  1. проверка файловой структуры, выборочная проверка качества сканирования (графически файлов).

Выводы Наполнение ЭА и ретроконверсия

  1. Вновь созданная система ЭА должна быть наполнена документами, существуют два различающихся по технологии способа подобного наполнения (ввод текущих документов и залповый ввод документов, то есть ретроконверсия)
  2. Ретроконверсия - массовое преобразование информации, содержащейся в документах на традиционных носителях, в электронный вид.
  3. Существуют три вида ретроконверсии, различающиеся по полноте обработки содержащейся в документах информации - имиджинг, полная ретроконверсия и промежуточный вариант.
  4. Процесс ретроконверсии разбит на отдельные этапы по организационно-технологическим признакам, собственно технологическая часть обработки документов в процессе ретроконверсии включает в себя сканирование, индексацию, верификацию и формирование выходных массивов.

Вы можете копировать контент, представленный на этой странице, повторно публиковать его, вносить изменения, изменять оформление (и пр.), при условии размещения в любом месте скопированной страницы любого цвета, размера и стиля шрифта индексируемой ссылки вида:

Версия для печатиВерсия для печати

Индекс цитирования Яндекс
Аттестат участника WebMoney
Этот сайт разрабатывается в соответствии с рекомендациями W3C XHTML 1.0 Transitional
Этот сайт разрабатывается в соответствии с рекомендациями W3C CSS

Сайт "Территория Дмитрия Новоженова" © 2017 год. Программирование на ASP.NET, написание программ на C#, самописные утилиты. Разборки с компьютерами, сетевым оборудованием и другим железом. Коллекции изображений, библиотеки иконок, которые можно скачать и сохранить локально, рисунков и других картинок. Личный фотоальбом, ссылки на фотогаллереи на других сайтах и другие ресурсы посвященные фотографии. Каталог игр на PlayStation 2, тактика прохождения игр, обзоры игр на PlayStation 2. Тематические сборники статей, новости сайта.