Оцифровка архивов - самый современный способ хранения документов! Оцифровка архива как современный способ хранения документов Оцифровка бумажных документов.

Оцифровка документов - это перевод документов в цифровой вид с последующим распознаванием определенных полей документа. Если вас интересует эта услуга, обратитесь в наш копировальный центр. Мы сделаем вам выгодное предложение, лучшее по цене и качеству.

Документ в оцифрованном виде - это удобно и практично. Данная услуга приобретает популярность ввиду перехода компаний на электронный документооборот. Клиенты часто обращаются в наш копировальный центр и интересуются, что такое оцифровка архивов. Мы подробно рассказываем им как проходит данная процедура, и о том, какие плюсы она имеет. Среди последних можно отметить то, что оцифрованные документы:

  • не занимают лишнего места;
  • легко редактируются;
  • находятся в упорядоченном состоянии – что позволяет быстро производить поиск определенной информации

При необходимости можно скопировать и распечатать любой файл. Все это займет всего несколько минут.

Процесс оцифровки документов довольно сложный, требующий внимательности и ответственности. Для начала наши специалисты проводят подготовительную работу, выполняют расшивку, а после (сшивку, в некоторых случаях). Затем устраняют механические повреждения – заломы на документе, после чего происходит непосредственно сканирование, и уже после – сверка результата оцифровки с исходным образцом. Таким образом, оцифровка архивных документов может быть выполнена исключительно профессионалом, который знает все тонкости этой работы и имеет соответствующий опыт.

Документы, которые подлежат оцифровке

В нашем копировальном центре вы можете оцифровать практически все документы. Приходите к нам с бумажным образцом, слайдом, книгой, чертежами, журналом. Воспользовавшись современным оборудованием, мы переведем все это в электронный вид за минимальные сроки.

При оцифровке документов цена услуги формируется, исходя из количества материалов, их качества, времени, которым вы располагаете. Все эти данные у вас уточнит наш менеджер. На консультации он спросит, насколько срочно вам нужна оцифровка документов в Москве и на какой бюджет вы рассчитываете. В любом случае, будьте уверены, что мы подберем для вас лучший вариант. Созданные с нашей помощью каталоги и электронные архивы всегда будут под рукой, а вам не придется тратить время на поиски необходимого документа. Очень быстро вы поймете, насколько это удобно.

В настоящее время все больше внимания уделяется вопросам сохранности культурных ценностей. В этой связи утверждаются государственные программы, в рамках которых, по замыслу их создателей, применение новых технологий, инновационных подходов, а также мирового опыта позволит обеспечить сохранность культурного наследия, исторически значимых документов. Поэтому сегодня архивы России осуществляют перевод бумажных документов в электронный вид. О том, что послужило началом этой масштабной работы, с какими трудностями сталкиваются архивисты и как решают вопросы сохранности оцифрованных документов, заместитель руководителя Федерального архивного агентства (Росархива) Олег Наумов рассказал корреспонденту PC Week/RE Ольге Звонаревой.

PC Week: Расскажите, пожалуйста, как начинался процесс оцифровки архивных документов, каковы особенности этой работы?

Олег Наумов: Задача массового перевода архивных документов в электронный вид была поставлена в программе “Информационное общество (2011—2020)”. Это совсем непростая задача. К тому же одно дело — оцифровка документов, а другое — оцифровка научно-справочного аппарата (НСА), без которого не найти нужного документа. Поэтому, когда года два назад появилась возможность нормального финансирования работ в рамках федеральной целевой программы “Культура России 2012—2018”, в первую очередь стали создавать в электронном виде НСА, позволяющий эффективно искать документы.

PC Week: Какое программное обеспечение используется при этом?

О. Н.: Задолго до принятия программы “Информационное общество” Росархив начал разработку общероссийского стандартизированного ПО организации учета документов — программный комплекс “Архивный фонд”. Система, являющаяся собственностью Российской Федерации, внедрена на уровне федеральных, региональных и муниципальных архивов. С ее использованием создан центральный фондовый каталог, размещенный на портале “Архивы России”. Изначально “Архивный фонд” создавался как учетный аппарат, но потом его стали использовать как поисковый. Сейчас в ряде архивов используются специализированные поисковые системы.

PC Week: Опыт какого архива был основополагающим в деле оцифровки описей?

О. Н.: Первым, кто у нас оцифровал все описи, исключительно в силу сложившихся обстоятельств, стал Российский государственный Исторический архив в Санкт-Петербурге. Когда встал вопрос о его переезде, описи были отсканированы, и их электронные образы использовались на всех этапах перемещения, т. е. отслеживалась каждая коробка, каждое дело.

Это был хороший опыт, но с точки зрения развития информационных технологий он был не очень удачным. Хотя появилась возможность ознакомиться с ними в читальном зале и в онлайн-режиме, коллекция графических образов не позволяет проводить автоматизированный поиск. Куда большие удобства предоставляют пользователям описи, переведенные в формат базы данных, с возможностью простого и расширенного поиска. Росархив начал активно финансировать эти работы. К настоящему времени сделано порядка 20—30% описей федеральных архивов.

PC Week: С какими трудностями сталкиваются архивы при оцифровке документов?

О. Н. Первая проблема — огромный объем. Общий объем Архивного фонда РФ составляет 494 млн. дел, из них 9% приходится на федеральные архивы.

Но самое сложное — это определить, какие именно документы следует оцифровывать. Самый простой ответ — наиболее востребованные. А как определить эту востребованность? Сегодня востребовано одно, завтра — другое. И в советское время было введено понятие особо ценных архивных фондов и документов. На них создавался страховой фонд на микропленке, а также фонд пользования. Однако сегодня эти документы практически не востребованы. То есть критерии ценности и востребованности документов советской эпохи совершенно не работают сейчас. Спрос меняется постоянно. Определить наверняка, какие документы будут наиболее востребованными, практически невозможно.

Немаловажной является и техническая сторона вопроса. Например, возник огромный спрос на составление собственных родословных. Дело хорошее и нужное. Стали активно заказывать эти дела: метрические книги, ревизские сказки. Но они абсолютно не приспособлены для такого массового использования. Сканировать их как наиболее востребованные — нонсенс. Из книги толщиной в 80 см человеку нужна только одна страница. А чтобы удовлетворить этот спрос, нужно сканировать всю тысячу страниц. Да еще и с оборотом. Но, с другой стороны, если отсканировать эти документы, то подлинники выводятся из оборота и гарантируется их физическая сохранность. Они все уникальные. И самое главное, несчастные хранители (среди которых немало женщин) не будут таскать на руках все эти тонны бумаг.

Однако тут мы упираемся в форму предоставления информации. Ведь пользователю куда интереснее было получить не образ, а расшифровку и БД. А массив этих документов огромен. Только в РГАДА в фонде 350 “Ландратские книги и ревизские книги” — пять с лишним тысяч дел, около 3 млн. стр. Сколько людей нужно привлечь? В Перми нашли хороший выход: привлекли финансы, которые выделялись для обеспечения рабочих мест. Работа выполнялась людьми на дому. Успешно решили проблему безработицы. И в итоге у них получилось сделать то, что больше никому в России, на моей памяти, сделать не удалось.

Имеющийся опыт сканирования в федеральных архивах позволяет сделать два вывода. Во-первых, создавать электронный фонд пользования без создания НСА — занятие малопродуктивное. Получается огромная куча сканов, где невозможно найти нужный. Во-вторых, сканированию, особенно массовому, целесообразно подвергать законченные комплексы — фонды или описи. При этом дела должны сканироваться целиком, дабы избежать конфликтов в случае ошибок в нумерации. В отдельных случаях, в силу уникальности и значимости документов, вне зависимости от того, есть на оборотной стороне листа какой-либо текст или нет, нужно оцифровывать лист, включая оборот. Тогда и вопрос о том, что мы, возможно, что-то утаили, отпадает.

Есть проблема с выбором оборудования. Где-то нужен простой сканер, где-то он должен быть сложнее. К примеру, для оцифровки ландратских книг специально заказывали “глубокую колыбель”. Иначе не скопировать, потому что толщина корешка некоторых книг достигает 80 см.

PC Week: Какова основная цель оцифровки в настоящее время?

О. Н. Их три. Первая — расширение и облегчение доступа к документам Архивного фонда. Вторая — обеспечение сохранности подлинников путем вывода их из оборота и предоставление доступа к электронному фонду пользования. Третья — упрощение предоставления государственных услуг. Сейчас появляется много индивидуальных запросов граждан на документы по личному составу. Архивы начинают их также оцифровывать и использовать электронные копии для подготовки ответов, что значительно ускоряет работу.

PC Week: А как архивы оцифровывают документы?

О. Н. Процесс идет по-разному: где-то делают сами, используя подручные средства или приобретая разнообразную технику. Второй путь — это привлечение сторонних организаций. Но все-таки на самый главный вопрос однозначного ответа пока нет: к чему мы стремимся, оцифровывая документы?

PC Week: И никто им не задается?

О. Н. Почему, все задаются. Но как найти единственно верный ответ? Конечно, преимущество использования оцифрованных документов, очевидно. Это и, обеспечение сохранности, и удаленный доступ, и простота предоставления информации, и простота изготовления копий — полный спектр плюсов. Другое дело, как этого достичь? Вот вы пользователь, вы зашли на сайт и определили, что нужные вам документы находятся на хранении. Допустим, в Перми. Зашли на сайт по ссылке, нашли описи дел. Интересующее дело есть. И как его получить? Хорошо, если оно уже оцифровано. А если нет? Ехать самому в архив и заказывать подлинники? Или же архив должен оцифровывать все дела? Но это невозможно. Значит, по сути, остается только один вариант. Создание в каждом архиве возможности оперативного изготовления электронных копий по требованию пользователя. Причем это не обязательно может быть собственное подразделение. Это может быть и аутсорсинг. Но такая услуга должна быть оперативно предоставлена. Но изготавливать эти копии, как показывает опыт, имеет смыл только тогда, когда уже есть электронная система, которая позволит качественно и структурировано разместить эти материалы. Вот тогда это заработает. Когда мы это сделаем, и сможем ли мы это сделать, скажу честно, не знаю.

PC Week: Наверное и до утверждения программы “Информационное общество” в 2010 г. работы по оцифровке уже проводились?

О. Н. Да. Были отдельные проекты. Например, Электронный архив Коминтерна или коллекция документов СВАГ. Как правило, они реализовывались совместно с зарубежными партнерами. Собственных средств для их осуществления не хватало. Дело шло не просто. Были и технические, и методические, и организационные, и технологические сложности. Но опыт накапливался. И сейчас он очень пригодился.

PC Week: То есть уже после утверждения программы стали определять, какими должны быть основные критерии при оцифровке документов?

О. Н. Эта программа, скажем так, позволила архивистам привлечь внимание властей к тому, что проблема есть и надо ее решать. Готовить и утверждать программы по оцифровке. И привлекать под это финансы. Но на сегодняшний день нет ни одного универсального критерия. Сложно определить единый подход для всех, потому что архивы хранят совершенно разную документацию.

PC Week: То есть каждый архив фактически определял критерии сам?

О. Н. Фактически да. В принципе, это четыре критерия, они общепринятые, но не скажу, что они самые правильные. Это востребованность документов, обеспечение сохранности, облегчение работы сотрудников архива, улучшение условий обслуживания пользователей. Плюс еще ускорение работ. Если у меня на сайте есть электронный НСА, то пользователь приходит в архив подготовленным, просмотрев описи в Интернете. Если искомые документы уже оцифрованы, он имеет возможность посмотреть их у себя на компьютере, не заходя в архив, или без задержки получить в читальном зале.

PC Week: Получается, каждый архив должен сам определить, что ему оцифровывать в первую очередь?

О. Н. Совершенно верно. Это должна быть исключительно индивидуальная программа каждого архива. Нельзя сделать единую. Это зависит от многих факторов: от финансовых возможностей, от степени развития и внедрения ИТ-технологий, от конкретного спроса. Так, у кого-то очень востребованы документы по личному составу, и необходимо удовлетворять потребностям граждан. Хотя с архивной точки зрения это документы не постоянного, а временного срока хранения — 75 лет. Но это облегчает работу и помогает людям, потому что человек ждет ответа на запрос не месяц, а получает искомую информацию через два дня. Значит, надо в это вкладывать силы и средства.

PC Week: Определяя приоритеты документов, которые подлежат оцифровке, архивы согласовывают их с Росархивом?

О. Н. Если говорить о региональных архивах, то нет. Это дело каждого архива. Они присылают нам свои программы по информатизации, по оцифровке. Мы с ними знакомимся и даем свои советы. В меру своих сил им помогаем, выделяем средства ФЦП. Другое дело — федеральные архивы. Здесь позиция Росархива имеет определяющее значение. Но и тут нет универсального критерия. Для удовлетворения все возрастающего спроса на генеалогическую информацию Росархив выделил более 40 млн. руб. на перевод в электронный вид ландратских книг, хранящихся в РГАДА. Отвечая на устойчивый интерес общества к истории нашего отечества в недавнем прошлом, в июне этого года был запущен сайт “Документы советской эпохи”, где размещены образы документов личного фонда И. В. Сталина и Политбюро ЦК. Были подготовлены интернет-проекты, посвященные 1150-летию российской государственности, 400-летию окончания Смуты, 200-летию Отечественной войны 1812 года. Естественно, там были размещены образы наиболее важных и востребованных документов.

PC Week: Значит теперь в читальном зале архива будут выдавать только электронные копии, а не подлинные документы?

О. Н. В идеале нужно, чтобы человек нашел искомый документ на сайте, заказал дело и ему выдали отсканированные документы. И подлинник остается нетронутым. Однако возникают случаи, когда необходимо посмотреть подлинник. К примеру, какой бы хорошей ни была техника, водяных знаков она не передаст. А по ним можно установить дату документа. Но таких случаев один на тысячу.

PC Week: Получается, архив предоставил пользователю государственную услугу, но после оцифрованную копию документа необходимо сохранить?

О. Н. Конечно, в этом и заключается преимущество сканирования. Раньше были микрофильмы, ксерокс, машинопись. И архивист, сделав копии, отдавал их пользователю. То есть копии документа у него не оставалось. В случае с оцифровкой копия остается. Но для нее должно быть четко определено место хранения. И если впоследствии будет второй запрос, не будет надобности поднимать дело. Нужно накопить опыт такой работы.

PC Week: Каким образом определяются сроки оцифровки массивов документов?

О. Н. Сроки зависят от трех причин: от технических и финансовых возможностей и от состояния документов. Есть документы, которые сброшюрованы так, что даже самой современной техникой получить текст полностью не удается. То есть придется их расшивать, чего очень не любят ни документы, ни архивисты. Сканировать. Потом обратно сшивать. Это требует времени. Также сроки зависят от объема дел, от количества листов в них. Не так сложно отсканировать стопку бумаг стандартного формата, а вот карту размером 3х8 м — уже сложнее. По учетным документам это один лист. Но сканируется он только частями. А после в ПО надо это все “сшивать”, подгонять и смотреть, как этот документ будет выглядеть.

PC Week: Как идет работа по реализации 89-го пункта федеральной целевой программы “Культура России (2012—2018): формирование архивных электронных ресурсов и их предоставление в сети Интернет”?

О. Н. В рамках реализации этого пункта происходит оцифровка описей. Также осуществляется оцифровка документов, в том числе ландратских книг. Причем стараемся и регионам помогать: приблизительно пять-шесть регионов в год мы включаем в эту программу и выделяем от 10 до 15 млн. руб. Создаем интернет-выставки и т. д. Всего на реализацию работ по этой программе в год выделяется 67 млн.

PC Week: Распределение средств зависит от степени важности и значимости документов?

О. Н. Да. Архивами подаются заявки в определенной форме на участие, мы эти заявки рассматриваем. Также и фирмы, которые считают, что предлагают интересные вещи, подают заявки. Мы их рассматриваем, выбираем интересные перспективные решения, составляем общий план и осуществляем закупку на конкурсной основе. В прошлом году по этому мероприятию было 52 госконтракта. То есть каждую неделю мы заключали контракт.

PC Week: Вы затронули тему уже хранящихся в архиве документов, начиная с XI века, но ведь в архивы поступают и новые бумажные документы и это огромный массив. Как проводится работа с ними? Как решается вопрос по их оцифровке?

О. Н. Для нас важно только одно: относятся ли эти документы к составу архивного фонда или не относятся. То есть подлежат они постоянному сроку хранения или нет. А дальше с точки зрения использования абсолютно не важно, документы ли это XI или XXI века. В этом плане они равны. Другое дело, что на документы XI века у нас, естественно, есть страховой фонд и фонд пользования. И эти уникальные документы крайне редко выдаются на руки. Имеется специальный Государственный реестр уникальных документов РФ, который размещен на сайте Росархива и содержит их описания и электронные образы.

PC Week: В этой связи наверняка проще принять на хранение документы, переведенные в электронный формат? К примеру, вступили в силу изменения в законодательстве относительно кадровой документации, и архивы, наверное, могут принимать ее в электронном виде?

О. Н. В принципе да. Но особого смысла государственному архиву принимать современные документы по личному составу сейчас нет. Зачем? Рассчитывать пенсию? Есть Пенсионный фонд, у которого налажен специализированный учет граждан, начиная с 2000 г.

PC Week: То есть архивы не принимают документацию, хранящуюся 75 лет?

О. Н. Нет, она у нас хранится с давних времен. И сейчас мы активно ведем переговоры с тем же Пенсионным фондом, чтобы нам этот срок для бумажных документов сократили с 75 до 15 лет. Но Пенсионный фонд боится, что их электронная система может рухнуть.

А те документы, которые со временем будут поступать к нам в электронном виде — проблема очень большая и совершенно отдельная. Это вопросы, касающиеся электронного документооборота, электронных документов. Как их принимать, как хранить, это отдельная тема.

PC Week: Пока еще такие документы не поступают?

О. Н. Нет, поступают. Материалы переписи населения и сельскохозяйственной переписи ГАРФ принял в электронном виде. Другое дело, что эти переписи только в электронном виде и существуют. Но массового приема делопроизводственной документации пока нет. Тут довольно много нерешенных вопросов.

PC Week: А как быть с документами ликвидированных организаций? Их принимают на хранение?

О. Н. Принимаем. Правда, конкурсные управляющие обязаны в случае банкротства и ликвидации компании найти деньги на описание документов ликвидированных организаций, но не всегда находят.

PC Week: Под руководством Росархива находятся 15 федеральных архивов. Региональные архивы в настоящий момент выведены из-под контроля вашего ведомства?

О. Н. Да, прямого контроля над ними нет. Они подчиняются исполнительным органам субъектов федерации. Где-то это самостоятельные архивные службы. Где-то они, как и мы, входят в министерства культуры. Где-то — в министерства юстиции или непосредственно в аппарат губернатора. Но той вертикали власти, которая была в Советском Союзе и просуществовала до 2004 г., к сожалению, уже не существует. Пока мы сохраняем методическое единство. Чем можем, помогаем региональным архивам. Представители Росархива принимают участие в ежегодно проводимых в каждом федеральном округе научно-методических советах. Раз в год проводится Совет по архивному делу, где собираются архивисты со всей страны. То есть связи остаются. Мы шутим, что архивист — это такая профессия, при которой в любом городе можно оказаться без денег и вещей, прийти к коллегам архивистам, и они тебя примут, накормят и отправят домой. Есть такое братство, которое, на самом деле, не свойственно ни одной другой профессии.

PC Week: Спасибо за беседу.

В офисе часто бывает нужно переслать электронной почтой копии - электронные версии печатных документов. Это могут быть различные акты, счета-фактуры, письма, договора, уставы, служебные записки и любые другие возможные документы.

Дома у нас есть старые фотографии, которые с годами дряхлеют, и мы хотели бы их сохранить.

Нам дали на время интересную книгу, а хочется иметь ее у себя. Как это все сделать? Наши недолговечные бумажные документы надо преобразовать в электронный вид, то есть оцифровать и сохранить.

Оцифровка – это перевод изображения, или аналогового аудио/видеосигнала в цифровой формат пригодный для записи в электронный носитель.

Для оцифровки изображений объекта существуют специальные устройства – сканеры. Есть сканеры штрих-кодов, сканеры кинопленки. Биометрические сканеры считывают рисунок сетчатки глаза или папиллярный рисунок кожи пальцев руки. Форму объемного объекта считывает трехмерный 3D-сканер.

В сканерах для обработки бумажных носителей – рисунков, фотографий, текстовых документов, изображение построчно освещается специальной лампой, и отраженный световой поток фокусируется на светочувствительной матрице. Полученные электрические сигналы аналогово-цифровой преобразователь превращает в систему двоичных данных, которая и образует цифровую копию изображения.

Выбор сканера зависит от задач и специфики его применения. Сканер в офисе почти всегда используется для оцифровки документов. Даже, если сканируются фотографии, в офисе к ним не предъявляются высокие требования качества. Разрешения в 300 dpi вполне достаточно для обеспечения точной работы программ распознавания и получения хорошо читаемого текста. Любой выпускаемый сегодня сканер обеспечивает приемлемое для офисных работ разрешение.

Это касается и глубины цвета. Практически каждый современный сканер воспроизводит необходимый для печатных документов уровень цвета серого.

Важно в офисе, где основной задачей является быстрая постраничная оцифровка текстовых документов, это - автоматизация процесса сканирования. Могут применяться листопротяжные сканеры. Здесь, лист документа вставляется в щель аппарата и протягивается, как и в факсе , по направляющим роликам. Такой сканер удобен со встроенным автоподатчиком листов. Загружаем в лоток несколько листов многостраничного документа, и пока сканер выполняет оцифровку, параллельно занимаемся другим делом. Здесь все просто. Если установлена соответствующая программа распознавания текста, для оцифровки и сохранения документа в нужном формате на таком сканере достаточно нажать одну кнопку.

Современным офисным решением для отдела проектной компании, например, может быть сканер формата А3 входящий в многофункциональное устройство вместе с принтером А3/А4. На таком МФУ удобно оцифровывать и делать копии чертежей.

Ясно, что сосканировать сброшюрованный журнал или разворот книги на листопротяжном сканере не получится.

Для сканирования двусторонних документов существуют дуплексные сканеры, где два сканирующих элемента обрабатывают обе стороны листа в один проход.

Хорошим решением для дома является цветной струйный МФУ. МФУ - это многофункциональное устройство включающее в себя сканер и принтер. Такое устройство одновременно является и копировальным аппаратом. То есть, МФУ может в автоматическом режиме сканировать документ и печатать его копию - создавать фотокопию документа.

Компактный аппарат с совмещенными функциями занимает меньше пространства на столе. Стоимость его будет существенно ниже суммарной стоимости входящих в него устройств, если покупать их по отдельности. На цветном струйном принтере мы делаем качественные цветные фотографии и визитки , а планшетным сканером оцифровываем документы, фотоальбомы или нужные книги.

В следующих уроках мы поучимся вручную постранично, на планшетном сканере оцифровывать, преобразовывать и сохранять текстовые документы.

В этих примерах для сканирования я использовал популярный настольный МФУ формата А4. Такое недорогое устройство является оптимальным решением для дома и может быть вторым, дополнительным МФУ в офисе.

Предположим, что мы имеем многостраничный логически связанный документ, который нужно оцифровать и отправить на мейл нашему контрагенту. Назовем его «Договор».

В любимой всеми нами Windows XP есть стандартный «Мастер работы со сканером или цифровой камерой». Чтобы мастер заработал, на компьютере должен быть установлен сканер, и он должен быть включен. Работать в мастере очень просто и в уроке оцифровка документов в Windows XP есть небольшое руководство.

В Windows 7 инструментом для создания электронных копий печатных документов и изображений служит стандартный компонент "Факсы и сканирование Windows" .

Итак, мы почитали уроки и с помощью одной из этих программ получили файлы сканов страниц нашего договора в одном из графических форматов, сохранили, и пожалуйста, прикрепляем их к электронному письму, отправляем по адресу.

Плохо здесь то, что при сканировании многостраничного документа этими програмками мы не сможем объединить сканы страниц в единый файл. Конечно, можно пронумеровать файлы страниц по порядку и заархивировать их, чтобы компактно переслать. Но адресат наш сможет только по очереди просматривать страницы в графическом редакторе, не имея возможности навигации по документу. Это некомфортно и убивает время. И, вообще, неприемлемо.

Фактически, используя эти инструменты, мы получаем отдельные цифровые фотографии страниц документа.

Чтобы преобразовать наши разрозненные сканы в единый документ с возможностью полнотекстового поиска, нужна программа распознавания текста. Лучшей на сегодня является FineReader.

FineReader – это программа российской компании ABBYY. Последний ABBYY FineReader двенадцатой версии выпущен в феврале 2014 года. Эта программа извлекает текстовые данные из цифровых изображений - распознает символы текста. Ознакомительную версию ABBYY FineReader 12 Professional можно скачать с официального ресурса: http://www.abbyy.ru/finereader и потренироваться в течение 30 дней.

Лучше, когда на компьютере установлена одна из последних pro-версий. Здесь и далее описывается работа в ABBYY FineReader 10 Professional Edition.

Итак, в предыдущих уроках мы насканировали страниц стандартными инструментами Windows, пронумеровали их, сохранили с расширением "jpg" и поместили в отдельную папку, которую назвали «Договор».

Вот так, используя замечательные возможности программы распознавания мы легко преобразуем различные изображения в редактируемые форматы.

Об этом, пожалуйста, в следующем уроке: Сканируем в ABBYY FineReader .

И вот, мы почитали эти уроки и видим какие преимущества дает нам программа распознавания. Вместо нудного и трудоемкого набора текста из книги, или брошюры, мы, просто, сканируем нужные страницы FineReader"ом, редактируем их, если надо, и сохраняем в выбранном формате. Так, можно быстро сверстать, например, статью или реферат.

А, как сканировать страницы книг и оцифровывать книги читаем в теме: Оцифровка книги .

В заключение темы подытожим: сканер в сочетании с программой распознавания - рациональная замена набора текста с клавиатуры. Имея бумажную версию - напечатанный на принтере или в типографии текст, мы вместо ввода с клавиатуры просто сканируем его. Другой популярной областью применения сканера является оцифровка разнообразных печатных продуктов - этикеток, открыток, фотографий, журналов, книг.

Чем о более крупной организации, компании идет речь, тем больше хранится документов в ее архиве, тем сложнее ее документооборот, тем более привлекательно выглядят услуги по оцифровке архивов. Итак, что такое оцифровка архивов - это процесс по сканированию и каталогизации документов.

Неудобства при работе с бумажными архивами

Так, в больших архивах на поиск нужного документа очень часто приходится тратить много времени сил. Кроме того, наиболее часто используемые документы со временем могут быть повреждены или вообще "потеряны", если их ошибочно расположили в архиве. Нередко в любом виде бизнеса случаются ситуации, когда требуется высокая оперативность в предоставлении информации: бывает нужно быстро подготовить документы для подписания, сделать бумажные или цифровые копии, аккуратно сброшюровать - при работе с бумажными архивами оперативность теряется. Это далеко не полный перечень неудобств, с которыми приходится сталкиваться при работе с бумажными архивами. Но при этом существует достаточно простой и элегантный способ решения проблемы - оцифровка документов.

Преимущества оцифровки архивов?

  • стоит отметить уменьшение нагрузки на бумажные архивы, а также на участок ксерокопирования. Так, теперь если одновременно нескольким сотрудникам организации понадобился один документ, его совершенно не обязательно ксерокопировать.
  • оцифровка документов позволяет существенно сократить расходы на содержание бумажного архива, а также высвободить некоторую площадь, ранее используемую под хранение бумажных архивов.

Как происходит процесс оцифровки документов?

  • Специально обученные специалисты занимаются сортировкой документов (на территории вашей компании или доставляют их на территорию организации, занимающейся оцифровкой архивов), затем с помощью современных сканеров производят оцифровку архивного фонда в полном объеме или отдельных документов.
  • Штрих-коды и печатные документы системой оптического распознавания символов автоматически переводятся в электронный вид. При этом сохраняются ключевые реквизиты документов: название, дата, тип, контрагент и так далее.
  • Для того, чтобы избежать возможного искажения при перепечатывании контактных данных, телефонов для оцифровки рукописной информации при оцифровке архивов применяется система двойного ввода. То есть, оцифровка документов в будущем даст вам возможность осуществлять полноценный оперативный поиск по ключевыми словам или поиск по определенным типам документов/контрагентам.

Управление файлами

Электронные архивы позволяют управлять файлами, полученными в результате сканирования. После оцифровки архивов бумажные документы подлежат систематизации и описанию. Они брошюруются, составляется систематизированный полный каталог документов с учетом потребностей и специфики компании-заказчика. Это позволяет в дальнейшем существенно экономить силы и время при работе с архивами.

Работы по оцифровке архивов

У вас начались серьезные проблемы с хранением бумажных документов? Полки ломятся от нелепо раздувшихся папок, и вы по три часа ищите нужную бумажку? Тогда пришло время заняться оцифровкой документов, которая сделает ваш кабинет или квартиру более чистой, а способ поиска более простым и удобным. Создайте собственную электронную библиотеку, редактируйте, копируйте и перемещайте цифровые файлы по своему желанию. Возможность создания цифровых документов - одно из благ цивилизации. Так воспользуйтесь им!

Прежде, чем отважиться на оцифровку своих документов, вам следует знать, что хранить их можно двумя способами - в виде изображений и в виде текстовых файлов. Хранение изображений потребует гораздо больше места на жестком диске, но при этом вы сможете сохранить стиль исходного документа. Преобразование отсканированных изображений в текстовый файл потребует дополнительных затрат времени, так как необходимо осуществить процесс оптического распознавания символов OCR (правда, если быть точным, то это название не совсем верно, так как здесь речь идет о работе с цифровой информацией, однако, как это нередко бывает, термин прижился).

Как же выбрать формат хранения документов? Очень просто: если оригинал документа написан от руки, и вам важно сохранить его «характерность» (письмо от любимого человека) или если документ является, к примеру, произведением искусства, то сохраните его в виде изображения (иногда узнаваемый почерк столь же важен, как и написанные слова). Другой более прозаической причиной для сохранения рукописных документов в виде изображений является отсутствие коммерчески доступного программного решения, пригодного для интерпретации рукописных символов. Пока эта технология застряла в КПК и планшетах, в которых она реализована несколько в ином виде, чем нам требуется. Работая с планшетом, вы пишите символы «от руки», вводя их по порядку, а программа в режиме реального времени преобразует их в печатный текст. Распознавание почерка отдельно взятого человека с отсканированного документа - дело будущего.

Сканеры

Независимо от того, в каком виде выбудете хранить ваши документы - в виде изображений или в виде текстовых файлов, вам понадобится сканер для их оцифровки. Если вы хотите оцифровать сравнительно небольшое количество документов, то многофункционального принтера или планшетного сканера вам будет вполне достаточно. Единственный их недостаток - относительно медленная скорость работы. Имейте в виду, что только более дорогие модели имеют функцию автоматической подачи листов для обработки многостраничных документов.


Среди самых лучших моделей назовем ScanSnap S1500 от Fujitsu и ScanJet Professional 3000 от HP. Скорость сканирования документов этих устройств составляет в среднем 20 страниц в минуту и выше. При этом ScanJet Professional 3000 отличается более надежным механизмом подачи бумаги, в то время как ScanSnap S1500 имеет более совершенное программное обеспечение. Оба сканера находятся примерно в одной ценовой категории, так что выбирать вам.

OCR - софт

Большинство сканеров поставляются с программным обеспечением для осуществления OCR, которое устанавливается на вашем компьютере. Если вы недовольны сопутствующим ПО или его нет, то подобные программы вещь довольно распространенная и их можно приобрести отдельно. Существуют следующие рыночные предложения:

FineReader 9 Express от ABBYY, $ 100 за обычную и $ 400 за профессиональную версию программы Pro 10;
. OmniPage 17 Standard от Nuance, $ 150 за обычную версию программы и $ 500 за профессиональную;
. Acrobat X Standard от Adobe, $ 299 за обычную версию и $ 449 за профессиональную;
. PaperPort 12 Standard от Nuance стоит $ 100 за обычную и $ 200 за профессиональную версию ПО, правда здесь нет функции OCR, только вариант управления отсканированными документами.

Разрешение

Для документов, хранящихся в виде изображений, как правило, достаточно выставить разрешение от 150 до 200 точек на дюйм, однако OCR - софт работает гораздо лучше, если изображения сохранены в более высоком разрешении - 300 пикселей на дюйм. Все зависит от того, что вам нужно. Если вы просто хотите сохранить хотя бы минимальную читабельность отсканированного документа, можете снизить требования к разрешению. Если для вас важно высокое качество, то, соответственно, увеличьте его.

OCR в веб

Существует несколько онлайн-сервисов, которые предоставляют услугу распознавания отсканированных документов. Среди наиболее известных назовем бесплатные ресурсы Free OCR , NewOCR и OCR Online . Они прекрасно подходят для небольших проектов, то есть работают только с небольшими по объему документами. Сначала вы должны отсканировать оригинал в память компьютера, а затем загрузить изображение документа на веб-сайт. Естественно, на каждом из ресурсов существуют свои ограничения как по объему, так и по содержанию документа. Так, веб-приложения распознают исключительно текст, без линий или дополнительных символов, которые присутствуют на странице.

Сервис Free OCR является бесплатным, однако размер загружаемого файла не может превышать 2 Мб и не содержать не более чем 5000 пикселей, а это примерно 50 точек на дюйм для документа обычного стандарта. Причем, вы сможете обработать не более 10 подобных документов в час. Услугами сайта NewOCR вы также можете воспользоваться бесплатно, но его интерфейс крайне примитивен, зато объем обрабатываемых документов в 2,5 раза больше - до 5 Мб. И, наконец, ресурс OCR Online требует создания бесплатного аккаунта, но позволяет загружать до 15 файлов в час объемом до 4 Мб в разрешении около 200 точек на дюйм на странице. Если вас такие объемы не устраивают, то можно купить платный доступ за $ 3.95 (8 центов за страницу) и получить возможность обработать до 50 документов за раз или заплатить $ 49.95 за обработку до 5000 (1 цент за страницу). Данное веб-приложение работает как с текстом, так и с графическими элементами, однако ему, естественно, далеко до стандартов Acrobat X или FineReader 10.

E-книги

Наверное, вы, как и я, любите запах настоящей книги, любите ощущение плотной бумаги и вид красивой графики. Однако сегодня все больше и больше людей предпочитают иметь дело с электронными книгами, для чтения которых используются так называемые специальные читалки, планшеты, смартфоны, плееры и прочие портативные устройства. Огромное количество интернет-магазинов предлагает просто гигантские объемы контента. Но что, если вы захотите иметь вашу собственную коллекцию е-книг, которые не доступны в цифровом формате?

Чтобы преобразовать ваши любимые «физические» книги в электронные, требуется их сначала отсканировать, а затем перевести в текстовый формат при помощи программы OCR. Это утомительно даже если вы будете использовать очень быстрый FLATBED-сканер. Такие сканеры напоминают «ксероксы», имея прижимную крышку, поэтому они могут сканировать не только отдельные листы, но и книги целиком. Если же вы готовы «распотрошить» любимую книгу, то можете использовать SHEETFED-сканер, которая работает по принципу факса, то есть с отдельными страницами (как ScanSnap S1500 от Fujitsu и ScanJet Professional 3000 от HP).

После того, как вы переведете свои документы, учебники или книги в форматы PDF, Word или fb2, вы можете воспользоваться специальными программами для организации, редактирования или чтения электронных документов. Например, Calibre или Stanza. - бесплатный органайзер и редактор для вашей коллекции электронных книг. Программа помогает работать с каталогом - организовывать, классифицировать, комментировать, искать, сохранять новые и старые книги на жестком диске вашего компьютера или в памяти е-ридера.



Что еще почитать