Технология оцифровки изданий в Национальной библиотеке Республики Карелия

,

,

Национальная библиотека Республики Карелия

Сегодня тенденции в области сохранения и безопасности библиотечных фондов невозможно представить без использования новых информационных технологий. И одним из перспективных направлений деятельности библиотек является создание электронных, или цифровых, коллекций.

Основной целью нашей работы в этом направлении являются повышение эффективности и оперативности обслуживания пользователей на основе расширения доступа к краеведческим и редким документам, хранящихся в фондах НБ РК, и сохранение документального наследия республики как части культурного достояния России.

Одним из методов перевода содержания документов, использующих такие нововведения, является оцифровка. Оцифровка – это способ получения и хранения документов средствами компьютерных технологий. Оцифрованные копии могут храниться на дисках, а также в электронных базах данных и электронных библиотеках.

Первые шаги в этом направлении Национальная библиотека сделала ровно 10 лет назад, и они были продиктованы желанием сохранить и обеспечить открытый доступ читателей к наиболее ценным печатным и рукописным документам из фондов редкой книги и отдела краеведческой и национальной литературы.

В 1999 году на сайте библиотеки было размещена первая электронная копия - рукопись из фондов библиотеки «Соловецкий летописец» (список второй половины XVIII века). В виду особой исторической значимости текст «Летописца» представлен в современной орфографии (в соответствии с требованиями, предъявляемыми к публикациям средневековых текстов). Несомненно, такой способ создания электронного издания представляет научную ценность, но не может быть широко распространен, т. к. требует огромных трудовых затрат, профессиональных знаний и специальных навыков.

Создание электронных копий рукописей из фонда редких книг стало одним из важных направлений в работе.

С 2000 года в рамках республиканской программы «Память Карелии» начинается работа по оцифровке редких краеведческих книг. Переводится в электронный вид книга «Описание Олонецкой губернии» 1842 года издания – первое подробное описание нашего края, издание, пользующееся большим читательским спросом. Работа по оцифровке этого документа была долгой и кропотливой и велась в течение года. Это был первый опыт по распознаванию изображения со старорусской орфографией на символы современного русского языка для полнотекстового поиска. В настоящее время существует программное обеспечение, позволяющее это делать автоматически, и освоение этого продукта – наша сегодняшняя задача.

С 2003 года Национальная библиотека активно принимает участие в совместном проекте с ПетрГУ по созданию Открытой Электронной библиотеки Республики Карелия.

На сегодняшний момент оцифровано более 200 редких и краеведческих документов из фондов нашей библиотеки (это околостраниц). В том числе - 17 рукописей. Электронные копии хранятся на сервере библиотеки, и все пользователи могут с ними свободно ознакомиться в Электронной библиотеке РК и на сайтах, поддерживаемых НБ РК.

Работу по оцифровке в НБ РК условно можно разделить на следующие этапы.

1 этап – отбор документов

2 этап – определение способа оцифровки, подготовка документов.

3 этап - создание электронной копии в формате.

4 этап – подготовка электронной копии к web-публикации

5 этап – регистрация и публикация электронных копий в информационных ресурсах.

1-й этап – отбор документов для плановой оцифровки.

Поэтому очень важно тщательно подходить к отбору документов для создания электронной копии. Специалистами нашей библиотеки выделены следующие категории документов для оцифровки. Это:

·  редкие краеведческие издания,

·  архивные экземпляры,

·  редкие, особо ценные, ветхие издания фонда редкой книги,

·  краеведческие издания, ценные, повышенного спроса, малоэкземплярные, ветхие,

·  издания, имеющиеся в библиотеке в ограниченном количестве экземпляров,

·  электронные копии по запросам пользователей.

Также определены принципы отбора документов, в соответствии с которыми:

·  Каждый выбранный документ должен представлять собой культурную ценность.

·  Бесспорно приоритетный признак – особая редкость документа и повышенная опасность его физического разрушения, утраты.

·  Для краеведческих книг важны национальная выразительность и достоверность. Документ должен нести информацию об истории, культуре, особенностях жизни региона.

В соответствии с вышеизложенными требованиями ежегодно специалистами библиотеки составляется план по оцифровке, который утверждается директором НБ РК.

2-й этап – определение способа оцифровки, подготовка документов.

Копирование отрицательно сказывается на физическом состоянии оригиналов, поэтому перевод документов в цифровой формат необходимо осуществлять с осторожностью. Существует ряд требований, предъявляемых к комплексам для создания цифровых архивов музейных и библиотечных фондов, а именно:

·  Недопустимость использования сильных источников светового и теплового воздействия на оригиналы.

·  Недопустимость каких-либо механических воздействий на оригиналы при сканировании;

·  Возможность оцифровки не только плоских оригиналов, но и объемных;

·  Высокая точность цветопередачи;

·  Высокая информационная емкость и физическое разрешение при сканировании;

·  Мобильность.

Для перевода оригинала в цифровой формат в НБ РК использовались 2 способа: 1) постраничное сканирование с помощью планшетного сканера и 2) постраничное копирование с помощью цифровой фотокамеры. С 2009 г. по договору с Спасо-Кижским Патриаршим подворьем появилась возможность оцифровывать документы с помощью книжного планетарного сканера.

Выбор способа оцифровывания каждого документа осуществляется дифференцировано.

Рукописные документы и печатные издания до 1830 г. издания, а также документы, находящиеся в плохом физическом состоянии, оцифровываются исключительно бесконтактным способом с помощью цифровой фотокамеры или на планетарном сканере.

Использование планшетного сканера допускается в случае, если документ многотиражный, и в библиотеке он представлен двумя и более экземплярами. На планшетном сканере допустима также работа с документами более позднего года издания, находящимися в хорошем физическом состоянии. Некоторые редкие документы имеют ксерокопию. В этом случае оцифровка выполняется именно с нее.

Вопрос с оцифровкой документов, пользующихся повышенным спросом, но находящихся в неудовлетворительном физическом состоянии, решается в индивидуальном порядке. Такой документ может быть оцифрован, если есть возможность его реставрации или консервации в ближайшие сроки после копирования.

Создание электронной копии издания – процесс трудоемкий и дорогостоящий, непосредственно перед оцифровкой документа, представленного в фонде несколькими экземплярами, необходимо просмотреть все имеющиеся и выбрать наиболее подходящий экземпляр для создания качественной копии.

Когда появляется возможность доступа к электронной версии документа, выдача оригинала, в целях сохранности, ограничивается, а то и вовсе исключается.

3-й этап - создание электронной копии в формате jpg (сканирование, фотографирование). Для получения качественного изображения производится постраничная оцифровка. Графические файлы позволяют представить скопированный документ в почти первоначальном виде, что обеспечивает полноценное и равновесное соблюдение основополагающих требований сохранности и доступности. Мы придерживаемся принципа факсимильности и не ставили задачей распознавать текст, но в перспективе, как уже было отмечено, будет вестись работа в этом направлении.

Большая часть электронных копий была сделана с помощью цифровых фотоаппаратов с использованием штативов и ламп освещения, но без «книжной колыбели». С апреля 2009 года у нас появилась возможность делать копии на книжном сканере I2s CopуBook. На экране представлены изображения, полученные при использовании этих способов оцифровки.

Фотосъемка в настоящий момент является самым доступным в финансовом отношении, но содержит ряд сложностей. При установке осветительных приборов для съемки необходимы условия, при которых используется не прямой, а отраженный световой поток, т. е. не прямо направленный непосредственно на документ.

В целом скорость фотографирования составляет от 5 до 10 страниц в минуту, что гораздо выше скорости сканирования на планшетном сканере. Теоретически, отснятые кадры должны содержать черный текст на белом фоне, но т. к. мы в основном фотографируем старые документы, то на выходе имеем черно-коричневй текст на красно-бежевых страницах. Часто состояние переплета и толщина книги не позволяют раскрыть документ на угол, необходимый для качественной съемки, в результате чего получаются изображения с искажениями, размытиями, бликами и затемнённой областью в корешковых полях книги. Символы, попавшие в эту область, труднодоступны для прочтения и корректировки. Часто копии страниц толстых книг получаются трапециевидными. Искажения и другие дефекты изображения в большинстве случаев можно исправить в графических редакторах, однако это является очень трудоемким процессом. Также затруднительно сделать качественные фотокопии с документов большого формата.

В целом, нужно отметить, что при определенном усовершенствовании рабочего места, как то: наличие универсальных штативов для крепления фотоаппарата; равномерная хорошая подсветка; «книжная колыбель» для размещения книг, можно изготавливать достаточно качественные копии документов. Мобильность цифровой фотокамеры, позволяющая снимать практически где угодно, и доступная цена перевешивают некоторые недостатки ее использования.

Быструю, удобную и, самое главное, щадящую оцифровку документов обеспечивает планетарный сканер. Бесконтактный метод сканирования, при котором оригинал неподвижен и располагается лицевой стороной вверх на значительном удалении относительно оптической системы, автоматическая книжная колыбель с прижимным стеклом, создают наиболее оптимальные условия для оригиналов.

Возможности CopуBook позволяют оцифровывать документы, различные по формату (до А2), объему и физическому состоянию. При сканировании оригинал свободно лежит на рабочем столе, и оператор только переворачивает страницы, как при чтении книги. Время сканирования книжного разворота составляет от 2,5 до 7 секунд, при этом возможно кадрирование и сохранение каждой страницы отдельным файлом. Данная опция позволяют значительно ускорить процесс оцифровки. Так за 8 рабочих дней было оцифровано 49 книг из 89, запланированных на год.

На планетарном сканере можно делать черно-белые, полутоновые и цветные копии документов. Все рукописные издания были отсканированы в цвете. Для оцифровки нецветных документов, на наш взгляд, самым оптимальным является полутоновой режим сканирования. Он обеспечивает создание копий, для которых дальнейшая обработка в графических редакторах значительно упрощается.

Планетарный сканер снабжен технологиями, автоматически улучшающими качество изображения. Это: автоматическая фокусировка, цветокоррекция, обрезка по формату, исправление кривизны книжных страниц, устранение наклона, выравнивание текста, очистку от мелких дефектов изображения, маскирование пальцев и многое другое. Но несмотря на это, практика показала, что весьма часто возникают различного рода искажения изображения. Наиболее распространенные из которых - искажения в форме трапеции, параллелограмма, клина и в форме волны, некоторые из них вы видите на экране.

Основная причина появления искажений связана с тем, что оптические элементы сканеров очень чувствительны к положению сканируемых объектов. В идеале при сканировании документ должен располагаться строго параллельно поверхности рабочего стола планетарного сканера, на практике (даже при использовании прижимного стекла и книжной колыбели) такого результата добиться очень сложно.

Отметим, что книжная колыбель при всем ее удобстве не позволяет сделать качественные копии с объемного издания, имеющего небольшие корешковые поля. Подтверждением этому является центральная иллюстрация на слайде. Для таких изданий, на наш взгляд, подошла бы V-образная колыбель, позволяющая раскрывать книгу не полностью.

4-й этап – подготовка электронной копии к web-публикации.

Для дальнейшего размещения электронной копии документа на информационном ресурсе полученные изображения проходят обязательную обработку в графических редакторах. Устанавливаются определенные размеры, производится кадрирование. В дальнейшем изображение может не подвергаться дополнительной обработке, но чаще следует графическая редакция (перевод в черно-белый формат, очищение от шума, удаление помарок и т. п.). Это позволяет улучшить качество изображения, уменьшить размер файла.

Для каждого файла оцифрованного документа создается уменьшенная копия. Это дает возможность пользователям просмотреть страницу, как в миниатюре, так и в увлеченном масштабе, который удобен для подробного прочтения текста.

Затем все файлы, поименованные по заданным правилам и подобранные в порядке следования страниц оригинала, выкладываются на ftp-сервере НБ РК.

5 этап – регистрация и публикация электронных копий в информационных ресурсах.

После размещения файлов на сервере библиотеки с определенных сайтов открывается доступ к электронной копии документа.

Для обеспечения поиска издания в ЭБ РК заполняются поля навигационной метаинформации, практически вручную переносится оглавление с гиперссылками на файлы соответствующих страниц.

Вся информация о размещенной цифровой копии отражается в электронном каталоге НБ РК. Специалисты Центра каталогизации библиотечных фондов создают библиографическое описание электронного документа, где указывается связь с описанием на печатное издание и дается ссылка на полный текст.

Доступ к оцифрованным документам возможен с нескольких сайтов.

Это:

- Сайт Национальной библиотеки Республики Карелия (http://library. *****). Здесь в разделе «Рукописные книги» представлено 17 рукописей с палеографическим описанием.

- Сайт Финно-Угорские библиотеки России (http://fulr. *****/), где размещены документы на национальных языках

И Электронная библиотека Республики Карелия (http://elibrary. *****/), где публикуется основной массив оцифрованных изданий.

Мы считаем целесообразным, когда к одной электронной копии осуществляется доступ с нескольких сайтов. К примеру, первое издание «Калевалы» на финском языке изначально было размещено в ЭБ РК. В дальнейшем доступ к этому документу стал возможен и с портала «Финно-угорские библиотеки России», что значительно увеличило количество обращений к этому памятнику.

К сожалению, не все пользователи имеют выход в Интернет, и здесь стоит задуматься о том, как им предоставить возможность ознакомиться с оцифрованными изданиями. Здесь стоит отметить работу, проведенную в гг. совместно с Министерством по вопросам национальной политики и связям с религиозными объединениями Республики Карелии. В рамках реализации республиканской целевой программы «Государственная поддержка карельского, вепсского и финского языков» мы создали три диска «Электронная библиотека на национальных языках Республики Карелия», включивших электронные копии редких документов на карельском и вепсском языках, материалы периодической печати ХIХ–нач. ХХвв., научные труды исследователей, краеведческие публикации.

Большим плюсом этой работы можно считать тот факт, что в местах традиционного проживания коренного населения, появилась возможность ознакомиться с документами на родных языках. Практика показала, что выпуски «Электронной библиотеки» необходимы в каждой муниципальной библиотеке.

В заключении еще раз хочется отметить, что оцифровка документов – дело дорогое, трудоёмкое, но необходимое для сохранения библиотечных фондов и обеспечения доступа к информационным ресурсам библиотек.