Технология оцифровки изданий в Национальной библиотеке Республики Карелия
,
,
Национальная библиотека Республики Карелия
Сегодня тенденции в области сохранения и безопасности библиотечных фондов невозможно представить без использования новых информационных технологий. И одним из перспективных направлений деятельности библиотек является создание электронных, или цифровых, коллекций.
Основной целью нашей работы в этом направлении являются повышение эффективности и оперативности обслуживания пользователей на основе расширения доступа к краеведческим и редким документам, хранящихся в фондах НБ РК, и сохранение документального наследия республики как части культурного достояния России.
Одним из методов перевода содержания документов, использующих такие нововведения, является оцифровка. Оцифровка – это способ получения и хранения документов средствами компьютерных технологий. Оцифрованные копии могут храниться на дисках, а также в электронных базах данных и электронных библиотеках.
Первые шаги в этом направлении Национальная библиотека сделала ровно 10 лет назад, и они были продиктованы желанием сохранить и обеспечить открытый доступ читателей к наиболее ценным печатным и рукописным документам из фондов редкой книги и отдела краеведческой и национальной литературы.
В 1999 году на сайте библиотеки было размещена первая электронная копия - рукопись из фондов библиотеки «Соловецкий летописец» (список второй половины XVIII века). В виду особой исторической значимости текст «Летописца» представлен в современной орфографии (в соответствии с требованиями, предъявляемыми к публикациям средневековых текстов). Несомненно, такой способ создания электронного издания представляет научную ценность, но не может быть широко распространен, т. к. требует огромных трудовых затрат, профессиональных знаний и специальных навыков.
Создание электронных копий рукописей из фонда редких книг стало одним из важных направлений в работе.
С 2000 года в рамках республиканской программы «Память Карелии» начинается работа по оцифровке редких краеведческих книг. Переводится в электронный вид книга «Описание Олонецкой губернии» 1842 года издания – первое подробное описание нашего края, издание, пользующееся большим читательским спросом. Работа по оцифровке этого документа была долгой и кропотливой и велась в течение года. Это был первый опыт по распознаванию изображения со старорусской орфографией на символы современного русского языка для полнотекстового поиска. В настоящее время существует программное обеспечение, позволяющее это делать автоматически, и освоение этого продукта – наша сегодняшняя задача.
С 2003 года Национальная библиотека активно принимает участие в совместном проекте с ПетрГУ по созданию Открытой Электронной библиотеки Республики Карелия.
На сегодняшний момент оцифровано более 200 редких и краеведческих документов из фондов нашей библиотеки (это околостраниц). В том числе - 17 рукописей. Электронные копии хранятся на сервере библиотеки, и все пользователи могут с ними свободно ознакомиться в Электронной библиотеке РК и на сайтах, поддерживаемых НБ РК.
Работу по оцифровке в НБ РК условно можно разделить на следующие этапы.
1 этап – отбор документов
2 этап – определение способа оцифровки, подготовка документов.
3 этап - создание электронной копии в формате.
4 этап – подготовка электронной копии к web-публикации
5 этап – регистрация и публикация электронных копий в информационных ресурсах.
1-й этап – отбор документов для плановой оцифровки.
Поэтому очень важно тщательно подходить к отбору документов для создания электронной копии. Специалистами нашей библиотеки выделены следующие категории документов для оцифровки. Это:
· редкие краеведческие издания,
· архивные экземпляры,
· редкие, особо ценные, ветхие издания фонда редкой книги,
· краеведческие издания, ценные, повышенного спроса, малоэкземплярные, ветхие,
· издания, имеющиеся в библиотеке в ограниченном количестве экземпляров,
· электронные копии по запросам пользователей.
Также определены принципы отбора документов, в соответствии с которыми:
· Каждый выбранный документ должен представлять собой культурную ценность.
· Бесспорно приоритетный признак – особая редкость документа и повышенная опасность его физического разрушения, утраты.
· Для краеведческих книг важны национальная выразительность и достоверность. Документ должен нести информацию об истории, культуре, особенностях жизни региона.
В соответствии с вышеизложенными требованиями ежегодно специалистами библиотеки составляется план по оцифровке, который утверждается директором НБ РК.
2-й этап – определение способа оцифровки, подготовка документов.
Копирование отрицательно сказывается на физическом состоянии оригиналов, поэтому перевод документов в цифровой формат необходимо осуществлять с осторожностью. Существует ряд требований, предъявляемых к комплексам для создания цифровых архивов музейных и библиотечных фондов, а именно:
· Недопустимость использования сильных источников светового и теплового воздействия на оригиналы.
· Недопустимость каких-либо механических воздействий на оригиналы при сканировании;
· Возможность оцифровки не только плоских оригиналов, но и объемных;
· Высокая точность цветопередачи;
· Высокая информационная емкость и физическое разрешение при сканировании;
· Мобильность.
Для перевода оригинала в цифровой формат в НБ РК использовались 2 способа: 1) постраничное сканирование с помощью планшетного сканера и 2) постраничное копирование с помощью цифровой фотокамеры. С 2009 г. по договору с Спасо-Кижским Патриаршим подворьем появилась возможность оцифровывать документы с помощью книжного планетарного сканера.
Выбор способа оцифровывания каждого документа осуществляется дифференцировано.
Рукописные документы и печатные издания до 1830 г. издания, а также документы, находящиеся в плохом физическом состоянии, оцифровываются исключительно бесконтактным способом с помощью цифровой фотокамеры или на планетарном сканере.
Использование планшетного сканера допускается в случае, если документ многотиражный, и в библиотеке он представлен двумя и более экземплярами. На планшетном сканере допустима также работа с документами более позднего года издания, находящимися в хорошем физическом состоянии. Некоторые редкие документы имеют ксерокопию. В этом случае оцифровка выполняется именно с нее.
Вопрос с оцифровкой документов, пользующихся повышенным спросом, но находящихся в неудовлетворительном физическом состоянии, решается в индивидуальном порядке. Такой документ может быть оцифрован, если есть возможность его реставрации или консервации в ближайшие сроки после копирования.
Создание электронной копии издания – процесс трудоемкий и дорогостоящий, непосредственно перед оцифровкой документа, представленного в фонде несколькими экземплярами, необходимо просмотреть все имеющиеся и выбрать наиболее подходящий экземпляр для создания качественной копии.
Когда появляется возможность доступа к электронной версии документа, выдача оригинала, в целях сохранности, ограничивается, а то и вовсе исключается.
3-й этап - создание электронной копии в формате jpg (сканирование, фотографирование). Для получения качественного изображения производится постраничная оцифровка. Графические файлы позволяют представить скопированный документ в почти первоначальном виде, что обеспечивает полноценное и равновесное соблюдение основополагающих требований сохранности и доступности. Мы придерживаемся принципа факсимильности и не ставили задачей распознавать текст, но в перспективе, как уже было отмечено, будет вестись работа в этом направлении.
Большая часть электронных копий была сделана с помощью цифровых фотоаппаратов с использованием штативов и ламп освещения, но без «книжной колыбели». С апреля 2009 года у нас появилась возможность делать копии на книжном сканере I2s CopуBook. На экране представлены изображения, полученные при использовании этих способов оцифровки.
Фотосъемка в настоящий момент является самым доступным в финансовом отношении, но содержит ряд сложностей. При установке осветительных приборов для съемки необходимы условия, при которых используется не прямой, а отраженный световой поток, т. е. не прямо направленный непосредственно на документ.
В целом скорость фотографирования составляет от 5 до 10 страниц в минуту, что гораздо выше скорости сканирования на планшетном сканере. Теоретически, отснятые кадры должны содержать черный текст на белом фоне, но т. к. мы в основном фотографируем старые документы, то на выходе имеем черно-коричневй текст на красно-бежевых страницах. Часто состояние переплета и толщина книги не позволяют раскрыть документ на угол, необходимый для качественной съемки, в результате чего получаются изображения с искажениями, размытиями, бликами и затемнённой областью в корешковых полях книги. Символы, попавшие в эту область, труднодоступны для прочтения и корректировки. Часто копии страниц толстых книг получаются трапециевидными. Искажения и другие дефекты изображения в большинстве случаев можно исправить в графических редакторах, однако это является очень трудоемким процессом. Также затруднительно сделать качественные фотокопии с документов большого формата.
В целом, нужно отметить, что при определенном усовершенствовании рабочего места, как то: наличие универсальных штативов для крепления фотоаппарата; равномерная хорошая подсветка; «книжная колыбель» для размещения книг, можно изготавливать достаточно качественные копии документов. Мобильность цифровой фотокамеры, позволяющая снимать практически где угодно, и доступная цена перевешивают некоторые недостатки ее использования.
Быструю, удобную и, самое главное, щадящую оцифровку документов обеспечивает планетарный сканер. Бесконтактный метод сканирования, при котором оригинал неподвижен и располагается лицевой стороной вверх на значительном удалении относительно оптической системы, автоматическая книжная колыбель с прижимным стеклом, создают наиболее оптимальные условия для оригиналов.
Возможности CopуBook позволяют оцифровывать документы, различные по формату (до А2), объему и физическому состоянию. При сканировании оригинал свободно лежит на рабочем столе, и оператор только переворачивает страницы, как при чтении книги. Время сканирования книжного разворота составляет от 2,5 до 7 секунд, при этом возможно кадрирование и сохранение каждой страницы отдельным файлом. Данная опция позволяют значительно ускорить процесс оцифровки. Так за 8 рабочих дней было оцифровано 49 книг из 89, запланированных на год.
На планетарном сканере можно делать черно-белые, полутоновые и цветные копии документов. Все рукописные издания были отсканированы в цвете. Для оцифровки нецветных документов, на наш взгляд, самым оптимальным является полутоновой режим сканирования. Он обеспечивает создание копий, для которых дальнейшая обработка в графических редакторах значительно упрощается.
Планетарный сканер снабжен технологиями, автоматически улучшающими качество изображения. Это: автоматическая фокусировка, цветокоррекция, обрезка по формату, исправление кривизны книжных страниц, устранение наклона, выравнивание текста, очистку от мелких дефектов изображения, маскирование пальцев и многое другое. Но несмотря на это, практика показала, что весьма часто возникают различного рода искажения изображения. Наиболее распространенные из которых - искажения в форме трапеции, параллелограмма, клина и в форме волны, некоторые из них вы видите на экране.
Основная причина появления искажений связана с тем, что оптические элементы сканеров очень чувствительны к положению сканируемых объектов. В идеале при сканировании документ должен располагаться строго параллельно поверхности рабочего стола планетарного сканера, на практике (даже при использовании прижимного стекла и книжной колыбели) такого результата добиться очень сложно.
Отметим, что книжная колыбель при всем ее удобстве не позволяет сделать качественные копии с объемного издания, имеющего небольшие корешковые поля. Подтверждением этому является центральная иллюстрация на слайде. Для таких изданий, на наш взгляд, подошла бы V-образная колыбель, позволяющая раскрывать книгу не полностью.
4-й этап – подготовка электронной копии к web-публикации.
Для дальнейшего размещения электронной копии документа на информационном ресурсе полученные изображения проходят обязательную обработку в графических редакторах. Устанавливаются определенные размеры, производится кадрирование. В дальнейшем изображение может не подвергаться дополнительной обработке, но чаще следует графическая редакция (перевод в черно-белый формат, очищение от шума, удаление помарок и т. п.). Это позволяет улучшить качество изображения, уменьшить размер файла.
Для каждого файла оцифрованного документа создается уменьшенная копия. Это дает возможность пользователям просмотреть страницу, как в миниатюре, так и в увлеченном масштабе, который удобен для подробного прочтения текста.
Затем все файлы, поименованные по заданным правилам и подобранные в порядке следования страниц оригинала, выкладываются на ftp-сервере НБ РК.
5 этап – регистрация и публикация электронных копий в информационных ресурсах.
После размещения файлов на сервере библиотеки с определенных сайтов открывается доступ к электронной копии документа.
Для обеспечения поиска издания в ЭБ РК заполняются поля навигационной метаинформации, практически вручную переносится оглавление с гиперссылками на файлы соответствующих страниц.
Вся информация о размещенной цифровой копии отражается в электронном каталоге НБ РК. Специалисты Центра каталогизации библиотечных фондов создают библиографическое описание электронного документа, где указывается связь с описанием на печатное издание и дается ссылка на полный текст.
Доступ к оцифрованным документам возможен с нескольких сайтов.
Это:
- Сайт Национальной библиотеки Республики Карелия (http://library. *****). Здесь в разделе «Рукописные книги» представлено 17 рукописей с палеографическим описанием.
- Сайт Финно-Угорские библиотеки России (http://fulr. *****/), где размещены документы на национальных языках
И Электронная библиотека Республики Карелия (http://elibrary. *****/), где публикуется основной массив оцифрованных изданий.
Мы считаем целесообразным, когда к одной электронной копии осуществляется доступ с нескольких сайтов. К примеру, первое издание «Калевалы» на финском языке изначально было размещено в ЭБ РК. В дальнейшем доступ к этому документу стал возможен и с портала «Финно-угорские библиотеки России», что значительно увеличило количество обращений к этому памятнику.
К сожалению, не все пользователи имеют выход в Интернет, и здесь стоит задуматься о том, как им предоставить возможность ознакомиться с оцифрованными изданиями. Здесь стоит отметить работу, проведенную в гг. совместно с Министерством по вопросам национальной политики и связям с религиозными объединениями Республики Карелии. В рамках реализации республиканской целевой программы «Государственная поддержка карельского, вепсского и финского языков» мы создали три диска «Электронная библиотека на национальных языках Республики Карелия», включивших электронные копии редких документов на карельском и вепсском языках, материалы периодической печати ХIХ–нач. ХХвв., научные труды исследователей, краеведческие публикации.
Большим плюсом этой работы можно считать тот факт, что в местах традиционного проживания коренного населения, появилась возможность ознакомиться с документами на родных языках. Практика показала, что выпуски «Электронной библиотеки» необходимы в каждой муниципальной библиотеке.
В заключении еще раз хочется отметить, что оцифровка документов – дело дорогое, трудоёмкое, но необходимое для сохранения библиотечных фондов и обеспечения доступа к информационным ресурсам библиотек.



