Информационные системы и автоматизированные архивные технологии: становление и эволюция (к 50-летию НИЦТД СССР – РГАНТД)
- Авторы: Залаев Г.З.1
-
Учреждения:
- Российский государственный архив научно-технической документации (РГАНТД)
- Выпуск: № 3 (2024)
- Страницы: 92-101
- Раздел: Из опыта работы архивных учреждений и организаций
- URL: https://bakhtiniada.ru/2619-1601/article/view/276974
- ID: 276974
Цитировать
Полный текст
Аннотация
Представлен обзор научно-исследовательской работы по созданию автоматизированных информационно-поисковых систем и архивных технологий, проводимой в НИЦТД СССР и РГАНТД. Описаны принципы построения АИПС на документы Государственного архивного фонда. Проведен анализ проектов НИЦТД СССР по созданию ранее малоизвестных информационных систем.
Полный текст
Работы по разработке и внедрению в практику архивной деятельности автоматизированных информационно-поисковых систем (АИПС) начались в 1976 году. Постановлением Государственного комитета по науке и технике (ГКНТ) Совета министров СССР от 26 ноября 1976 года № 430 в пятилетний план научно-исследовательских работ Главархива СССР была включена тема по созданию автоматизированной системы научно-технической информации по документам Государственного архивного фонда (ГАФ СССР) как части Государственной системы научно-технической информации с целью наиболее эффективного использования документов ГАФ СССР в интересах народного хозяйства, науки и культуры.
Работы по этой теме были поручены Научно-исследовательскому центру технической документации (НИЦТД) СССР[1].
Для решения поставленной задачи в НИЦТД СССР был создан Вычислительный центр, оснащенный ЭВМ ЕС-1022 с развитой периферией, включающей в себя накопители в максимальной комплектации на магнитных дисках и на магнитной ленте, устройства ввода/вывода информации, устройства подготовки данных для ввода в ЭВМ. Для ввода информации в базу данных наряду с типовыми устройствами ввода данных в АИПС того времени использовалась система распознавания текста – оптическое читающее устройство (ОЧУ) фирмы IBM. Использование системы распознавания текстов для ввода данных на начало 1980-х годов являлось новаторским.
Проведенные специалистами НИЦТД СССР (отделов 23 и 24) исследования позволили разработать принципы проектирования АИПС на документы ГАФ СССР:
- Однократный ввод информации при ее многократном использовании.
- Единая технология обработки информации в автоматизированных информационно-поисковых системах различных тематических комплексов архивных документов.
- Единое программное обеспечение для различных тематических комплексов.
Результаты проведенных исследований нашли отражение в кандидатских диссертациях А.С. Шапошникова, Г.З. Залаева (технические науки) и Г.А. Медведевой (исторические науки), а также в целом ряде статей специалистов НИЦТД СССР.
В начале 1980-х годов в НИЦТД СССР были разработаны и введены в эксплуатацию автоматизированные информационно-поисковые системы [1–12] на три тематических комплекса архивных документов:
АИПС «История освоения космического пространства»;
АИПС «История архитектуры и градостроительства Москвы, Петербурга и их пригородов»;
АИПС «Документы Октябрьской революции».
АИПС «История освоения космического пространства» – это информационная система, которая работала с описаниями аудиовизуальных документов фондов НИЦТД СССР, в особенности с поливидовым составом документов (документация НИОКР, фото-, фоно-, кино- и видеодокументы). В базу данных АИПС загружались описания документов, которые готовились на специальных рабочих листах. В рабочие листы вносилась информация в зависимости от вида документа и ключевые слова для обеспечения быстрого информационного поиска. C рабочих листов производился ввод информации в базу данных АИПС.
АИПС «История архитектуры и градостроительства Москвы, Петербурга и их пригородов» – это информационная система, которая содержит описания документов из различных федеральных архивов, а также архивов Москвы и Санкт-Петербурга [6, 7, 10]. Идея создания подобной системы принадлежала заведующему отделом Российского государственного исторического архива (РГИА), кандидату исторических наук Д.И. Раскину, а директор НИЦТД СССР О.А. Михайлов эту идею поддержал.
База данных АИПС «Документы Октябрьской революции» содержала документы из Центрального государственного архива Октябрьской Революции (ЦГАОР СССР)[2].
В 1984 году НИЦТД СССР приступил к разработке системы автоматического индексирования описаний документов [13, 14], а в начале 1990-х годов начал внедрять в практику работы персональные компьютеры.
Базы данных указанных АИПС были переведены на новую программную и техническую платформы. В качестве программной платформы был выбран пакет прикладных программ CDS ISIS/M, который был разработан Департаментом развития и применения программного обеспечения бюро информационных программ и служб ЮНЕСКО для создания автоматизированных информационных систем в архивах и библиотеках [9]. В качестве технической платформы использовались персональные компьютеры. Специалистам НИЦТД потребовалось около года для разработки технического интерфейса, который совмещал накопитель на магнитной ленте ЕС ЭВМ с персональным компьютером, а также программного конвертора для переконвертирования баз данных АИПС из системы АИДОС в систему CDS ISIS/M. Задача усложнялась еще и различием кодировок символов в системах ЕС ЭВМ и персональных компьютеров.
Приобретение НИЦТД СССР сканирующего оборудования позволило приступить к оцифровке архивных документов и разработке проектов информационных систем, которые могли предоставлять исследователям в дополнение к описаниям документов еще и их цифровые копии [15–18]. Так, в 1992–1993 годах НИЦТД СССР реализовал проект по оцифровке документов из фонда «Вирт Йозеф[3] – государственный канцлер Германии» Российского центра хранения историко-документальных коллекций. Целью разработки такой информационной системы являлись разработка и апробация подходов к созданию информационных систем, работающих с цифровыми копиями архивных документов. При этом решались следующие задачи:
- разработка технологии создания полнотекстовых информационных систем на оптических дисках;
- выбор формата хранения архивных документов на оптических дисках;
- апробация записи архивных документов на оптические диски;
- разработка технологии построения системы информационного поиска и сопряжения записей базы данных с массивом цифровых копий документов.
В рамках проекта было оцифровано 282 дела, 14 362 документа, в том числе 455 фотографий, рисунков и гравюр.
При обработке многостраничных документов каждая страница сканировалась в отдельный файл. Имя файла цифровой копии формировалось по следующей схеме:
<Имя файла цифровой копии>::= < aaaaaa> <bb>, где aaaaaa – архивный номер документа, bb – порядковый номер страницы.
Такой подход позволял связывать цифровые копии страниц в единый цифровой документ.
Недостатком технологии информационной системы «Вирт Йозеф – государственный канцлер Германии» являлось отсутствие связи описаний документов в базе данных с цифровыми копиями документов. Пользователь мог или просматривать изображения документов, или отбирать и читать описания документов. В дальнейшем этот технический недостаток был устранен при разработке Российским государственным архивом научно-технической документации (РГАНТД) информационно-поисковой системы, включающей цифровые копии фотодокументов, связанных с жизнью и деятельностью первого космонавта Ю.А. Гагарина. База данных системы была сформирована из описаний фотодокументов, на которых присутствовало изображение Ю.А. Гагарина, содержащихся в базе данных АИПС «История освоения космического пространства».
Во входном формате базы данных было добавлено новое поле – «имя файла цифровой копии». Размещенная в этом поле информация устанавливала связи между цифровыми копиями фотодокументов, записанными на оптических дисках, и поисковой системой, содержащей описания документов, что позволило исследователю при информационном поиске в базе данных АИПС получать не только описание фотодокумента, но и его оцифрованную копию на экране монитора.
В связи с этим было разработано специальное программное обеспечение для визуализации цифровых копий, а также для связывания имени цифровой копии с соответствующей записью базы данных. В качестве имени цифровой копии был выбран архивный номер документа, который однозначно определяет архивный документ.
Важным этапом в развитии автоматизированных информационных систем в РГАНТД стала разработка АИПС на аудиовизуальные документы с их цифровыми копиями для фотодокументов.
АИПС на аудиовизуальные документы с их цифровыми копиями для фотодокументов (АИПС ЦКД) разработана на основании соответствующих концепции и технического задания и представляет собой информационную систему, обеспечивающую поиск информации и визуализации в цифровом виде фотодокументов, а также хранения описаний документов и их цифровых копий. В рамках реализованной архитектуры «клиент – сервер» серверная часть состоит из базы данных и веб-приложения, доступного пользователю через веб-интерфейс. Функционал серверной части системы реализуется за счет использования программного обеспечения Microsoft Net Framework 2.0, Microsoft Information Services 5.0.
Клиентские устройства обращаются к серверу по интернет-протоколу HTTP через браузер Microsoft Internet Explorer 5.5.
В качестве программного обеспечения базы данных используется система управления базами данных (СУБД) Microsoft SQL Server 2000.
Для управления правами доступа пользователей к базе данных АИПС ЦКД применяется встроенная в СУБД Microsoft SQL Server 2000 система безопасности.
АИПС ЦКД состоит из четырех функциональных блоков:
- Система ввода, поиска, выдачи информации, ведения словарей и визуализации цифровых копий фотодокументов.
- Система загрузки цифровых копий в форматах TIF и JPEG.
- Система загрузки ISO-файлов[4].
- Система установки блоков загрузки данных.
АИПС ЦКД является многопользовательской системой и ориентирована на работу в локальной сети. В зависимости от роли, которая присвоена пользователю, АИПС ЦКД работает в одном из двух режимов: «только чтение информации» либо «редактирование информации».
В режиме «только чтение информации» осуществляются поиск документов, просмотр и сохранение их данных, а также просмотр цифровых копий в сжатом виде в формате JPEG.
В режиме «редактирование информации», помимо функций режима «только чтения информации», осуществляются функции создания новых и изменения существующих описаний документов; удаления описаний документов, добавления/изменения/удаления цифровых копий; получения полноразмерных цифровых копий в формате JPEG/TIFF, а также управления словарями дополнительных объектов.
Поиск документов является основной функцией АИПС ЦКД и осуществляется методами:
- поиска по текстовым полям;
- поиска по номеру документа в системе;
- поиска по словарям.
При вводе в эксплуатацию в АИПС ЦКД была загружена полностью база данных описаний фотодокументов из АИПС «История освоения космического пространства» (65 тыс. ОД) и более 4 тыс. цифровых копий.
Следующим важным направлением деятельности в развитии автоматизированных информационных систем в РГАНТД стало создание информационных ресурсов в сети «Интернет», связанных с историей освоения космического пространства, базирующихся на коллекциях архива. Одним из первых среди федеральных архивов РГАНТД создал свой сайт и разместил на нем фотокаталог с описаниями и цифровыми копиями фотодокументов и кинокаталог с описаниями кинодокументов (2000–2001) [19–21].
В 2018 году в РГАНТД отказались от собственных разработок информационных систем. Было принято решение выбрать платформу для АИПС РГАНТД из существующих предложений на рынке. После проведенного мониторинга и анализа специалистами архива среди различных программных платформ был выбран программно-информационный комплекс «КАИСА-Архив».
С появлением и развитием информационно-коммуникационных технологий специалисты РГАНТД начинают разрабатывать автоматизированные архивные технологии (ААТ) различного назначения и внедрять их в деятельность архива, среди них:
- ААТ «Подготовка описей архивных документов»;
- ААТ «Учет физико-химического состояния архивных документов»;
- ААТ «Учет фонодокументов на оптических дисках».
Быстрое моральное и техническое устаревание аппаратных и программных средств, а также бурное развитие цифровых технологий не позволяют с большой точностью «нарисовать движение вверх», однако, проследив и проанализировав эволюцию развития автоматизированных информационных систем в архивах, а также осмыслив применение современных информационных технологий в архивной деятельности, можно с большой долей вероятности определить перспективы их развития.
Уже сейчас можно выделить такие направления, как внедрение систем искусственного интеллекта в архивах, поиск по изображениям и голосу, развитие технологий оцифровки и информационный поиск по технологии «одного входа». Это и есть ближайшее будущее РГАНТД.
[1] С 1995 года – Российский государственный архив научно-технической документации (РГАНТД).
[2] С 1992 года – Государственный архив Российской Федерации (ГА РФ).
[3] Вирт Карл Йозеф (1879–1956) – в 1921–1922 годах возглавлял Рейхсканцлярию Германии. В апреле 1922 года подписал советско-германский Рапалльский договор. После Второй мировой войны выступал против возрождения милитаризма в ФРГ и за установления дружественных отношений с СССР.
[4] ISO-файл — это образ оптического диска, в котором содержится большое количество сжатых файлов и который можно использовать только после его распаковки.
Об авторах
Геннадий Захарович Залаев
Российский государственный архив научно-технической документации (РГАНТД)
Автор, ответственный за переписку.
Email: gzalaev@mail.rgantd.ru
SPIN-код: 1985-7816
доктор технических наук, старший научный сотрудник (ВАК), заместитель директора – научный руководитель
Россия, г. МоскваСписок литературы
- Армадерова Г.Б., Епанешникова Е.К., Залаев Г.З., Корюкина Р.Д., Медведева Г.А., Михайлов О.А. Автоматизированные информационно-поисковые системы в архивах: методическое пособие. М.: Главархив, 1985. 150 с.
- Михайлов О.А. Автоматизированная информационно-поисковая система по архивным документам // Научно-техническая информация. Серия 1. 1985. № 7. С. 8–11.
- Залаев Г.З., Медведева Г.А., Шапошников А.С. Интегральная автоматизированная информационно-поисковая система по архивным документам // Научно-техническая информация. Серия 2. 1985. № 9. С. 8–11.
- Залаев Г.З., Шапошников А.С. Опыт разработки и эксплуатации АИПС на тематические комплексы документов государственных архивов СССР // Архивоведение, археография: Экспресс-информация. 1984. № 4 (31). С. 13–15.
- Михайлов О.А., Шапошников А.С. Разработка и внедрение АИПС на архивные документы ГАФ СССР // Советские архивы. 1982. № 4. С. 27–31.
- Раскин Д.И. Задачи и особенности информационной базы АИПС «История памятников архитектуры и градостроительства Москвы, Ленинграда и их пригородов» // Архивоведение, археография: Экспресс-информация. 1984. № 4 (31). С. 7–11.
- Раскин Д.И., Шапошников А.С., Михайлова В.Г. Информационное и лингвистическое обеспечение АИПС на комплекс документов «История памятников архитектуры и градостроительства» // Советские архивы. 1984. № 4. С. 23–28.
- Шапошников А.С. Основные принципы построения АИПС на документы Государственного архивного фонда СССР // Вопросы информационного обслуживания: межвузовский сборник. М.: МГИАИ, 1983.
- Шапошников А.С., Залаев Г.З., Медведева Г.А. Основные направления компьютеризации в архивах и опыт применения CDS (ISIS) М в РНИЦКД // Совершенствование тематического поиска и реставрации архивных документов на базе компьютерной техники. М.: РНИЦКД, 1993. С. 3–17.
- Шапошников А.С., Раскин Д.И., Михайлова В.Г., Наумова И.М., Парфенова В.А. Автоматизированная информационно-поисковая система на комплекс документов «История памятников архитектуры и градостроиельства Москвы, Ленинграда и их пригородов» // Проблемы физико-химической сохранности, организации отбора, хранения и поиска архивных документов: в 2 ч. М.: Главархив СССР, 1983.
- Михайлов О. Опитъ от подготвяне и въвеждане в експлоатация на автоматизиране информационн-търсещи системи на архивни документи в СССР [Опыт подготовки и внедрения в эксплуатацию автоматизированных информационно-поисковых систем архивных документов в СССР] // Архивен прегляд. 1983. № 1. С. 68–73.
- Михайлов О.А., Крылов Б.В., Шапошников А.С. Основные принципы создания АИПС по архивным документам // Проблемы физико-химической сохранности, организации отбора, хранения и поиска архивных документов: Исследования и методические разработки НИЦТД СССР. М., 1978. С. 66–76.
- Залаев Г.З. Один из подходов к автоматическому индексированию архивных документов ГАФ СССР // Информационно-документационные проблемы ускорения научно-технического прогресса. М.: МГИАИ, 1988.
- Залаев Г.З., Чернышева О.Н. Информационный поиск в тезаурусных и бестезаурусных АИПС на базе ПЭВМ // Развитие автоматизированных и реставрационных систем на космические документы: сборник научных трудов НИЦКД. М.: Главархив, 1992.
- Залаев Г.З. Некоторые вопросы создания электронных архивов // Доклады и тезисы выступлений на третьей Всероссийской конференции (25–26 февраля, 1999). М.: Научная книга, 1999. С. 258–261.
- Залаев Г.З., Шапошников А.С. Некоторые вопросы применения технологии оцифрования в архивном деле // Вторая Всероссийская конференция «Архивоведение и источниковедение отечественной истории. Проблемы взаимодействия на современном этапе»: материалы конференции. М.: ВНИИДАД, 1997. С. 142–144.
- Медведева Г.А., Ржевкин В.Р., Шапошников А.С., Залаев Г.З. Создание экспериментального массива полнотекстовых копий на оптических дисках // Оптические диски и их использование в архивах. М.: ГАС России, РНИЦКД. 1993. С. 42–47.
- Чернин Э.А., Шапошников А.С., Залаев Г.З. и др. Разработка системы страхового копирования архивных документов и фондов пользования на основе современных информационных технологий: отчет о научно-исследовательской работе. М.: ВНИИДАД, 1996.
- Залаев Г.З. Проект по созданию интернет-каталогов архивных кино- и фотодокументов // Техника кино и телевидения. 2003. № 11. С. 42–45.
- Залаев Г.З. Удаленный фонд пользования на основе интернет-каталогов // Вестник архивиста. 2004. № 3–4 (81–82). С. 54–60.
- Залаев Г.З. Концепция удаленного фонда пользования на основе цифрового копирования // Технотронные архивы в современном обществе: наука, образование, наследие: материалы научно-практической конференции, посвященной 10-летию факультета технотронных документов. РГГУ. 2004. С. 106–108.
Дополнительные файлы
