580 likes | 765 Views
Rosetta Система сохранения цифровых объектов 1 7 октября 2012. Сергей Доценко Представитель Ex Libris в Украине. Необходимость в обеспечении сохранности. Необходимость в сохранности цифровых объектов. Если файл не открывается , то возможной причиной является :
E N D
RosettaСистема сохранения цифровых объектов17октября 2012 Сергей Доценко Представитель Ex Librisв Украине.
Необходимость в обеспечении сохранности
Необходимость в сохранности цифровых объектов Если файл не открывается, то возможной причиной является: Повреждение носителя(медиа). Отсутствие соответствующего ПО. Неизвестный формат.
Необходимость в сохранности цифровых объектов • Носители имеют срок жизни • Программы имеют срок жизни • Форматы имеют срок жизни Необходимо обеспечить сохранность всех трех компонентовдля чтения файла.
Необходимость в сохранности цифровых объектов Исследования Цифровые коллекции Медицинские док. Аудио видео Культурное достояние Официальные док. Веб сайты
Вызовы • Принципы сохранения: • Обеспечение целостности данных • 2) Обеспечение сохранности содержания • Действующий формат • Полнота метаданных • Оригинал • 3) Система, соответствующая OAIS
Вызовы – целостность данных • Контрольные суммы показывают изменения или повреждения • Одна из характеристик присущая большинству систем • Не гарантирует доступ к данным, лишь потому, что они не изменялись Первый маленький шаг к сохранности
Вызовы – сохранность содержания • Форматы развиваются быстро и быстро устаревают • Доступность файла • Действующий формат (pdf) • Соответствующее ПО(Acrobat reader) • Анализ рисков по доступности файла • - Библиотека форматов • - Библиотека ПО Важно для сохранности
Вызовы – полнота метаданных • Технические метаданные (т.к. размер, разрешение, компрессияи т.д.) • Метаданные описания(e.g. автор, заглавие, издательствои т.д.) • Метаданные существенны чтобы: • Обеспечить сохранность только необходимым элементам • Знать (в будущем) что именно было • сохранено
Вызовы – Оригинал и производные • Журнал изменений • Кто, что, где, когда, по какой причине создал, изменил, удалили т.д.?? Метаданные, форматы, миграции
Что такое Rosetta? Полноценноерешение, направленное на работу спостоянно растущейнеобходимостью сбора, архивирования и сохраненияоцифрованных и электронных материалов имеющихся в научных, исследовательских и государственных организациях, гарантируяцелостность данныхи доступностьинформации.
Rosetta Timeline • Разработана в партнерстве с Национальной библиотекой Новой Зеландии (интенсивная подготовка ТЗ) • В октябре 2008 запущена в работу в Национальной библиотеке Новой Зеландии • Версия 1.0 была выпущена в Январе 2009 • Экспертная группа по Rosetta – 2010 • Версия 2.2 выпущена в Августе 2011 • Последняя версия 3.0 вышла в июле 2012
Экспертная группа по NDHA • Британская библиотека • Библиотека Корнельского университета • Исследовательский институт Гетте • Национальная библиотека Финляндии • Национальная библиотека Нидерландов • Национальная библиотека Сингапура • Национальная библиотека Китая • Компания Sun Microsystems • Университет Глазго • Йельский университет
Модель OAIS Ex Libris Ltd., 2011 - Internal and Confidential
Масштабируемость Rosetta – основные преимущества Коллективная работа Активное обеспечение сохранности (ActivePreservation) Открытость и интегрируемость Готовая конфигурация Веб интерфейс
Rosetta– коллективное создание БазыЗнаний • Библиотека форматов с метаданными и инструментами извлечения • Глобальная библиотека на основе PRONOM • Ассоциированные с форматами ПО и риски • Возможность интеграции с Глобальной библиотекой • Автоматическое обновление библиотеки
Rosetta– активное обеспечениесохранности • Управление процессом планирования сохранности от возникновения рисков до решений • Оценка и сравнение альтернативных планов • Основана на передовом опыте и рекомендациях • Совместная работа Исполнение Оценка Определение. Operational Storage …… Migration Action Permanent Storage
Rosetta- масштабируемость • Проверенная архитектура способная обрабатывать миллионы файлов. • Выделенные сервер для каждого из этапов • Легкость и гибкость конфигурации
Rosetta– открытость и интеграция АБИС Приложения ввода Rosetta Поисковые машины Хранилища данных Плагины (проверки, конверторы, дополнения, и т.д.)
Rosetta– ввод данных • Различные типы ввода данных • Автоматизированный (ftp, NFS, etc) • Ручной • SDK - позволяет создавать собственные приложения ввода данных. Rosetta ПО автомат.ввода ввода Издатель (например, газета)
Rosetta– интеграция с АБИС • Синхронизация с АБИС • Стандарты SRU и OAI. Другие АБИС
Rosetta– интеграция с поисковиками • Модуль Публикации позволяет обмениваться данными с другими системами • Публикация различных групп объектов в различные форматы • Наличие API’s и SDK для доступа к данным • Встроенные интерфейс OAI …
Rosetta– уровень хранилища Rosetta Уровень хранилища NFS NetApp IBM
Масштабируемость Rosetta – основные преимущества Полноценное Решение по обоспечению сохранности Коллективная работа Активное обеспечение сохранности (ActivePreservation) Открытость и интегрируемость Готовая конфигурация Веб интерфейс
Основные компоненты Rosetta Пользователи Репозитарий Доставка Библиотека форматов Сохранность • Анализ рисков • План сохранения Управление коллекциями Управление процессами
Компоненты Rosetta – пользователи Продюсеры и их агенты Сотрудники • Менеджеры • Посредники, оценщики и модератор • Технический специалист • Редактор • Аналитик по сохранности Администратор Контактные лица
Пользователи Фильтры по различным типам пользователей Список всех пользователей
Добавление пользователя Общая информация Авторизация Роли пользователя
Добавление объекта – Шаг1 Список материалов
Добавление объекта – Шаг2 Список полей.
Добавление объекта – Шаг3 Опции Договор
Добавление объекта – Шаг 4 Загрузка файлов по одному Добавить файл Просмотр/редактирование файлов
Добавление объекта – Шаг 4 Список файлов Файлы для загрузки Просмотр/редактирование файлов
Рабочее окружение Поиск Добавить файл Папки для различных этапов работы • Работа с файлами (редактирование/просмотр)
Основные компоненты Rosetta Пользователи Репозитарий Доставка Библиотека форматов Сохранность • Анализ рисков • План сохранения Управление коллекциями Управление процессами
Компоненты Rosetta – Репозитарий Определения Хранилищ данных • Группы и типы хранилищ • Правила распределения и хранения объектов
Добавление группы Общая информация Список
Добавление диска Общая информация Параметры и правила
Основные компоненты Rosetta Пользователи Репозитарий Доставка Библиотека форматов Сохранность • Анализ рисков • План сохранения Управление коллекциями Управление процессами
Компоненты Rosetta – Сохранность Анализ рисков • Типы: устаревший формат, отсутствие приложения, свойство файла (атрибуты) • Периодический запуск отчетов План сохранения • Набор объектов на основе отчетов анализа рисков • Альтернативные планы • Тестирование, сравнение и оценка планов • Принятие решения • Миграция
Отчет по устаревшим форматам Список форматов с рисками Поиск в отчете Сортировка
Риск анализ – атрибуты файла Список рисков
Планы сохранения – сравнение планов