アーカイブの全体像(Part1)

アーカイブとは、多くの人々にとって多様な意義を持ちます。参照から再利用まで、収益化からクライアントへのサービスまで、アーカイブがどのようなものであり、どのようなことができるのかについては多くの視点があります。その視点は実に様々であるため、よく観察することで、この古くからの用語に隠された可能性を明らかにすることができます。

DSC 9394 LTO Tapes Archiv kl 768x511

アーキヴァムとは、ローマ人が日常業務で不要になった経典謄本を保管する建物につけた名称です。私たちは経典謄本を使わなくなりましたが、その仕組みはあまり変わっていません。今日、私たちがアーカイブに入れるファイルは、日々の生産に不要になったものです。つまり、アーカイブは実際にはデータ移行なのです。ファイルはアーカイブに移され、ソースからは削除されます。これはすでにアーカイブの主な定義であり、まだ作業中のものを複製するバックアップとは異なります。アーカイブの対義語はデータ、ファイル、メディアの保存で、アーカイブの長期的な性格を強調しています。

このルールには例外も存在しますが、詳細は後述します。

そもそもなぜデータをアーカイブするのか?アーカイブの意味:アーカイブ・プロセスは、本番用ストレージから長期アーカイブ・ストレージへのデータ移行です。その結果、高性能な本番用ストレージの空き容量を確保することができます。もし全ての完了したプロジェクトがアーカイブに移動すれば、それは "Single Source of Truth"(単一の真実の情報源)となり、最終的なファイルを探す唯一の場所となります。これにより、再利用やリピーターのためにファイルを検索する膨大な時間を節約することができます。

長期的な計画から始めよう

アーカイブがビデオ映像、デジタル化されたフィルム、写真、音声、文書、その他どのようなファイルであっても、それぞれの目的とワークフローに最適なものを得るためには、計画を立てることが非常に重要です。ここで時間を投資することは、後で様々な形で報われます。

アーカイブは長期的なプロジェクトであるため、現在、そして将来的に誰が関わるのかを慎重に検討する必要があります。一連の質問は、関連するすべての関係者や利害関係者を発見するのに役立ちます。

すべての関係者と視点を集め、その意見を文書化する必要があります。関係者からより多くの視点を集めることができれば、アーカイブプロジェクトへの支援はより良いものになります。また、複数の視点を持つことで、有用性も向上します。将来のタスク、ワークフローの変化、新しく入社してくる人など、先を見据えて推測します。メタデータの面で今アーカイブに何を入れるべきか、将来役に立つように何を文書化する必要があるか。

Spotlight 3 Graphik 1 768x512

使用例

まだ導入されていないシステムの重要な要素を発見する最も効率的な方法は、ユースケースを書くことです。ユースケースとは、誰がどのようなタスクを遂行するために、システムを使って何をするのかを詳細に記述するストーリーです。

Archiveの運用や使用に関わる全ての人を後で探し出す、ステークホルダーは誰か?前提条件は何か?

ユースケースは次のようになります:
ある人(役割やポジションを記述)が(アセットやファイルを記述)必要とするタスクに署名している。彼は以下の情報を持っている(記述)。彼は割り当てられたタスクに適合するファイルを検索するためにアーカイブにアクセスします。彼は(記述)を検索する。彼はアーカイブカタログのエントリをブラウズし、どれをリストアするかを決定する(方法を記述する)。彼/他の誰かがリストア処理を開始する。しばらくして、リストアされたファイルが(どこに)リストアされ、(誰に)使用される。

このようなシナリオをいくつか思いつき、詳細を含めて完成させてみてください。同僚と一緒に将来のシナリオと詳細について考えることは、意味のあることです。そうすることで、会社にとって最適なアーカイブを作成するために、メタデータやワークフローの面で何を導入する必要があるのか、多くのヒントを得ることができます。

ユースケースの書き方のヒントはこちらをご覧ください:http://www.wikihow.com/Write-a-Use-Case

Spotlight 3 Graphik 2 768x512

アーカイブ・ストレージ

記憶媒体の歴史を見ると、記憶媒体の密度と寿命は逆の関係にあります。石(彫刻)は非常に長い間情報を保持するが、その情報密度は非常に低い。もう一方のハードディスク・ストレージは、驚異的な記憶密度を持つが、寿命は非常に短く、読み出しが可能かどうかは他の技術に依存します。LTOテープの寿命は数十年だが、歴史的な次元と比較するとまだ短い。そのため、デジタルアーカイブにはマイグレーションが不可欠です。LTOは、各新世代が2つ前の世代のメディアを読むことができるため(例えば、LTO-7はLTO-5テープを読むことができる)、これを簡単に行うことができます。ベンダーによっては10年間の再購入保証があるため、マイグレーションにも柔軟に対応できます。現在、そして当分の間は、LTOテープが唯一かつ最も実績のあるアーカイブ・メディアであると思われます。密度、耐久性、読み書き性能、TBあたりの価格など、他のストレージ・テクノロジーに匹敵するものはありません。また、市場規模が大きく、金融、保険、放送、科学などの大きな産業で世界的に使用されていることから、今後もその役割を果たし続ける可能性が高い。コールド・ディスク・ストレージや他の技術が、関連する市場シェアを獲得するのに十分な勢いをつけるかどうかは、まだわかりません。

Spotlight 3 Graphik 3 768x391

メディアの老朽化に関する最近の報告書は、特にビデオ、フィルム、オーディオのようなアナログメディアが、生き残り、アクセス可能にするためにデジタル化し、アーカイブ化する必要があることが、いかに危機的な状況であるかを示しています。

http://www.dpconline.org/newsroom/not-so-new/859-new-dpc-tech-watch-report-preserving-moving-pictures-and-sound

現在のところ、アーカイブ・ストレージの主な選択肢は、ディスク、テープ、クラウド・ストレージのいずれかです。データ量、使用パターン、セキュリティ要件、利用可能な予算に応じて、各テクノロジーにはそれぞれの利点があります。

Spotlight 3 Graphik 5

メタデータ - アーカイブの鍵を開ける鍵

メタデータはアーカイブの鍵であり、非常に重要な役割を果たします。ファイルがアーカイブされてから何年も経つと、誰もファイル名などの詳細を覚えていないかもしれません。
そのため、唯一の選択肢は、適切なキーワード、説明、パラメータ、つまりメタデータを検索することです。メタデータには、記述的なものと技術的なものの2種類があります。
記述的なメタデータは、シーンに誰が映っているか、どんな製品が撮影されたか、どんな場所が使われたかなど、人間の入力が必要です。

技術的なメタデータは、使用されたカメラのタイプ、レンズ、解像度、コーデックなどです。メタデータの自動生成(カメラまたはインジェスト中)は急速に進んでおり、その一例がFCP Xのショット検出です。追加的な説明的メタデータは、ほとんどの場合、必須です。コンテンツや音声を認識するAIサービスは急速に成長しており、将来的にメタデータ分野に多大な付加価値をもたらすかもしれません。

場合によっては、第3のメタデータが必要になるかもしれません。たとえば、利用や配布に関する権利を記述した管理用メタデータなどです。

メタデータスキーマとは、アーカイブで使用され、ファイルの高速検索を可能にする技術的・記述的なメタデータの集合です。将来のために慎重な検討と計画が必要です。用語の組み合わせは、ワークフローや組織の要件に対応する必要があるため、独自のものとなる可能性があります。ユースケースをまとめることで、特定のスキーマに含める必要のある項目が見えてくるはずです。

メタデータの重要な側面の1つは一貫性です。アーカイブされたファイルに一貫性のあるタグ付けを行うことで、アーカイブに多大な価値を付加することができます。後でアセットを検索する際に、誰でも簡単にアセットを見つけて復元できることが理想的です。P5 Archive には拡張可能なメタデータフィールドとドロップダウンメニューが用意されており、このようなメタデータスキーマを使用することができます。

Part2へ続く...