データカタログ以外でも、様々な方法でデータ管理ができます。その中、よく聞かれた質問は、「エクセルでのデータ管理との違いは?」となります。こちらでは簡単にその違いを説明します。
概要
データカタログは、データの検索、分類、共有、管理に特化したツールであり、複数のユーザーが同時にアクセスすることができます。初期の設定が完了すると、利用者側は基本的にノーコードでメンテナンスが可能になります。
エクセルは表計算ソフトウェアであり、データの整理、計算、分析に使用されます。複数のユーザーが同時に編集することも可能ですが、更新やバージョン管理などは手動で行う必要があります。自動化の設定も可能ですが、技術的な手順が複雑です。
Quollioデータカタログ | エクセル | |
保存箇所 | クラウド上で一括管理 | クラウドやローカル |
バージョン管理 | バージョンの違いなし | データの管理者に確認する必要がある |
操作について | ウェブページのようにスムーズに操作できる | データ量が増えると、スピードが低下する可能性があり |
自動化 | Metadata Agent、APIの設定やタグルールによって、データ品質、リネージュ、メタデータレコメンド、タグ自動付与など可能 | APIの設定によって一部自動化が可能 |
保存箇所
データカタログ
異なるデータソースでも、クラウド上で一括管理することが可能です。
エクセル
クラウド上でも保存することができますが、通常は部署や異なるデータソースごとに別々のフォルダーで管理されます。一方、ローカルで管理される場合は、担当者ごとに更新されるたびに共有する必要があります。
バージョン管理
データカタログ
データカタログを一元管理し、バージョンの違いがなく、バージョン管理の手間を軽減できます。
エクセル
クラウド上でのデータ管理では、各部署の担当者が手動でアップデートを行い、データの管理者によって、各タブごとにバージョン管理が必要になります。
一方、ローカルでのデータ管理では、常に最新版を確認する必要があるため、担当者はデータの管理者にメールやSlackなどのツールを介して確認しなければなりません。
操作について
データカタログ
データ更新や検索をする際に通常のウェブページのようにスムーズに操作できます。また、タグ別の管理やキーワード検索も一覧で表示され、複数のタブを開かずに直感的に表示されるため、必要な情報に簡単にアクセスできます。
エクセル
データ量が増えると、スピードが低下する可能性があります。また、各部署のデータを同一ファイルで統合管理する場合、部署ごとやデータごとにタブで分けられ、重複したデータも別のタブに表示されることがあります。
自動化
データカタログ
Metadata Agentを設定することにより、データウェアハウスでアップデートされた情報は自動的に取得できます。さらに、データを分類する場合に、タグを自動的に付与することができるルールを設定することも可能です。
また、APIを構築し、他の品質管理ツールとの連携により、統計情報などを取得することができたり、アクセス履歴やよく閲覧されるテーブルなどの情報をインサイト機能として提供します。
メタデータの定義は自動的にレコメンドされます。さらに、データ品質と自動リネージュの機能も提供されます。
メタデータのレコメンド機能の開発を2024年度に計画しています。
インサイト機能は2024年度前半でリリース予定しています。
エクセル
外部ツールのAPIを介して、一部のデータを自動的に取得することが可能ですが、メタデータの定義やデータ品質のメンテナンスなど、手作業で行う必要があります。