データカタログとエクセルでのデータ管理との違い

データカタログ以外でも、様々な方法でデータ管理ができます。その中、よく聞かれた質問は、「エクセルでのデータ管理との違いは?」となります。こちらでは簡単にその違いを説明します。

  1. 概要
  2. 保存箇所
  3. バージョン管理
  4. 操作について
  5. 自動化

 

概要

データカタログは、データの検索、分類、共有、管理に特化したツールであり、複数のユーザーが同時にアクセスすることができます。初期の設定が完了すると、利用者側は基本的にノーコードでメンテナンスが可能になります。

エクセルは表計算ソフトウェアであり、データの整理、計算、分析に使用されます。複数のユーザーが同時に編集することも可能ですが、更新やバージョン管理などは手動で行う必要があります。自動化の設定も可能ですが、技術的な手順が複雑です。

 

 
  Quollioデータカタログ エクセル
保存箇所 クラウド上で一括管理 クラウドやローカル
バージョン管理 バージョンの違いなし データの管理者に確認する必要がある
操作について ウェブページのようにスムーズに操作できる データ量が増えると、スピードが低下する可能性があり
自動化 Metadata Agent、APIの設定やタグルールによって、データ品質、リネージュ、メタデータレコメンド、タグ自動付与など可能 APIの設定によって一部自動化が可能

 

保存箇所

データカタログ

異なるデータソースでも、クラウド上で一括管理することが可能です。

エクセル

クラウド上でも保存することができますが、通常は部署や異なるデータソースごとに別々のフォルダーで管理されます。一方、ローカルで管理される場合は、担当者ごとに更新されるたびに共有する必要があります。

バージョン管理

データカタログ

データカタログを一元管理し、バージョンの違いがなく、バージョン管理の手間を軽減できます。

エクセル

クラウド上でのデータ管理では、各部署の担当者が手動でアップデートを行い、データの管理者によって、各タブごとにバージョン管理が必要になります。

一方、ローカルでのデータ管理では、常に最新版を確認する必要があるため、担当者はデータの管理者にメールやSlackなどのツールを介して確認しなければなりません。

 

操作について

データカタログ

データ更新や検索をする際に通常のウェブページのようにスムーズに操作できます。また、タグ別の管理やキーワード検索も一覧で表示され、複数のタブを開かずに直感的に表示されるため、必要な情報に簡単にアクセスできます。

エクセル

データ量が増えると、スピードが低下する可能性があります。また、各部署のデータを同一ファイルで統合管理する場合、部署ごとやデータごとにタブで分けられ、重複したデータも別のタブに表示されることがあります。

自動化

データカタログ

Metadata Agentを設定することにより、データウェアハウスでアップデートされた情報は自動的に取得できます。さらに、データを分類する場合に、タグを自動的に付与することができるルールを設定することも可能です。

また、APIを構築し、他の品質管理ツールとの連携により、統計情報などを取得することができたり、アクセス履歴やよく閲覧されるテーブルなどの情報をインサイト機能として提供します。

メタデータの定義は自動的にレコメンドされます。さらに、データ品質と自動リネージュの機能も提供されます。

メタデータのレコメンド機能の開発を2024年度に計画しています。

インサイト機能は2024年度前半でリリース予定しています。

エクセル

外部ツールのAPIを介して、一部のデータを自動的に取得することが可能ですが、メタデータの定義やデータ品質のメンテナンスなど、手作業で行う必要があります。