応用情報技術者平成22年秋期 午前問28

問28

データウェアハウスを構築するために,業務システムごとに異なっているデータ属性やコード体系を統一する処理はどれか。
  • ダイス
  • データクレンジング
  • ドリルダウン
  • ロールアップ

分類

テクノロジ系 » データベース » データベース応用

正解

解説

データウェアハウスを構築する際に使用される元データは、仕様の異なる様々なシステムに蓄積されていた形式がバラバラなデータ群であり、このままではデータマイニングなどの解析で使用することができません。

この生データを解析で使用できるようにするために行われるのが、データクレンジング(=洗浄)です。データクレンジングの作業で、データ形式の統一、欠損値の補完、単位の統一、異常値の処理などの処理をされたデータによってデータウェアハウスは構築されます。
  • ダイスとはサイコロのことで、多次元データベースの中から縦軸と横軸を指定して2次元の表にする操作を指します。3次元であるサイコロを振ると見えている面が変わるように、縦横の項目を変えて多次元データのまったく違う面を表にする機能のことです。
  • 正しい。
  • 多次元データベースにおいて、詳細に展開する操作を指します。(例 :四半期集計データから月集計データに移ること)
    逆に集計レベルを高く(広く)する操作をドリルアップといいます。
  • 多次元データベースにおいて、集計レベルを高くする操作を指します。(例 :集計単位を1カ月→1年)
    ドリルダウンの反対なので、ドリルアップとも呼ばれます。
選択肢以外にも多次元データベースをある断面で切り取って2次元の表にする操作である「スライス」があります。

多次元データベースとは、エンドユーザーが直接にデータベースを検索加工して問題発見をしたり問題解決をする分析を主とする利用目的のために適しているとされるデータベース。例えば月別・商品別の売上データを横に月,縦に商品をとれば2次元の表になります。月別・商品別に支店別を加えた売上データは3次元の表になります。さらに月別・商品別・支店別で売上,原価,利益のような会計区分を加えれば4次元になるというように表の次元は増大する。このような表の形式にしたものを多次元データベースといいます。

参考リンク
多次元データベース
http://www.kogures.com/hitoshi/webtext/db-mddb/index.html
© 2010-2024 応用情報技術者試験ドットコム All Rights Reserved.

Pagetop