ソフトウェア開発技術者 平成19年春期 午前問12

助け人さん  
AP ゴールドマイスター
(No.1)
管理人様

以下に、この問題についての私の解釈を書きます。管理人様の解説とは少し違うのですが、いかがでしょうか?

「2整数X,Yをキーとするデータ」ということは、一つのデータの中にキー1としてX、キー2としてYがあるととらえます。
「Xは値1~256を一様にとり,Yは値1~16を一様にとる」となると、
X=1に対してY=1,・・・,16
・・・
X=256に対してY=1,・・・,16
となり、このデータは、256×16=4096種類あるととらえます。

この4096種類のデータを要素数256の配列に格納しようとすると、間違いなくシノニムが発生するのですが、シノニムの頻度が最も高いものが「最も不適切なもの」だと思います。
解説にあるように、ハッシュ値が0~255なら適切で、そうでなければ不適切というわけではなく、この場合、ア~エのどれも不適切で、その中で最も不適切なものが正解です。

アのX mod Nの取り得る値は0~255の256個で、シノニムは4096-256=3840回
イのY mod Nの取り得る値は1~16の16個で、シノニムは4096-16=4080回
ウの(X+Y) mod Nの取り得る値は0~255の256個で、シノニムは4096-256=3840回
エの(X×Y) mod Nの取り得る値は0~255の256個で、シノニムは4096-256=3840回

したがって、正解はイ

それとも、要素数256の配列の全てに格納されるのが適切で、未格納が出てしまうのが不適切でしょうか?
2019.01.12 20:08
管理人 
(No.2)
ご指摘ありがとうございます。

私の考えとしては、要素数4,096個のデータを要素数256の配列に格納するという与えられた状況の中で、ハッシュ関数をどう設計すべきかという観点で適切・不適切を分けました。

本問では、助け人さんのおっしゃるようにシノニムの発生が不可避です。シノニムの発生確率を最小限に抑えるためには配列の全要素を均等に使うことが重要ですが、そのためにはハッシュ関数が均等に256種類の値を返す設計になっている必要があると考えました。

このため、16種類の値しか返さない「イ」は、他のハッシュ関数と比較して不適切な設計であるとなります。もちろん、なぜ16要素しか使わないと不適切であるかと問われれば、それはシノニムの発生確率・発生回数が多くなるからです。

上記の点が分かるように解説を書き直してみました。
  https://www.ap-siken.com/kakomon/19_haru/q12.html
2019.01.15 16:27
助け人さん  
AP ゴールドマイスター
(No.3)
管理人様
確認しました。ありがとうございました。
2019.01.15 17:19

返信投稿用フォーム

スパム防止のためにスレッド作成日から30日経過したスレッドへの書込みはできません。

その他のスレッド


Pagetop