平成30年秋期試験午後問題 問10

問10 サービスマネジメント

⇱問題PDF⇱解答用紙PDF
キャパシティ管理に関する次の記述を読んで,設問1~3に答えよ。

 K社は,ガス会社G社の情報システム子会社であり,G社に顧客管理サービス(以下,本サービスという)を提供している。本サービスは,G社が家庭用電力事業に新規参入したときに,K社がその事業の顧客管理を支援するためのシステム(以下,本システムという)を導入して開始されたものである。G社は本サービスを利用して,営業部門の電力料金計算・請求業務,及びコールセンタでの顧客からの問合せ対応・新規顧客受付業務を行っている。
 K社では,年に数回の計画停止期間以外は,毎日9時から22時まで,本サービスのオンラインサービスを提供している。

〔本システムの概要〕
 本システムは,サーバ1台で稼働し,表1に示す五つの機能をオンライン処理又はバッチ処理で実現している。
pm10_1.gif
〔本サービスのキャパシティ管理〕
 K社のL氏は,ITサービスマネージャとして本サービスのキャパシティ管理を担当し,具体的には次の業務を行っている。

(1) キャパシティ計画
  1. 毎年1回,G社営業部門から本サービスに対する需要予測を入手し,G社と合意したサービスを考慮して資源の使用量を見積もる。これを基に,キャパシティを拡充するための期間,監視項目,監視項目のしきい値などのキャパシティ計画を作成し,G社に説明している。
(2) キャパシティ監視
  1. オンライン処理の監視項目は,サーバのCPU使用率,オンライン応答時間及びオンライン処理件数であり,1分間隔で集計し,測定値として収集する。ここで,オンライン応答時間とは,サーバが要求を受け付けてから応答するまでの時間のことである。バッチ処理の監視項目は,1分間隔で集計するサーバのCPU使用率及び毎日のバッチ処理時間である。
  2. 監視項目の測定値が,あらかじめ決められたしきい値を超えた場合は,インシデントとして対応する。
    なお,社内及び社外のネットワークには十分なキャパシティがあり,サービス提供に支障がないので,監視項目を設定していない。
(3) 分析及び対策
  1. 監視項目の測定値について,キャパシティ計画で見積もったとおりに資源が使用されているかなどの視点から毎月1回分析を行う。また,夜間バッチ処理時間については,毎月1回妥当性を確認する。
  2. キャパシティに関わるインシデントの対応を終了した後は,キャパシティ計画の妥当性を検討し,必要に応じてキャパシティ計画を見直す。
〔オンライン応答時間の悪化〕
 本サービスの提供を開始してから6か月後のある日,9時15分にオンライン応答時間の測定値がしきい値を超えたことから,K社はインシデント対応を開始した。また,コールセンタからK社に"オンライン処理の応答が遅い"というクレームがあった。このときは,数分後にオンライン応答時間の悪化は解消されたので,K社では解決策は必要ないと判断し,インシデント対応を終了した。
 翌日L氏は,前日のオンラインサービス提供時間帯のサーバの資源使用状況について分析することにした。このときのサーバのCPU使用率とオンライン処理件数は図1に示すとおりである。
pm10_2.gif
 CPU使用率が高い9~11時を詳細に調査したところ,一時的にCPU使用率が100%となっているときがあることが判明した。9~11時の120分間の1分間隔のCPU使用率は,図2に示すとおりである。
pm10_3.gif
 調査結果から,CPU使用率が100%に達している時間帯が,a機能の処理を実行している時間帯と一致した。また,過去1か月の状況を調査したところ,9~11時の時間に100%に近いCPU使用率を記録することが数回あったので,L氏はすぐに実施する暫定策として,午前中は,a機能の処理を実行せず,12時に実行することにした。また,恒久策として,3か月後にサーバのCPU能力向上を行うことにした。

〔夜間バッチ処理の終了時刻の遅延〕
 オンライン応答時間の悪化から数日後に,夜間バッチ処理の終了時刻が遅延するインシデントが発生し,オンラインサービスの開始が遅れた。その結果,顧客情報照会ができないことから,コールセンタの業務に支障を来した。
 そこで,インシデント対応のbとして,機能を縮退してオンライン処理を行うことをG社と合意し,c機能だけでオンライン処理を行うことにした。その間,コールセンタで顧客情報登録・変更があった場合は,夜間バッチ処理が終了し,オンラインサービスが正常に回復した後に対応することにした。
 L氏は,インシデントの発生原因を調査し,次のように整理した。
  • 夜間バッチ処理では,顧客DBに登録された全顧客を対象に処理を行っている。夜間バッチ処理の設計では,顧客の登録数(以下,顧客登録数という)が50万件になるまでは処理が9時までに終了するとしていた。
  • 本年度当初にG社営業部門が提示したシステム要件では,顧客登録数が前述の50万件に達するのは1年半後となっていた。しかし,G社営業部門では2か月前から臨時キャンペーンを行い,顧客登録数が予測よりも早く50万件を超えたので,夜間バッチ処理の終了時刻に遅延が発生した。
 そこで,L氏は,①顧客DBの顧客登録数を監視項目として追加し,日常的に監視することにした。さらに,G社の協力を得て不要な顧客情報を顧客DBから削除し,顧客登録数を減らした。
 L氏は,今後の顧客登録数の増加について,次のように整理した。
  • G社営業部門の見通しでは,2年後に顧客登録数が100万件に達する。
  • 顧客登録数が100万件に達するまでは,9時までに夜間バッチ処理を終了できるように検討し,3か月後に予定しているサーバのCPU能力向上計画に反映する。

〔キャパシティ管理の強化〕
 L氏は,サーバのCPU能力を向上させるまで,オンライン応答時間の悪化が起きない方策を検討した。CPU使用率とオンライン応答時間の関連性を分析した結果,CPU使用率が95%を超えるとオンライン応答時間が急激に悪化する傾向があることが分かった。そこで,L氏は,オンラインサービスへの影響を軽減するためにCPU使用率のしきい値を,95%よりも低い値に設定し,応答時間の遅延が発生する前にdとして対応することにした。また,今回の夜間バッチ処理の終了時刻の遅延に関連して,今後は②G社営業部門と定期的に打合せを行い,本サービスに対する需要予測に影響を与える,G社のキャンペーンの実施などに関する情報を事前に入手することにした。

設問1

〔オンライン応答時間の悪化〕について,(1),(2)に答えよ。
  • 本サービスにおけるインシデント管理の目的を解答群の中から選び,記号で答えよ。
  • 本文中のaに入れる適切な字句を表1中の機能名称から選べ。解答欄には表1中の機能名称に対応する項番を答えよ。
解答群
  • G社営業部門やコールセンタと合意したサービスを迅速に回復するため
  • 応答時間の悪化の傾向分析を通じてインシデントの再発を防止するため
  • 応答時間の悪化の根本原因を特定し,恒久的な解決策を提案するため
  • コールセンタからの苦情に関するサービス報告書を作成するため

解答例・解答の要点


  • a:2

解説

まずサービスマネジメントの問題を解く上での基本的な概念として、「システムやその構成(ハードウェアやソフトウェアの組み合わせ)はあまり重要ではなく、サービス(顧客へ利用価値を提供する商品)が利用できるかできないか」が重要であるということを理解すると正解へ近づきやすくなります。
  • インシデントとは、サービスに対する計画外の中断、サービスの品質の低下を引き起こす事象です。インシデントが生じた際に、利用者やその業務への影響を最小限に抑えるために「サービスを迅速に復旧する」ことを目的とするプロセスをインシデント管理といいます。インシデント管理は、根本原因の特定よりもサービスの迅速な復旧を優先するため、不具合に対して暫定的な回避策を実施し業務を継続できるようにします。
    この問題では「本サービスにおける」と表記されていますが、サービスマネジメントにおけるインシデント管理=サービスを迅速に復旧するということを覚えておきましょう。
    • 正しい。インシデント管理の目的に合致しています。
    • 問題管理プロセスの役割に該当します。
    • 問題管理プロセスの役割に該当します。
    • 「応答時間の悪化」はサービスの品質にかかわるものなので、サービスレベル管理プロセスの役割に該当します。
    ∴ア:G社営業部門やコールセンタと合意したサービスを迅速に回復するため

  • aについて〕
    問題文では、オンラインサービス提供時間の9時~22時、さらにインシデントが発生した9時~11時の時間帯を調査しています。その時間帯に夜間バッチ処理は発生しないため「顧客DBバックアップ」「電力料金計算・請求」は候補から外れます。
    さらに問題文「午前中はa機能の処理を実行せず,12時に実行することにした。」という文章から、リアルタイム性・即時性がない処理であることが読み取れます。そのため、オンライン処理である「顧客情報照会」「顧客情報登録・変更」は候補から外れます。

    残る「検針データ取込み」の日中バッチ処理は、注記1)に、オンライン処理時間帯に1時間おきに起動される旨が説明されており上記2つの条件を満たします。図2を見ると9時10分過ぎにバッチ処理が開始されたことにより、CPU使用率が合わせて100%となったため、オンライン処理のCPU使用率が制限されてしまっていることがわかります。これが、オンライン処理の応答時間が遅くなった原因です。

    機能名称を表1の項番で答えるので、aには2が入ります。
    pm10_4.gif
    a=2

設問2

〔夜間バッチ処理の終了時刻の遅延〕について,(1)~(3)に答えよ。
  • 本文中のbに入れる適切な字句を解答群の中から選び,記号で答えよ。
  • 本文中のcに入れる適切な字句を表1中の機能名称から選べ。解答欄には表1中の機能名称に対応する項番を答えよ。
  • 本文中の下線①で顧客登録数を監視項目として追加する目的を,25字以内で述べよ。
b に関する解答群
  • 恒久策
  • 暫定策
  • 奨励策
  • リスク軽減策

解答例・解答の要点

  • b:
  • c:1
  • 夜間バッチ処理の終了時刻の予測を行うため (20文字)

解説

  • bについて〕
    前述しましたが、インシデント管理では、根本原因の特定や恒久的な対策は行わず、暫定的な回避策を適用してサービスの迅速な復旧を目指します。

    問題文で説明されている「機能を縮退してオンライン処理を行う」対策は、正に問題の解決よりも一刻も早くサービスを利用できる状態を作り出すための対策です。こういった一時的な対策を暫定策といいます。なお、恒久的な対策は問題管理プロセスによって策定されます。

    b=イ:暫定策

  • 問題文に「c機能だけでオンライン処理を行う」とありますので、表1中のオンライン処理である「顧客情報照会」「顧客情報登録・変更」の2択に絞られます。そして、続く「顧客情報登録・変更があった場合は…正常に回復した後に対応する」より「顧客情報登録・変更」の処理は後回しで対応することがわかります。よって、オンライン処理を継続する機能は「顧客情報照会」になります。
    また、表1の項番はサービスの優先度に表しているので、これに着目して正解を推測することも可能です。2つのオンライン処理を比較すると、「顧客情報照会」は1番目、「顧客情報登録・変更」は5番目ですから、機能を縮退した場合にどちらの処理を残すかは明白です。

    機能名称を表1の項番で答えるので、cには1が入ります。

    c=1

  • 下線①の目的を答えるために、まずは本項目が追加された経緯を知る必要があります。下線①の直前には「そこで」とあります。「そこで」「だから」という言葉の前には理由・原因が記載され、後ろにはその理由・原因に基づく行動が記載されることが多いです。要するに下線①の行動の理由がその前に記載されていることになります。

    下線①の前にはインシデントの発生原因を調査・整理したものが箇条書きで記載されています。まず、1つ目の文章では、夜間バッチ処理にかかる時間は顧客登録数に関係し、顧客数がわかれば処理時間を予測できることがわかります。そして、2つ目の文章では、顧客登録数が予測を超えたために遅延が発生したことがわかります。

    上記2つのことより、顧客登録数を把握できれば夜間バッチ処理の終了時刻が予測可能になり、結果としてインシデントの発生を防げるようになるということです。これを25字以内にまとめたものが解答になります。あくまで顧客登録数を監視項目に追加した直接的な目的が問われていますので、正解は「夜間バッチ処理の終了時刻の予測を行うため」となります。文字数の制限がありますので、「顧客登録数を把握することで」や「インシデントを未然に防ぐ」等の言葉は不要です。文字数制限がぎりぎりの場合は問われていることに直結する内容をいかに抽出・要約できるかが重要です。

    ∴夜間バッチ処理の終了時刻の予測を行うため

設問3

〔キャパシティ管理の強化〕について,(1),(2)に答えよ。
  • 本文中のdに入れる適切な字句を,10字以内で答えよ。
  • 本文中の下線②でG社営業部門との打合せで情報を入手する目的を,キャパシティ管理の観点から25字以内で具体的に述べよ。

解答例・解答の要点

  • d:インシデント (6文字)
  • キャパシティ計画への影響を把握するため (19文字)

解説

  • dについて〕
    問題文「しきい値を、95%よりも低い値に設定し…dとして対応する」より、しきい値を超過した際の対応について記載されています。

    「しきい値」というのは、リソースなどを監視する際に異常と判定するか否かの区切りとなる値です。JIS Q 20000-1:2014が、インシデントを「サービスに対する計画外の中断,サービスの品質の低下,又は顧客へのサービスにまだ影響していない事象。」と定義しているように、インシデントには、実際に品質・機能が低下した事象だけでなく、利用者へのサービスにまだ影響していない事象も含みます。しきい値を超えたということは異常が発生したということですから、インシデントして処理することが適切です。よってdにはインシデントが入ります。

    ちなみに、10字以内で答えよとなっているところ解答は6文字ですが、字句を答える場合は問題文中の言葉を引用することが多く、文字数が多く余ることもありますので気にする必要はあまりありません。

    d=インシデント

  • 設問にはキャパシティ管理の観点からとあります。キャパシティ管理とは、サービスにおいて必要とする収容・処理能力を予測・監視し、最適なコストで改善に結びつけるプロセスです。キャパシティ管理では、サービスにどの程度リソースやパフォーマンス(機能)を必要となるかを将来を見据えて管理します。ただ、リソースというのはCPUやメモリなどシステム的なものだけでなく、人的リソースや工数管理も含まれるということも覚えておくとよいでしょう。

    下線②には「本サービスに対する需要予測に影響を与える…情報を事前に入手する」とあります。情報を入手する目的は、本サービスに及ぶ影響を把握するためです。G社営業部門の見通しでは、2年後に登録顧客数が100万人に達するとされているため、3か月後の改修で100万件までを9時までに終了できるようにCPUの増強を計画しています。CPU等のリソースを調整することはキャパシティ管理の中の「キャパシティ計画」に含まれます。
    しかし、今回のように臨時キャンペーン等があれば予測より早く100万人に到達することも考えられます。その場合にはキャパシティ計画の変更を検討しなくてはなりません。つまり、キャパシティ計画は臨時キャンペーン等によって左右される可能性があるということです。

    以上より、需要予測に影響を与える情報を取得する目的は「キャパシティ計画への影響を把握するため」となります。

    ∴キャパシティ計画への影響を把握するため

Pagetop