誠実なレポルタージュ
2022/05/08 20:55
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:しょひょう - この投稿者のレビュー一覧を見る
みずほ銀行のシステム障害についてのレポート。
金融機関のシステムに係わった経験があったのと、システム障害が起きていた頃に前作(MINORIをかなり持ち上げた内容)を複雑な思いで読んでいたのだが、その日経コンピュータが障害をどう評価しているのかにも興味があって通読。
読了した感想としては、かなり良かった。
事実を事実とし、原因分析もステレオタイプを排して地に足が着いていると感じた。
誠実な叙述に好感を持てた。読んでよかった。
投稿元:
レビューを見る
みずほ銀行で1年に11回発生したシステム障害の内容、原因と再発防止策がまとまった一冊。冒頭から、読んでいると具合が悪くなる大規模障害の話題で、五千件を超えるカード・通帳がATMに取り込まれていく経緯が緊迫感あふれる様子で描かれる。
直近の大規模システム改修に問題があったというより、運用手順が不明確、組織の連携が遅い、障害レベルを人が判断…など障害発生後の対応が後手に回ったことが障害影響を拡大させたことが分かる。
特に恐ろしかったのが、為替送金の取引遅延障害で、遅延を取り戻すためにAML(資金洗浄防止)システムを省略しても問題ないと最高コンプラ責任者が判断し省略した結果、外為法違反した一件。現場だけではなくコンプラ責任者がこの判断をしたということで、他の業務でもちゃんと法令遵守しているか疑いたくなる。
100を超える再発防止策が形骸化しないことを願う。
投稿元:
レビューを見る
「SREが再生の第一歩」って言っているけど、そういうシステム的なところだけに問題があるわけではないと思う。
投稿元:
レビューを見る
システム開発に携わる立場から見ると、要件定義やプロジェクト進行のみならず、リリース後の監視・運用保守体制がいかに重要であるか痛いほど伝わる事例集となっていた。
システム障害の事後検証報告ということもあり、IT業界の人間でなければ文中に出てくる用語や仕組みの理解を深めるのは難しいものと思われる。
しかしながら、本書では障害発生時における顧客対応・危機管理面において、みずほ銀行の組織態勢不備が大きな課題として挙げられている点にも注目したい。
「積極的に声を上げることでかえって責任問題となるリスクをとるよりも、自らの持ち場でやれることをやっていたといえるための行動をとる方が、組織内の行動として合理的な選択になってしまう」(システム障害特別調査委員会の調査報告書より)
このような悪しき企業風土は、一定の規模感をもった組織であれば、どこでも発生しうる可能性は多分にあるだろう。日頃から部署間の連携やコミュニケーションをスムーズに行える体制づくりをすべきだということを、改めて思い知らされた一冊である。
失敗から学ぶ文化の醸成は、もはやどの組織でも必要不可欠な要素となっている。本ポストモーテムの知見が広く共有されることで、自らシステムの課題発見や解決方法の模索ができる人材がひとりでも多く育成されることを願っている。
投稿元:
レビューを見る
2021/2-2022/2の11回にわたるシステム障害について書かれている。
面白かったのは2・4・5章(≒障害発生回数)。
事実が書かれていることと、内部精通者がいるのか?というくらいに詳しく書かれていて面白い。
銀行システムを担当するエンジニアは全員読んだほうが良い良書。逆に、銀行システムを担当していても、システムを触ったことがない担当者だと、描いてある内容でわからない部分は多いような気がする。
投稿元:
レビューを見る
最近の仕事で、みずほ総研(MHIR)の方と一緒に働いているのですが。
有名なみずほFGの各障害が詳細に記載されていて
その原因追及や、根本原因などの分析が秀逸
SEとして読んでいて、よく理解できて、
身につまされる内容。
さらに、今の関連しているPJTと悪い部分が非常に
よく似ている。
今回のPJTでも、なんなりの障害は発生しそうである。
関連者に読んでほしいと思われます。
投稿元:
レビューを見る
2020年にみずほ銀行システム統合史を上梓した日経コンピュータが、2021年から起こったみずほ銀行のシステムトラブルを整理した一冊。IT業界にみをおくものとしては読んでいて居た堪れなくなってしまうが、前書よりも価値のある一冊と言える。
みずほで起こったトラブルを淡々とインシデント分析を繰り返し、問題の本質に迫ろうとしている。往々にして、みずほのトラブルは三行の体制によるガバナンスの効かなさが生み出したものと語られがちだが(場合によってはドロドロの情念を絡めた読み物として)、情実的な部分を排除してあくまでシステム的観点から分析している。
この書は、みずほのトラブルに学ぶことはもちろん、インシデント分析の実施の仕方についても深い見識を与えてくれる。
投稿元:
レビューを見る
専門用語も多く、システム素人の私には難しいところもあったが、システム障害の全体像・問題点が分かりやすく整理されている。いくらみずほFG・みずほ銀行が対外公表している資料を読み込んでも、理解はできないだろうが、本書のおかげですっきり分かった。
旧3行のシステム駆け引きから、すでに不幸が始まっており、何度も障害を繰り返しながらも抜本的なアクションがとられなかった。唯我独尊で、他のメガバンクや海外の動向から学ぶことはあろうに、忖度や馴れ合いの結果、不確実性を増していったということだろう。
私が一昨年まで暮らしたシンガポールのネットバンクは、UIが良く統一感があり、大変利用しやすい。一方、みずほ銀行(だけでなく他の邦銀)は、非常に操作しづらい。みずほの歴史は日本の停滞の20年と重なり合う。
本書「おわりに」で紹介されている、みずほの窓口でのやりとり。令和の時代に昭和を引きずり、一部IT機器が出てきたかと思えば、iPadではなくMINORIタブレット。。。そんなみずほもGoogleと提携したとのこと。しがらみをかなぐり捨てて、飛躍してほしい。(一口座保有者として希望。)
投稿元:
レビューを見る
良書。前作よりも専門的な説明に踏み込んでおり、詳しい人によりわかりやすくなっている。慣れない人でも、うまくその後の説明で補足を入れてるので、たいへん気を使って書かれた本だなという印象である。
現場のエンジニア、特に運用寄りのエンジニアは読むのが良いと思う。ただ、夜寝る前に読むのはお勧めしないけれど。
投稿元:
レビューを見る
良書。読み終えたとき、銀行の勘定系システムを知るには、うってつけのテキストと感じました。情報システムの関係者へ向けたメッセージです。
表題のポストモーテムとは、事後検証報告書(直訳は、検視、死体解剖)、要は事後の振り返りです。
コンピュータの仕組みを知らない方は、読み進むのは、難しいかもしれないが、かじったことのある方であれば、IT用語のほうは、苦にはならないのではないか。むしろ、金融関連の用語を知らないと進みずらいではと感じました。
流れは、第3章で15の疑問、第4章でなぜ重大障害が頻発したかの結論に至ります。振り返りとはここまで。また再発防止策について、7章にまとめられています。
金融庁からの指摘・原因
①システムを開発したのはいいが、品質を確保するために十分なテストをしなかった。
②稼働させた後に保守体制を十分に整備しなかった。(保守要員を1/3にカットした)
③障害に備えて、十分に訓練しなかった。
筆者は上記に加えて、他行が1社に片寄せした勘定系システムを、いがみあう4社に分散した結果、十分なコミュニケーションがとられないままに、システムがリリースされて障害が多発したと指摘しています.2度のシステム合併は各ベンダーに禍根を残したとも指摘しています。IBM 日立 富士通 NTTデータ
三菱UFJ 3300億円
三井住友 1000億円
みずほ 8000憶円(4000億はDKB,FKBの片寄せ、4000億は3みずほの再構築)
上記がメガバンクの、合併にともなうシステム統合の費用です。
みずほは、多額の投資を取り戻そうと、運用費用をけずって、好決算をたたき出したのに、障害を引き起こして信用を失うという結果につながっています
また、三菱UFJとほぼ同規模だったみずほですが、4つのベンダーをたばねるために倍以上のコストがかかっています。「みえる化」というか、わかりやすさが、情報システムの構築コストにいかに大切かがうかがいしれます。
筆者のおもいというか結論は、以下です。
「ポストモーテム」は、失敗からの学びを大切にする文化の代表例だ。本書が多くの読者にとって、みずほ銀行の失敗を学び、より良い情報システムを築き上げるための教訓とする過程の一助になることを願っている
貴重な資料
P48 銀行システムの主な要素と勘定系システムの位置づけ
P50 勘定系システム「MINORI」の全体像とシステム障害が発生した箇所
P51 MINORIの主要機能と担当ベンダー
P129 MINORIの監視体制
P158 データベース冗長化対策の手法
P163 MINORI関連システム概要(インフラ基盤構成)
P185 大手銀行の勘定系システムの変遷
P195 銀行オンラインシステムの歴史
P212 みずほ情報総研の委託先体制
P217 メガバンクのシステム統合プロジェクトの比較
P233 MINORI稼働後に開発を始めたAPIゲートウェイ
他 第7章 各再発防止策が集約されています
目次は以下です。
はじめに
第1章 前代未聞、12か月で11回のシステム障害
第2章 行内で何が起き���のか、システム障害の真相
第3章 なぜ障害は拡大した、15個の疑問
第4章 金融庁が分析する「原因」「背景」「真因」
第5章 障害を繰り返すみずほ銀行のシステム、その歴史を紐解く
第6章 なぜみずほ銀行でだけ、何度も障害が起きるのか
第7章 みずほ銀行は立ち直れるのか
おわりに
投稿元:
レビューを見る
2019年に満を持してリリースされた新システムが2021年2月からの1年間で計11回のシステム障害を引き起こしてしまったみずほ銀行。その事後検証報告からの学びを目的として書かれた一冊。前著に当たる『みずほ銀行システム統合、苦闘の19年史』がプロジェクトの進め方の話が中心だったのに対して本書はかなり技術寄りの内容。非エンジニア職の人にはハードルが高いと思われる。その分エンジニアには多くの学びを提供してくれる。また、後世に残す記録としても重要。冷笑・嘲笑でネタ的に消費するのではなく(みずほ銀行を笑えるITエンジニアは真に優秀か超の付く能天気のどちらかだろう)自身の担当システムで本質的に同じ原因の問題が起きないか考えながらじっくり読みたい。
投稿元:
レビューを見る
しっかりと中立的に書かれている印象。マルチベンダやレガシーさが障害を呼んだのではなく、システム運用やシステムへの軽視が根底ということがよくわかった。
システム技術のリテラシーや勘所がある人が企業トップにいないとダメだと思う、、システムは利用するのは簡単だが、とても複雑でそれを開発運用できる人材はポコポコいるわけではない、ということを経営者たちは本書を読んで理解するべきだと思う。
投稿元:
レビューを見る
みずほ銀行のシステム障害に関する検証結果をまとめたもの。内容は読み応えあってエンジニアの自分にはとても役に立つ内容だった。
ただそれ以前に、みずほ銀行ダメだこりゃ。
投稿元:
レビューを見る
システム開発に携わる人間として、明日は我が身の気持ちで読了。
発生事象や、原因、他行の事例など詳細に解説してある。
▪️障害発生の真因
•貧弱なシステム運用監視体制で、他よりも複雑なシステムを運用していた。(運用訓練不足、運用事項の認識漏れ、情報共有の遅さ)
•言うべきことを言わない、言われたことだけしかしない姿勢がある企業文化
•テストケース不足
•法令に関する知識不足
▪️参考事例で印象に残った点
•snsを監視して、炎上が起こってないかチェックする
•セブン銀行は日常的に大阪と東京のデータセンターを切り替えてる
•みずほ以外のメガバンクは、非常時に特別な許可を与えた時だけリモートから商用環境での作業ができるようにしている。
投稿元:
レビューを見る
あくまでもひたすらファクトベースに徹している。新聞社系の雑誌を元にした出版なのでそれは哲学として良いと思う。仮説や示唆を求めている人には向かないか