2007年5月27日日曜日

全日空システムトラブル

全日空のSkipについて書こうと思っていたのですが、今日、全日空でシステムトラブルが発生しているので、こちらの記事を先に書きます。

今朝から全日空の予約・発券・搭乗システムにトラブルがあり、羽田空港が混乱しているようです。私が大丈夫か?と思うのは、このシステムを作っているのが日本ユニシスだという点。そう、先日トラブルを起こしたtoto BIGのシステムと同じ会社です。

実は全日空は現在のシステムを日本ユニシスのオープン系に移行しようとしており、現在のメインフレームからtoto BIGと同じWindows Serverを使ったシステムになる予定です。今回のトラブルとは直接の関連が無いと思いますが(報道だけでは詳細が不明なので、現時点では断言できない)、何となく以下の点を懸念してしまいます。


  • 現在のメインフレーム系をまともにメンテナンスできる優秀な人物が(構築から10数年経過しているシステムなので)日本ユニシスにいなくなった



  • 新しいシステムに移行するために、現状システムのリソース(人材、予算など)が削減されてしまった



  • 上記にもかかわらず、現状システムに機能を盛り込みすぎてしまった


コンピュータとネットワーク無しには現代社会は成り立たなくなっていますが、その基盤はひょっとすると脆弱ではないかと思わせる事件が続いています。建物の耐震偽装は一般人にも比較的理解し易いですが、ITシステムの“耐震強度”を判定するのは極めて困難です。
その意味でも、専門家がきっちりした分析とを行い、対策を立ててほしいと思います。

毎日新聞
全日空:システム障害で遅れや欠航 羽田発着便中心に
http://www.mainichi-msn.co.jp/today/news/20070527k0000e040014000c.html

※1年前の情報では確定はしていない模様。LINUXまたはUNIXになる可能性もある。
現在はシステムの移行期間中で、サーバーはリプレースされたメインフレーム、ソフトは暫定システムを使用している事になっています。今後このシステムをオープン系に切り替え、パッケージもFORTRAN記述のUSASからJava記述のAirCoreにするとのこと(いずれも米国ユニシス製)。
その後の報道によると、6台のサーバーのうち3台を入れ替えて障害が発生、元に戻して復旧したらしいです。
日経コンピュータ
【続々報】全日空システムの障害原因は、事前のシステム入れ替え
http://itpro.nikkeibp.co.jp/article/NEWS/20070527/272584/
追記
ANAの発表(2007/6/13)で障害の全容が判明しました。直接の原因はCISCOのスイッチのハードウェア故障。これを引き金に、ゲートウェイのシステム設定のミス(ICS)と処理能力不足(ATCP)が加わって大規模なトラブルに発展したようです。CISCOスイッチはNEC、ICSは日本ユニシス、ATCPは東芝がそれぞれ納入・担当していて、大きなシステムの運用の難しさを感じさせます。