パスワードを忘れた? アカウント作成
12267881 story
携帯電話

auのデータセンターで障害、約1日にわたってメールを利用できない状態に 46

ストーリー by hylom
久しぶりにやらかした感 部門より
あるAnonymous Coward 曰く、

KDDIのau携帯電話で、一部ezweb.ne.jpドメインのEメールが利用できないトラブルが12日に発生した。KDDIの発表によると、障害が発生したのは12日18:26で、13日15:55に復旧したとのこと。

栃木県小山市の設備拠点で火災報知器が作動、その影響とされている。「現在火災などが発生している状況はありません」とあるが、朝日新聞では「機器が燃える火災が起き、メールサーバーを含めた施設内の機器が自動停止した」「出火元は社外の人が入れない場所」とも報じられている

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • DCだと、水で消火するわけにいかないので
    火災検知→窒息消火(ハロンガス?)作動→空調停止→機器温度上昇→サーバ停止→障害発生

    という流れだった、みたいなことをどこかで見た。

    • by Anonymous Coward on 2015年07月14日 14時40分 (#2847371)

      http://k-tai.impress.co.jp/docs/news/20150713_711403.html [impress.co.jp]

      待機系と本番系を極力リスク分散するってのが、一番大事ですね。
      火災原因は分かりませんが、またオゾン層が破壊されたという事実だけは間違い無さそうです。

      親コメント
    • by Anonymous Coward on 2015年07月14日 22時32分 (#2847634)

      排煙のために火災を検知したら空調を止めることが多いですが、データセンタの場合、
      空調が強力なので、ガスでの消火や酸素の供給を止めるためにも、空調を止めざるを得ません。
      ガス消火もかなり強力なので、放出時の振動でストレージがやられることがあります。
      無事だったとしても、空調が止まるとものすごく暑くなるので、サーバは、運がよければ
      シャットダウン、悪ければ熱暴走します。サーバの消費電力と同じくらいの電力を空調で
      くってるので、空調停止は致命的です。

      なので、火災を検知した時点で、火災に規模によらず、そのセンタは大規模障害確定なんですよ。

      同一センタ内で、本番系と待機系のロケーションを分ける意味はあまりないです。
      センタの障害を想定するなら、異なるセンタにサーバを立ててください。

      古いセンタだと、実際に火災が発生していなくても、火災の誤検知で同様の障害が
      発生する可能性があります。年1回運用訓練できる電源系とちがって、火災の運用訓練は
      机上でしかできないから、この手の障害の影響って、知らない人多いんですよ。

      親コメント
      • by Anonymous Coward

        火災シミュレーション関連のイベントに行くと、従来の建築設計屋か研究者ばかりだったんだが、
        最近コンピュータ屋さんを見かけるのはそのせいか。

    • by Anonymous Coward

      非常時の運営がちゃんとできてるとこなら、バックアップ拠点や縮退モードへの移行やらは自動的に実行されるはずなんだけどなぁ。
      爆発事故や意図的なテロにやられたとかならともかく、ボヤや小規模火災程度で丸一日も停止したんじゃインフラとしては失格レベル。

      • by Anonymous Coward on 2015年07月14日 17時48分 (#2847499)

        #2847371で貼られたニュース記事 [impress.co.jp]によれば、
        予備系統が発火して停止→消火設備作動・空調停止→温度上昇で同じ室内にあった本系統が停止、と言う流れのようです。
        …遠隔地に設置どころか同一地域内分散ですら無く、同一施設の同一室内ってどうなってるんだよ!

        施設単位で起きる電源障害や空調障害や回線障害には耐えられない。天災では間違いなく死ぬ。
        インフラの一種なのにシステム単独の障害にしか対応できない体制ってよくそれでやってこれたな…

        親コメント
  • by Anonymous Coward on 2015年07月14日 12時38分 (#2847279)

    TELEHOUSE Oyama
    http://www.datacentermap.com/japan/oyama/telehouse-oyama.html [datacentermap.com]
    https://plus.google.com/110198607045789084243/about?gl=jp&hl=ja [google.com]
    にだけezwebのDCがあったの?

    ほかのTELEHOUSEにふれなかったのかな?

    • by Anonymous Coward

      ezwebはIMAPなので、ユーザのメールがあるストレージが落ちたら難しいのではないでしょうか。
      さすがにミラーとかしてないだろうし。

  • by Anonymous Coward on 2015年07月14日 12時41分 (#2847282)

    まったく気付かなかった。

    • そして社会的な影響はどんだけあったんすかね。

      周りのauな人たちも困ってなかったのか話題にもしてなかった。

      親コメント
      • by Anonymous Coward on 2015年07月14日 12時58分 (#2847298)

        うちは会社専用ドメインあるので影響おおありでした
        結局遅延で届かずに今朝方にエラーメールが帰ってきて全部消滅

        親コメント
        • by Anonymous Coward

          デーモンにはたった1日の障害で配送をあきらめないで5日くらいがんばってほしい

          • by Anonymous Coward

            送信したこと忘れた5日も経ってから送信できませんでしたとか返してくるとかやだよ。
            送信失敗の理由くらいせめて1日か2日で知りたい。

            • 湾岸戦争とかソ連崩壊前夜くらいの電子メールはそんな感じで、郵便と同じような時間と信頼性の感覚だったと察されるような古文書というのがありますよね…

              # 問題は今でも当時のプロトコルやデーモンが使われてること

              親コメント
              • by Anonymous Coward on 2015年07月14日 16時20分 (#2847444)

                UUCPは「ポーリングが半日おき一日おきでメールが半日遅れる」とかは当たり前でしたよ。
                私も個人運用ドメインのメールは電話料金が安くなる早朝・夕方・深夜の3回しか発呼させなかったもの。
                UUCPサイトにさらにUUCPでぶら下がっているサイトだとさらに遅れるとも聞く。
                それでも郵便よりは早かった。

                だからこそ即時配送できるOCNエコノミー専用線は夢のような環境だった…
                あの時の感動は今でもありありと思い出される

                親コメント
              • by Anonymous Coward

                1990年ならもう少し早いと思うけど?

              • by Anonymous Coward

                 隣の研究室にメールを送ったら、米国経由で1週間かかった。
                という話を20年ほど前に聞きました。
                もちろん、日本国内の話です。

              • by Anonymous Coward

                そう。テレホーダイからOCNエコノミーに移行して時間を気にせずいつでもネットを使えるようになったのはとてもありがたかった。しかし、当時は少ない給料の1割以上も通信回線に使ってたんだなぁ。今思うと異常だ。

            • by Anonymous Coward

              1995年前後だっと思います、安かろう悪かろうのプロバイダのメールで、半年くらい前のメールの送信失敗がまとまって返って来たことがありました。大事な連絡はハンドシェークが必要だなとか言ってましたね。まだまだのんびりした頃でした。

          • by Anonymous Coward

            配送出来てませんが、まだ頑張ってます。
            みたいなメールが戻ってくれば、がんばっても良いかな。

            • そんなメールが来たらなんか応援したくなりますねw

              親コメント
              • sendmailのデフォルト設定だと以下のような「配送出来てませんが、まだ頑張ってます」ってメールがが来るようになってるはず。

                From: Mail Delivery Subsystem
                Subject: Warning: could not send message for past 4 hours
                (略)
                451 example.com: Name server timeout
                Warning: message still undelivered after 4 hours
                Will keep trying until message is 5 days old

                (訳: 送信開始から4時間経ったけどまだ配達できてません。まだまだ5日目までは頑張ります)

                親コメント
              • by Anonymous Coward

                やべぇ、その機能知らなかった。
                誰か、そのメールの生成部分に怪しげな疑似人格組み込んでくれんもんかな。
                # xxx の宛先だけ無視しても良いですか?とか聞いてくれると助かるんだが。

                …どこかから、適当にそれらしいの拾ってきて作ってみるか。

              • by rin_penguin (9144) on 2015年07月14日 16時00分 (#2847427)

                で、5日後までダメなら「やっぱダメでしたーー!」って通知も来るはず。
                実装の根拠としてはRFC5321に「4~5日くらいはがんばれ」って書いてあるから。

                親コメント
      • by Anonymous Coward on 2015年07月14日 13時58分 (#2847350)

        サーバー監視のメールを携帯に飛ばしているので、
        業務に支障が出ました。

        監視スタッフが、同じキャリアを使ってなくて良かったです。
        そんな所でも、冗長化しないといけないのかと、その点では
        教訓になったと言えるかな。

        親コメント
        • >監視スタッフが、同じキャリアを使ってなくて良かったです。
          >そんな所でも、冗長化しないといけないのかと、その点では
          >教訓になったと言えるかな。

          それはわりと重要そうですね。

          gmailとgoogleに頼りきりな自分の環境が怖くなってきた。

          以前トラブルでスマホが使えなくなって、代わりの機種を用立てて使おうとしたのですが。
          最初にGoogleのアカウントを登録しようとしたら、二段階認証にしてたので携帯のSMSが使えないとどうにもならなくて焦ったことがあったっけ。
          docomoのサービスカウンターで「googleでの認証を二段階認証にしてるので、先にSMSで受信できないと認証ができない」という説明をしたんだけど、説明の仕方が悪いのか二段階認証そのものを知らないようで全く話が通じず・・・
          結局googleアカウント設定しなくても今のスマホは利用できるとのことで事なきを得ました。

          docomoでも二段階認証を始めてるはずだけど、カウンターに居る人達はそれも知らなかったしで、大丈夫かと思ったのは要らぬお節介。

          親コメント
        • by Anonymous Coward on 2015年07月14日 21時39分 (#2847609)

          NTT西関係の中の人なんですが、そういえばカスタマ系の修理担当は
          業務用端末にau端末を所持してますね。
          本来なら業務用端末はドコモ端末なんですが、
          ドコモ基地局の障害時の対応が必要な場合がある
          (基地局自体はドコモが対応するけれども回線側の障害時に携帯が使えない時がある)
          ってことであえてauを用意してるとか。
          キャリアの冗長化も必要ですよね。

          親コメント
        • by Anonymous Coward

          > サーバー監視のメールを携帯に飛ばしているので、業務に支障が出ました。

          SMS でやろう! Twilio とか使って。

      • by Anonymous Coward

        とある社会人サークルを運営していますが、auな人たち大困りでした。
        メーリングリストだと、不達の際に誰が届いていないのかわからず、ちょっとした混乱がおきました。

        高校生・大学生もメールは多用するみたいで、困っている子は多かったですね。

        • あらそうなんだ、そのへんの若い人たちっててっきりみんなもうLINEとやらでやってるのかと思ってた。

          MLってもう仕事先でしか使ってないなぁ・・・

          親コメント
          • 社会人サークルって書いてますから、社会人だと Line を使いたくない人も
            少なからず居るようなので、ML使ってるんでしょうね。

            自分もMLは仕事でしか使ってないですね

            親コメント
          • by Anonymous Coward

            自分が知る限り高校生はLINEですね。もしかしてなりすまし高校生?

            • by Anonymous Coward on 2015年07月14日 15時39分 (#2847412)

              社会人サークル運営のACです。

              LINEはもちろんもっともメジャーなツールですが、少しフォーマルだったり、知人以上友達未満だとメールっぽいですね。
              社会人サークルに飛び込んでくるような高校生だとやっぱそこらへん使い分けるみたいです。

              #LINE教えて下さい!とか言われるとちょっと嬉しいAC

              親コメント
            • by Anonymous Coward

              あなたが知る限りの高校生と、それ以外の高校生ではどちらが多いのか判断できないけど。
              あなたが知らない高校生ならなりすまし高校生かもしれないという認識の仕方は面白いね。

      • by Anonymous Coward
        携帯絡みの開発で、テストスケジュールの組み替えしないと行けなくなりました・・・・。
        今日実施したら、受信側機器のトラブルで全く進まず・・・orz。
        #設定のようだが、受信機器の設定まではこっちの担当じゃ無いのに・・・
  • by Anonymous Coward on 2015年07月14日 13時24分 (#2847327)

    昨日は

    「1000万円当たりました」とか、
    「久しぶり、アドレス変わりました (名前も前のアドレスも書いてない)」

    みたいな迷惑メールが来なかったのかww

    #フィルタや指定ドメイン受信は設定してるが、AU携帯からか、それに偽装して送ってくるから役にたちゃしない

  • by Anonymous Coward on 2015年07月14日 15時19分 (#2847395)

    というクビ切られ社員の報復ではないよね?ロボコップの字幕版で知りました、クビはfireなのかー。

    • by Anonymous Coward

      私はBackToTheFutureで知ったクチ

    • by Anonymous Coward

      fireされた次は、求人への application を頑張らないとですね。

  • by Anonymous Coward on 2015年07月15日 1時23分 (#2847685)

    どこを渡ってるのか

typodupeerror

普通のやつらの下を行け -- バッドノウハウ専門家

読み込み中...