パスワードを忘れた? アカウント作成
1432551 story
NTT

25日に発生したFOMAの通信障害、原因はスマートフォンのVoIPやチャットアプリ? 69

ストーリー by hylom
皆様そんなに常時パケットを流すアプリを使っているのだろうか 部門より
あるAnonymous Coward 曰く、

1月25日の午前中、東京都でFOMAの音声・パケット通信が利用しにくくなる障害が発生したが、NTTドコモが26日、その原因について発表した

これによると、スマートフォン契約者の増加に対応するため新型パケット交換機の切り替えを実施したのだが、この新型パケット交換機がトラフィック上昇によって動作不安定になったのが直接の原因だという。『頻繁に「制御信号」を必要とするスマートフォンのアプリケーション(VoIP、チャット等)が急激に普及したことに伴い、ネットワーク上の制御信号が増加』したと、スマートフォンのアプリが要因としている。

問題の詳細は日経ITproで詳しく紹介されているが、裏側では新型パケット交換機を旧型に戻す、という作業があったそうだ。また、新型パケット交換機では同時接続数を重視したもので、1時間あたりに処理できる信号量については下がっていたという。NTTドコモ側はそれでも十分だと見積もっていたようだが、実際にはそれを超える信号量が流れていたそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2012年01月27日 10時33分 (#2088317)

    パケット通信の本質は、ondemandで通信を行うことです。
    これはどういうことかというと、データバッファに一杯になった時点で、フレームが出て行きます。
    つまりリアルタイムではない、しかしIPはリアルタイム性が要るので、カプセル化した場合には
    回線ネイティブなアプリ(imode,音声)よりも高頻度で出て行きます。(トラフィック増加)
    VoIPなんて、UDPでばしばし出すでしょう、アプリ層での制御フレームもあるはずです。
    アプリ層で制御フレーム出すもんだから、回線ネィティブな音声通信よりもはるかにシステムに
    掛ける負荷は大きい。AMAZONで、缶コーラを一本ずつ買うようなもんです。

    もともと、携帯のパケットシステムは音声フレーム(各CELP)の代わりに生データを流すように
    したものからはじまっていますから継ぎ接ぎで、色々な技でIP流してます。
    それがほころびたのがこないだのメール問題。

    FOMA網にしたときにある程度整理したのですが、PDCも動いているため互換性が足枷になっています。
    PDCが止まった後は、やれやれと思うんじゃないでしょうか>なかのひと

    • by Anonymous Coward on 2012年01月27日 13時48分 (#2088462)

      今回の障害については、まだ良く分からない点も多いのですが、

      >それがほころびたのがこないだのメール問題。
      についてはミスリードな気がします。

      例えるならむしろ
      通話中の二人が同時にハンドオーバーしたら通話相手が変わってしまう。
      という仕様をメールにおいて採用していたという仕様上の問題ですよね。

      パケットの本質というならパケットは破棄されてメール不達の障害だけで済んだはずです。

      親コメント
  • 原因? (スコア:4, すばらしい洞察)

    by Anonymous Coward on 2012年01月27日 6時55分 (#2088218)

    原因は交換機の処理能力不足、もしくは処理能力の不足を想定できなかった見積もりミスでしょう。まるでVoIPやチャットアプリが悪さをしたかのような表現には違和感があります。

    プレスリリースもあくまで背景としてそれらのアプリについて触れているだけで、別にそういうアプリに問題があるというような論調には見えないのですが、なぜこんなタレコミに化けてしまったんでしょうか。

    • by Anonymous Coward

      同じく違和感がありました。
      通信障害の不満の矛先をアプリ使用者に向けて、「おまえらのせいで、通信障害が発生したんだぞ」っと
      自らの手を汚さずに、ユーザー同士のやりあいでパケット量を減らしたいのが裏にあるんでしょうか。

      あと、繋ぎっぱなしのプッシュ系のアプリ全般でないのかなとおもうのですが、
      括弧で代表にあげてるアプリ名も電話会社としてやめてほしいアプリのような気がしますね。
      まあ、おもってるだけだけど

      • by haratake (365) on 2012年01月27日 10時20分 (#2088308)

        私は、そういう印象は受けなかったですよ。

        逆に具体例を挙げてくれなければ、何が原因なのか分からないじゃないですか。
        報道資料(pdf) [nttdocomo.co.jp]でも、丁寧に説明されてますし、
        今後の対策などにも言及しています。

        > ユーザー同士のやりあいでパケット量を減らしたいのが裏にあるんでしょうか。
        って、単なる被害妄想じゃないですか。

        親コメント
        • by yohata (11299) on 2012年01月27日 15時51分 (#2088557)

          客やJRに責任をなすりつけるような説明を二転三転させた上、その根拠の説明もなくVoIPばかりを例に取り上げるようなことをしていてはね。

          素直に信用しないのが普通だし、この機に乗じてVoIP潰しの種を蒔こうとしていると思われるのも普通でしょう。

          親コメント
    • by Anonymous Coward

      昨日そば屋でテレビでこのニュースを見かけたとき
      「原因は『スマートフォンの急増』」なんて記事テロップが出てました。
      ドコモの言い訳に対するあてこすりなのか意図有る誘導なのか、
      はたまたよく理解してないだけなのか、これだけじゃ微妙ですね。
      意味解析って難しい。

  • 何でそんなことが (スコア:3, すばらしい洞察)

    by Anonymous Coward on 2012年01月27日 6時08分 (#2088215)

    新サービスを始めるというなら、予測不可能性もある程度仕方が無いと思うが、
    今動いているサービスで、必要な同時接続数や、帯域などのデータは十分すぎるほど持っているだろうに
    なんでやっちまったのかな。

    「見積もりが甘かった」って、見積もりじゃなくて実データ取れるよね。

    • by Anonymous Coward on 2012年01月27日 11時01分 (#2088328)

      データが取れてなかったんですよ。

      今回入れ替えた機器で、やっとデータ取りもできるようになる予定でした。

      同時接続数のデータはあったようです。それを元に容量を見積もっていて、それは問題が無かった。
      しかし、「1時間当たりの接続数」のデータは従来型では取れなかったようです。

      そのため、従来機器の「1時間当たりの接続数」性能が過剰だったと見積もられ、新型では能力が落とされました。
      この過小評価が、今回のトラブルの原因です。

      更に、20日に小規模に入れ替えて試験していたのに、機器の安定稼働を確認するに留まり、接続数の確認を怠りました。
      これが決定的なミスとなります。

      実績データが無い状態で容量見積もり失敗したのはまぁ仕方なかったとしても、小規模実地試験での試験項目になっていなかったのはマズいです。
      従来型より性能が劣っている箇所があるにかかわらず、確認していないというのは初歩的ミスと言われてもしかたありません。
      ここは他山の石としたい所ですね。

      親コメント
      • by Anonymous Coward on 2012年01月27日 11時22分 (#2088338)

        なるほど、スマートフォンが思ったより増加しなかったということですね
        NTT資料よりまとめると、
        [新型交換機の単体性能(従来比)]
          同時接続数は7倍
          処理能力も2倍

        しかしシステムとしては、
        【従来型パケット交換機(11台)】
            同時接続数 88万
            処理信号量 2750万

        【新型パケット交換機(3台)】
            同時接続数 180万
            処理信号量 1410万(←減少)

        スマホ用に同時接続数は増えたが、処理できる信号量はむしろ減っている。
        というか減らしすぎ。コストダウンでしょうか。

        #もっと従来機からスマホへの乗換が必要か? (この点でタレコミ記事はミスリード) 
        #やはり机上設計の根拠として、現場データは大事ですね

        親コメント
      • by upken (38225) on 2012年01月27日 15時26分 (#2088543)

        え~と、少し前のFOMAは大量通信をすると10分間通信規制がかかっていたと思いますが、1時間当たりのデータ量すらわからないのに、どうやって規制をかけていたんでしょう?

        親コメント
        • by Anonymous Coward on 2012年01月27日 21時09分 (#2088749)

          パケット数に対し課金するシステムがあるのでユーザに対して集計はできていたものの
          地理的な軸での集計ができていなかったのでは?

          親コメント
    • by Anonymous Coward

      実データって、とれるのかな?
      技術的には問題ないようにもおもうけど、倫理とかでやらなさそう。
      下手に採取して個人情報がもれたら、いちユーザとして許さんよ。

      • by Anonymous Coward on 2012年01月27日 8時33分 (#2088243)

        固定電話の時代だって研究・開発のための実データの収集はやってましたよ
        ただし音声データそのものを収集すると盗聴になるので、整流後の信号レベルの変化を記録するなどしてました
        (それだけでもかなり役に立つデータが得られるそうです)

        親コメント
      • 負荷とかのデータから個人情報って漏れるのかな。
        スイッチ側でSNMPか何かでデータ取ってればそれで済むことなんじゃ・・・

        --
        ヽ(・Д . )ノ
        親コメント
      • by Anonymous Coward

        むしろやっててまったく不思議はないとしか思えないんですがね。
        つい最近auがAirPushでやらかした(しかも情報収集は停止できないと明言した)ばかりだし。

    • by Anonymous Coward

      データは取れるだろうけど、ハードウェアのリプレースを含む開発だから、相当前から始まってるはず。
      単純にそのときからの予測から大きく外れたということでしょ。
      データは取れても、開発側からは常にモニタできるわけじゃない。

      • by Anonymous Coward

        予想以上の状態になっているのが分からなかったのは
        現地事前調査しないで工事したのが原因なんだろう。

        1/20に先行切替した分も性能不足で、容量は少しずつ
        下がってたのかな。

        単純に端末の性能が上がっているからじゃないの。

        #いまどきチャットってあんた・・・。

      • by Anonymous Coward

        ハードの要件(同時接続数と信号量のバランス)を読み損ねたのは仕方ないと思います。
        しかし複数台で構成されていてスケーラブルなシステムなはずで
        入れ替える前に再度必要量を検討して余力を持たせた台数にするべきだったのではないかと。
        それをやった結果が現行システムのバランスの悪さだから想定してたと思うんですがねぇ。
        それにしても(能力-想定)が(実際-能力)より大きいってのはいくらなんでも?

  • by fuchikoma (2044) on 2012年01月27日 8時34分 (#2088245)

    が結局わからない。
    制御信号の図 [nikkeibp.co.jp]を見るとAndroidとアプリが同種の"信号"を出してることになるのかな。

    • by epgrec (43527) on 2012年01月27日 11時11分 (#2088334)

      わかんないですね。
      チャットとVoIPはパケットの出し方がずいぶん違うような気がするし、
      制御信号とかいうのは恐らくは物理層の話だろうしよくわからない。

      制御信号というのはIP使えばかならず出るのかな? 特別なアプリを起動していない
      Androidは、間欠的な同期処理に伴うデータのやり取りがある程度。
      IPで持続的接続を行うようなアプリは定期的かつ割と頻繁に
      パケットを飛ばすから駄目とか。

      この図からは単純に通信使うアプリが増えたから倒れましたとしか
      受け取れないけどなあ?

      親コメント
      • by Anonymous Coward

        それにしても「知らぬほど増えてたようで通信障害」というのは
        QoSで聞きたい言い訳じゃなかったですね…。

    • by yamanyon (36778) on 2012年01月27日 12時38分 (#2088381)

      http://plusd.itmedia.co.jp/mobile/articles/1201/26/news091.html [itmedia.co.jp] によると

      この制御信号とは、無線通信の準備のために端末とキャリア設備の間でやりとりされるもの。従来のiモードケータイ(フィーチャーフォン)では、発信・着信の際や、端末が移動して基地局が変わった場合に発生していた。

      だそうです。
      基地局が変わった際のセッション維持のための通信って感じですか。

      親コメント
    • by Anonymous Coward

      便乗ですけど、同じく単位時間当りに処理できる「信号量」という量の定義がよくわからないです。
      処理できるパケット数をバイトまでブレークダウンしたやーつー?

  • by skapontan (35455) on 2012年01月27日 12時31分 (#2088379) 日記

    スマホでなくてもガラケーで十分なユーザーにも、スマホ売りまくったからでしょう。

  • by Anonymous Coward on 2012年01月27日 9時28分 (#2088270)

    >「従来の私どものiモード機と、スマートフォンでさまざまな
    >アプリケーションを使っているお客様では、信号量は1台
    >あたり10倍くらいは違うのではないか」
    >(NTTドコモ 岩崎文夫 取締役常務執行役員

    まるで、iモードを使っておけば十分だ、という印象を受けますね。
    ここの言葉だけでなく全体の印象も含めて。

    10倍くらい・・・って全く見積もれてないのが明らか。

    • ドコモにはそんな(iモードを使っておけば十分だ、という)つもりはないのでしょうが、
      実際、iモード機(いわゆるガラケー)で十分なはずの人もおおぜいいると思うんですけどねぇ…。
      別にスマフォでなくてもいいような使い方しかしてないのに欲しがったり、
      別にスマフォが欲しいわけじゃない人にまで売ろうとしたりしなくてもいいじゃん。

      まあ、あれだけ、(ガラケーに比べて)スマフォを安売りしておいてこの障害はないだろ、とは思う。

      # ちょっと前はSBMが通信障害頻発してたなぁ…ドコモの次はauかしら(すでにその徴候が?)

      親コメント
      • >> ドコモの次はauかしら(すでにその徴候が?)
        Docomoと同じ日(の夜)に起きていた様子

        http://www.kddi.com/news/important/important_20120126081830.html
        親コメント
      • by Anonymous Coward

        まぁ、スマートフォンが好調って記事は大抵販売台数ベースだからね。
        2台、3台持ちになってる奴もいるから、そりゃ、売れてるだろ。
        でも、実際の加入者の割合でみると、せいぜい1割ぐらいのようだし。

      • by Anonymous Coward

        電話はガラケーでいいと思いますねー
        しかし、タブレットの便利はもう分かってしまったので、iPad系の2台持ちとか増えそうです。

        いや、まぁ、ガラケー持って、iPod持って、iPad持つならスマホにしろよ、と聞こえそうです-p

  • 旧態依然の社長にならって、新型パケット交換機もやっぱり旧型が一番☆なんですね。

    #座布団持ち山田君 VS ドコモ社長山田君
  • by Anonymous Coward on 2012年01月27日 8時17分 (#2088232)

    http://050plus.com/pc/index.html [050plus.com]
    兄弟会社であるNTTコムがVoIPアプリ配ってる状況で、
    それが悪であるかの言い草は何なんでしょう。

    じゃあ、NTTコムは他のキャリアにも高負荷を発生させる「悪」だってこと?
    (しかもタダ乗りだし)
    それとも、050plusは「綺麗なVoIPアプリ」なんでしょうか。

    • by Anonymous Coward

      050Plusは単にスマートフォン(iPhone/Android)のアプリだけじゃなくPC用のアプリケーションも配布して、一般固定回線でも使えるからモバイル網に特化した代物じゃないでしょうに。

      ※中古GALAXY SにぷららモバイルSIMで050Plusで普通に携帯電話(代用)として使ってますが。

  • by Anonymous Coward on 2012年01月27日 8時34分 (#2088246)

    検証段階で接続数が多いとか報告なかったのかとか(握りつぶしたか?)、お詫び会見で050Plusとかに関する質問がなかったのかとか気になるなぁ。

  • by Anonymous Coward on 2012年01月27日 9時40分 (#2088276)

    (一部の)ユーザが(利用しているアプリ)が悪い!
    って言ってる?

  • by Anonymous Coward on 2012年01月27日 9時47分 (#2088282)

    新交換器(群)のキャパが旧交換器(群)のキャパより小さかったということだけは明らかで、
    スマホや山手線や050plusはダウンの直接の原因ではないよね。

    • by Anonymous Coward

      まったくだ。
      新旧のスペック比較表見たら誰でも「なんでキャパ減らしてんだよ」って思うよな。

      • by ma_kon2 (9679) on 2012年01月27日 10時44分 (#2088324) 日記
        おまえら土管屋だろうよ,と。
        いままでが,2,750万でオーバースペックでした,
        なのはわかった。そこは考慮してやろう。

        だが,想定してたトラヒックが1,200万で
        新型の処理能力が1,410万って,
        だれが見てもヤバイだろ。
        親コメント
        • ドコモのプレスリリースもITProの記事もややまわりくどい。要は信号量の見積もりが間違っていた、というのが原因の本質ではないのか。事前(1年前)の見積もりが1200万(1時間あたり)で、設計仕様は1410万。実際には1650万(推定)だったので、たちまパンクした。同時接続数の見積もりの方は71万で、仕様は180万だから、設計上2.5倍もの余裕がある。信号量も見積もりの2.5倍にしなかったのは、傍目には不可解。いや不可解ではない、ちゃんとした理由がある、というのなら、聞いてみたいものである。

          #1年の間にVoIPアプリが普及したのかもしれないが、そういったアプリを規制する考えは無いとも表明している。スマホが信号量の増大につながっているという問題意識は世界中で共有されているとも言う。

          実際の信号量が把握されていなかったという話があるけど、それは本格稼動させる前に何とかなるのではないか。障害の本質を問うなら、実際の信号量を把握せずに全面移行した判断が問われるべきだろう。

          ドコモのプレスリリース [nttdocomo.co.jp]を読むと、

          3.発生原因
          ・ 頻繁に「制御信号」を必要とするスマートフォンのアプリケーション(VoIP、チャット等)が急激に普及したことに伴い、ネットワーク上の制御信号が増加しており、そのような状況の中で、新型パケット交換機への切り替えを実施したところ、制御信号がパケット交換機の処理能力をオーバーフローしたことが原因です。

          どうも原発ムラと同じ匂いがしてくる気がする。

          親コメント
  • by Anonymous Coward on 2012年01月27日 10時19分 (#2088307)

    まあ、わかる気はする

  • by Anonymous Coward on 2012年01月27日 10時29分 (#2088316)

    今までの障害も含めて「見切り発車でした」ということでしょう。

    スマートフォンは悪くないのに。

    マスコミはネット叩きがやりたいんでしょうか。

  • by Anonymous Coward on 2012年01月27日 11時40分 (#2088344)

    見積もりが甘かったからといって処理能力をオーバーしたらすぐ全ロストするというのはどうなんでしょうね?
    パフォーマンスが落ちたり一部のサービスが快適に利用できなくなる程度で抑えるわけにはいかなかったんでしょうか。
    繋がりにくいという評価のソフトバンクでもこういうトラブルが頻繁に起こってる様子でもなし。
    処理能力が余っているという前提で無線制御装置が『交換装置をいたわらない』設計にでもなってるんでしょうか?
    みずほのときの「何があってもバッチを落とさない」 [srad.jp]のような設計のように感じてしまうんですけど。

typodupeerror

Stay hungry, Stay foolish. -- Steven Paul Jobs

読み込み中...