
25日に発生したFOMAの通信障害、原因はスマートフォンのVoIPやチャットアプリ? 69
ストーリー by hylom
皆様そんなに常時パケットを流すアプリを使っているのだろうか 部門より
皆様そんなに常時パケットを流すアプリを使っているのだろうか 部門より
あるAnonymous Coward 曰く、
1月25日の午前中、東京都でFOMAの音声・パケット通信が利用しにくくなる障害が発生したが、NTTドコモが26日、その原因について発表した。
これによると、スマートフォン契約者の増加に対応するため新型パケット交換機の切り替えを実施したのだが、この新型パケット交換機がトラフィック上昇によって動作不安定になったのが直接の原因だという。『頻繁に「制御信号」を必要とするスマートフォンのアプリケーション(VoIP、チャット等)が急激に普及したことに伴い、ネットワーク上の制御信号が増加』したと、スマートフォンのアプリが要因としている。
問題の詳細は日経ITproで詳しく紹介されているが、裏側では新型パケット交換機を旧型に戻す、という作業があったそうだ。また、新型パケット交換機では同時接続数を重視したもので、1時間あたりに処理できる信号量については下がっていたという。NTTドコモ側はそれでも十分だと見積もっていたようだが、実際にはそれを超える信号量が流れていたそうだ。
パケット通信の本質は (スコア:5, 参考になる)
パケット通信の本質は、ondemandで通信を行うことです。
これはどういうことかというと、データバッファに一杯になった時点で、フレームが出て行きます。
つまりリアルタイムではない、しかしIPはリアルタイム性が要るので、カプセル化した場合には
回線ネイティブなアプリ(imode,音声)よりも高頻度で出て行きます。(トラフィック増加)
VoIPなんて、UDPでばしばし出すでしょう、アプリ層での制御フレームもあるはずです。
アプリ層で制御フレーム出すもんだから、回線ネィティブな音声通信よりもはるかにシステムに
掛ける負荷は大きい。AMAZONで、缶コーラを一本ずつ買うようなもんです。
もともと、携帯のパケットシステムは音声フレーム(各CELP)の代わりに生データを流すように
したものからはじまっていますから継ぎ接ぎで、色々な技でIP流してます。
それがほころびたのがこないだのメール問題。
FOMA網にしたときにある程度整理したのですが、PDCも動いているため互換性が足枷になっています。
PDCが止まった後は、やれやれと思うんじゃないでしょうか>なかのひと
Re:パケット通信の本質なら (スコア:1)
今回の障害については、まだ良く分からない点も多いのですが、
>それがほころびたのがこないだのメール問題。
についてはミスリードな気がします。
例えるならむしろ
通話中の二人が同時にハンドオーバーしたら通話相手が変わってしまう。
という仕様をメールにおいて採用していたという仕様上の問題ですよね。
パケットの本質というならパケットは破棄されてメール不達の障害だけで済んだはずです。
原因? (スコア:4, すばらしい洞察)
原因は交換機の処理能力不足、もしくは処理能力の不足を想定できなかった見積もりミスでしょう。まるでVoIPやチャットアプリが悪さをしたかのような表現には違和感があります。
プレスリリースもあくまで背景としてそれらのアプリについて触れているだけで、別にそういうアプリに問題があるというような論調には見えないのですが、なぜこんなタレコミに化けてしまったんでしょうか。
Re: (スコア:0)
同じく違和感がありました。
通信障害の不満の矛先をアプリ使用者に向けて、「おまえらのせいで、通信障害が発生したんだぞ」っと
自らの手を汚さずに、ユーザー同士のやりあいでパケット量を減らしたいのが裏にあるんでしょうか。
あと、繋ぎっぱなしのプッシュ系のアプリ全般でないのかなとおもうのですが、
括弧で代表にあげてるアプリ名も電話会社としてやめてほしいアプリのような気がしますね。
まあ、おもってるだけだけど
Re:原因? (スコア:2)
私は、そういう印象は受けなかったですよ。
逆に具体例を挙げてくれなければ、何が原因なのか分からないじゃないですか。
報道資料(pdf) [nttdocomo.co.jp]でも、丁寧に説明されてますし、
今後の対策などにも言及しています。
> ユーザー同士のやりあいでパケット量を減らしたいのが裏にあるんでしょうか。
って、単なる被害妄想じゃないですか。
Re:原因? (スコア:1)
客やJRに責任をなすりつけるような説明を二転三転させた上、その根拠の説明もなくVoIPばかりを例に取り上げるようなことをしていてはね。
素直に信用しないのが普通だし、この機に乗じてVoIP潰しの種を蒔こうとしていると思われるのも普通でしょう。
Re: (スコア:0)
昨日そば屋でテレビでこのニュースを見かけたとき
「原因は『スマートフォンの急増』」なんて記事テロップが出てました。
ドコモの言い訳に対するあてこすりなのか意図有る誘導なのか、
はたまたよく理解してないだけなのか、これだけじゃ微妙ですね。
意味解析って難しい。
何でそんなことが (スコア:3, すばらしい洞察)
新サービスを始めるというなら、予測不可能性もある程度仕方が無いと思うが、
今動いているサービスで、必要な同時接続数や、帯域などのデータは十分すぎるほど持っているだろうに
なんでやっちまったのかな。
「見積もりが甘かった」って、見積もりじゃなくて実データ取れるよね。
Re:何でそんなことが (スコア:5, 興味深い)
データが取れてなかったんですよ。
今回入れ替えた機器で、やっとデータ取りもできるようになる予定でした。
同時接続数のデータはあったようです。それを元に容量を見積もっていて、それは問題が無かった。
しかし、「1時間当たりの接続数」のデータは従来型では取れなかったようです。
そのため、従来機器の「1時間当たりの接続数」性能が過剰だったと見積もられ、新型では能力が落とされました。
この過小評価が、今回のトラブルの原因です。
更に、20日に小規模に入れ替えて試験していたのに、機器の安定稼働を確認するに留まり、接続数の確認を怠りました。
これが決定的なミスとなります。
実績データが無い状態で容量見積もり失敗したのはまぁ仕方なかったとしても、小規模実地試験での試験項目になっていなかったのはマズいです。
従来型より性能が劣っている箇所があるにかかわらず、確認していないというのは初歩的ミスと言われてもしかたありません。
ここは他山の石としたい所ですね。
Re:何でそんなことが (スコア:2, 参考になる)
なるほど、スマートフォンが思ったより増加しなかったということですね
NTT資料よりまとめると、
[新型交換機の単体性能(従来比)]
同時接続数は7倍
処理能力も2倍
しかしシステムとしては、
【従来型パケット交換機(11台)】
同時接続数 88万
処理信号量 2750万
【新型パケット交換機(3台)】
同時接続数 180万
処理信号量 1410万(←減少)
スマホ用に同時接続数は増えたが、処理できる信号量はむしろ減っている。
というか減らしすぎ。コストダウンでしょうか。
#もっと従来機からスマホへの乗換が必要か? (この点でタレコミ記事はミスリード)
#やはり机上設計の根拠として、現場データは大事ですね
Re:何でそんなことが (スコア:2)
http://www.nttdocomo.co.jp/info/news_release/2012/01/26_00.html [nttdocomo.co.jp]
これかな?
想定負荷量: 71万接続/1200万信号
機器1台あたり: 60万接続/470万信号
茸「3台あったらまかなえる!」
ちょっとまて、予備系はどこいった?
Re:何でそんなことが (スコア:1)
えっ?
負荷分散させるために設置したパケット交換機をActive/Passive方式で設計してるって常識的に考えてありえないと思いませんか?
Re:何でそんなことが (スコア:1)
え~と、少し前のFOMAは大量通信をすると10分間通信規制がかかっていたと思いますが、1時間当たりのデータ量すらわからないのに、どうやって規制をかけていたんでしょう?
Re:何でそんなことが (スコア:1)
パケット数に対し課金するシステムがあるのでユーザに対して集計はできていたものの
地理的な軸での集計ができていなかったのでは?
Re: (スコア:0)
実データって、とれるのかな?
技術的には問題ないようにもおもうけど、倫理とかでやらなさそう。
下手に採取して個人情報がもれたら、いちユーザとして許さんよ。
Re:何でそんなことが (スコア:2, 興味深い)
固定電話の時代だって研究・開発のための実データの収集はやってましたよ
ただし音声データそのものを収集すると盗聴になるので、整流後の信号レベルの変化を記録するなどしてました
(それだけでもかなり役に立つデータが得られるそうです)
Re:何でそんなことが (スコア:2)
負荷とかのデータから個人情報って漏れるのかな。
スイッチ側でSNMPか何かでデータ取ってればそれで済むことなんじゃ・・・
ヽ(・Д . )ノ
Re: (スコア:0)
むしろやっててまったく不思議はないとしか思えないんですがね。
つい最近auがAirPushでやらかした(しかも情報収集は停止できないと明言した)ばかりだし。
Re: (スコア:0)
データは取れるだろうけど、ハードウェアのリプレースを含む開発だから、相当前から始まってるはず。
単純にそのときからの予測から大きく外れたということでしょ。
データは取れても、開発側からは常にモニタできるわけじゃない。
Re: (スコア:0)
予想以上の状態になっているのが分からなかったのは
現地事前調査しないで工事したのが原因なんだろう。
1/20に先行切替した分も性能不足で、容量は少しずつ
下がってたのかな。
単純に端末の性能が上がっているからじゃないの。
#いまどきチャットってあんた・・・。
Re: (スコア:0)
ハードの要件(同時接続数と信号量のバランス)を読み損ねたのは仕方ないと思います。
しかし複数台で構成されていてスケーラブルなシステムなはずで
入れ替える前に再度必要量を検討して余力を持たせた台数にするべきだったのではないかと。
それをやった結果が現行システムのバランスの悪さだから想定してたと思うんですがねぇ。
それにしても(能力-想定)が(実際-能力)より大きいってのはいくらなんでも?
「制御信号」の正体 (スコア:3)
が結局わからない。
制御信号の図 [nikkeibp.co.jp]を見るとAndroidとアプリが同種の"信号"を出してることになるのかな。
Re:「制御信号」の正体 (スコア:2)
わかんないですね。
チャットとVoIPはパケットの出し方がずいぶん違うような気がするし、
制御信号とかいうのは恐らくは物理層の話だろうしよくわからない。
制御信号というのはIP使えばかならず出るのかな? 特別なアプリを起動していない
Androidは、間欠的な同期処理に伴うデータのやり取りがある程度。
IPで持続的接続を行うようなアプリは定期的かつ割と頻繁に
パケットを飛ばすから駄目とか。
この図からは単純に通信使うアプリが増えたから倒れましたとしか
受け取れないけどなあ?
Re: (スコア:0)
それにしても「知らぬほど増えてたようで通信障害」というのは
QoSで聞きたい言い訳じゃなかったですね…。
Re:「制御信号」の正体 (スコア:2)
http://plusd.itmedia.co.jp/mobile/articles/1201/26/news091.html [itmedia.co.jp] によると
この制御信号とは、無線通信の準備のために端末とキャリア設備の間でやりとりされるもの。従来のiモードケータイ(フィーチャーフォン)では、発信・着信の際や、端末が移動して基地局が変わった場合に発生していた。
だそうです。
基地局が変わった際のセッション維持のための通信って感じですか。
NTTドコモの発表は味噌もクソも一緒にしている感じ (スコア:3)
ぱっと見て
・端末と基地局の接続に許可を出すための手順
・アプリが(IP層で)使う接続手順
という異なるものを "制御信号" でひとくくりにしているように思えるんですよねー
なんというか一般向けにわかり易く書こうとして、省略すると意味が通らなくなる大事なところを省いちゃった感じ。
こういうのは総務省に出す報告書でちゃんと書かれるんでしょうかね。
あと28分に1回という謎の数字もよくわからない。
Re:「制御信号」の正体 (スコア:1)
http://ja.wikipedia.org/wiki/%E5%85%B1%E9%80%9A%E7%B7%9A%E4%BF%A1%E5%8... [wikipedia.org]
なんとなくこれかなと思ってみました。
Re: (スコア:0)
便乗ですけど、同じく単位時間当りに処理できる「信号量」という量の定義がよくわからないです。
処理できるパケット数をバイトまでブレークダウンしたやーつー?
もとはといえば (スコア:2)
スマホでなくてもガラケーで十分なユーザーにも、スマホ売りまくったからでしょう。
従来の私どものiモード機と・・・ (スコア:1)
>「従来の私どものiモード機と、スマートフォンでさまざまな
>アプリケーションを使っているお客様では、信号量は1台
>あたり10倍くらいは違うのではないか」
>(NTTドコモ 岩崎文夫 取締役常務執行役員
まるで、iモードを使っておけば十分だ、という印象を受けますね。
ここの言葉だけでなく全体の印象も含めて。
10倍くらい・・・って全く見積もれてないのが明らか。
Re:従来の私どものiモード機と・・・ (スコア:1)
ドコモにはそんな(iモードを使っておけば十分だ、という)つもりはないのでしょうが、
実際、iモード機(いわゆるガラケー)で十分なはずの人もおおぜいいると思うんですけどねぇ…。
別にスマフォでなくてもいいような使い方しかしてないのに欲しがったり、
別にスマフォが欲しいわけじゃない人にまで売ろうとしたりしなくてもいいじゃん。
まあ、あれだけ、(ガラケーに比べて)スマフォを安売りしておいてこの障害はないだろ、とは思う。
# ちょっと前はSBMが通信障害頻発してたなぁ…ドコモの次はauかしら(すでにその徴候が?)
Re:従来の私どものiモード機と・・・ (スコア:1)
Docomoと同じ日(の夜)に起きていた様子
http://www.kddi.com/news/important/important_20120126081830.html
Re: (スコア:0)
まぁ、スマートフォンが好調って記事は大抵販売台数ベースだからね。
2台、3台持ちになってる奴もいるから、そりゃ、売れてるだろ。
でも、実際の加入者の割合でみると、せいぜい1割ぐらいのようだし。
Re: (スコア:0)
電話はガラケーでいいと思いますねー
しかし、タブレットの便利はもう分かってしまったので、iPad系の2台持ちとか増えそうです。
いや、まぁ、ガラケー持って、iPod持って、iPad持つならスマホにしろよ、と聞こえそうです-p
Re:従来の私どものiモード機と・・・ (スコア:1)
これ、若い人の普通の使い方ですよね。
電車なんかでよく見る「ウォークマンで音楽聴きながらガラケーで通話。でもう片手でiPhone いじっているの。
私なんか「iPhone1台で全部まとまるだろーー!」と心の中で突っ込んでます(笑)
Re:従来の私どものiモード機と・・・ (スコア:2, すばらしい洞察)
全部1台に集約したらバッテリーがもたないので分けているのであって
あなたに突っ込まれる謂れはございません。
原因が山田社長の能力にあると思っていた時期が私にもありました (スコア:1)
#座布団持ち山田君 VS ドコモ社長山田君
マッチポンプ (スコア:0)
http://050plus.com/pc/index.html [050plus.com]
兄弟会社であるNTTコムがVoIPアプリ配ってる状況で、
それが悪であるかの言い草は何なんでしょう。
じゃあ、NTTコムは他のキャリアにも高負荷を発生させる「悪」だってこと?
(しかもタダ乗りだし)
それとも、050plusは「綺麗なVoIPアプリ」なんでしょうか。
Re: (スコア:0)
050Plusは単にスマートフォン(iPhone/Android)のアプリだけじゃなくPC用のアプリケーションも配布して、一般固定回線でも使えるからモバイル網に特化した代物じゃないでしょうに。
※中古GALAXY SにぷららモバイルSIMで050Plusで普通に携帯電話(代用)として使ってますが。
やっちまった感があるよなぁ……… (スコア:0)
検証段階で接続数が多いとか報告なかったのかとか(握りつぶしたか?)、お詫び会見で050Plusとかに関する質問がなかったのかとか気になるなぁ。
私たちは悪くない! (スコア:0)
(一部の)ユーザが(利用しているアプリ)が悪い!
って言ってる?
Re:私たちは悪くない! (スコア:1)
Docomoの発表本文ではVoipは背景として記述しているだけで、原因は交換機の性能と書かれてる。
この記事の書き方が変。
言い訳は変遷してるけど (スコア:0)
新交換器(群)のキャパが旧交換器(群)のキャパより小さかったということだけは明らかで、
スマホや山手線や050plusはダウンの直接の原因ではないよね。
Re: (スコア:0)
まったくだ。
新旧のスペック比較表見たら誰でも「なんでキャパ減らしてんだよ」って思うよな。
自分も思ったw (スコア:2)
いままでが,2,750万でオーバースペックでした,
なのはわかった。そこは考慮してやろう。
だが,想定してたトラヒックが1,200万で
新型の処理能力が1,410万って,
だれが見てもヤバイだろ。
仕様は1410万、現実には1650万だった (スコア:3)
ドコモのプレスリリースもITProの記事もややまわりくどい。要は信号量の見積もりが間違っていた、というのが原因の本質ではないのか。事前(1年前)の見積もりが1200万(1時間あたり)で、設計仕様は1410万。実際には1650万(推定)だったので、たちまパンクした。同時接続数の見積もりの方は71万で、仕様は180万だから、設計上2.5倍もの余裕がある。信号量も見積もりの2.5倍にしなかったのは、傍目には不可解。いや不可解ではない、ちゃんとした理由がある、というのなら、聞いてみたいものである。
#1年の間にVoIPアプリが普及したのかもしれないが、そういったアプリを規制する考えは無いとも表明している。スマホが信号量の増大につながっているという問題意識は世界中で共有されているとも言う。
実際の信号量が把握されていなかったという話があるけど、それは本格稼動させる前に何とかなるのではないか。障害の本質を問うなら、実際の信号量を把握せずに全面移行した判断が問われるべきだろう。
ドコモのプレスリリース [nttdocomo.co.jp]を読むと、
どうも原発ムラと同じ匂いがしてくる気がする。
カカオとかラインの事だよな (スコア:0)
まあ、わかる気はする
早い話 (スコア:0)
今までの障害も含めて「見切り発車でした」ということでしょう。
スマートフォンは悪くないのに。
マスコミはネット叩きがやりたいんでしょうか。
大丈夫だ、問題ない (スコア:0)
見積もりが甘かったからといって処理能力をオーバーしたらすぐ全ロストするというのはどうなんでしょうね?
パフォーマンスが落ちたり一部のサービスが快適に利用できなくなる程度で抑えるわけにはいかなかったんでしょうか。
繋がりにくいという評価のソフトバンクでもこういうトラブルが頻繁に起こってる様子でもなし。
処理能力が余っているという前提で無線制御装置が『交換装置をいたわらない』設計にでもなってるんでしょうか?
みずほのときの「何があってもバッチを落とさない」 [srad.jp]のような設計のように感じてしまうんですけど。
Re:これを受けて (スコア:1)
NTTドコモに対しては、使わないアプリをアンインストールできるように各社に指導してもらえないだろうか。
Googleに対しては、Firewallかそれに代替できるものを実装して欲しい。(もちろんroot無しで)
不要な発信を規制できるようにしたい。