Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

201406ルーター開発イントロダクション

現在の200万フルルート対応ルータ開発におけるむつかしさを解説し,各社のデザイン方針,生き残りをかけた現況を紹介します.

  • Loggen Sie sich ein, um Kommentare anzuzeigen.

201406ルーター開発イントロダクション

  1. 1. ルーター開発 ~むつかしき問題~ 大江 将史<masa@fumi.org> 国立天文台 2014/6/11 Interop2014_C2-08 1 インタロップ2014講演資料抜粋
  2. 2. おことわり 詳細な調査に基づく発表としております.しか しながら,諸事情により,具体的な製造元など を細かくお伝えできない場面があることをご理 解ください. 本資料は,公開用のため,確信は記載されてい ません.講演に参加された方のみぞ知る話です. 2014/6/11 Interop2014_C2-08 2
  3. 3. ルーターとスイッチング ハードウェアの今を知る 何がむつかしいのかを知るために 2014/6/11 Interop2014_C2-08 3
  4. 4. ことばの確認 ルータとスイッチングハブ(スイッチ) •ルータとは? •Layer-3(L3)のIP層において,異なるネットワーク 間の通信を中継する機器 •ルータの基本 •ルーティング •届いたIPパケットの「宛先」を「経路表(ルーティングテーブル)」を参照 し,次の宛先,インターフェース等を把握 •経路表は,OSPFやBGPといったルーティングプロトコルでコントロール される. •フォワーディング •次の宛先へIPパケットを送ること 2014/6/11 Interop2014_C2-08 4
  5. 5. ここでのルータとは・・・ • 10G・100GbEのような広帯域に対応 し,キャリアにおいてインターネットの全経路 (通称フルルート)を処理する能力を有する機 器 • ルーティングプロトコルの信頼性が高い. 2014/6/11 Interop2014_C2-08 5
  6. 6. ことばの確認 ルータとスイッチングハブ(スイッチ) •Layer2(L2)スイッチとは? •データリンク層(Ethernet)において,適切なインター フェースへ通信を中継する •L2スイッチの基本 •スイッチング •届いたEthernetフレームの「宛先MAC」を,FIB(フォワーディング インフォメーションベース)から適切な宛先インターフェースを把握 •フォワーディング •宛先へEthernetフレームを送ること •L3スイッチ=ルータのようにルーティング(= スイッチング)とフォワーディングする. • 基本機能は,ルータに同じ 2014/6/11 Interop2014_C2-08 6
  7. 7. ポイント •L2でもL3でも •ルータでもスイッチングハブでも, 「受信」「宛先を検索」「送信」 が基本です. 2014/6/11 Interop2014_C2-08 7
  8. 8. 今の通信機器 10GbE/40GbE L2/L3 スイッチ,ルータと呼 ばれる製品の内部構成 ブロードコム BCM56840シリーズ スイッチ機能制御部 スイッチ機能 LSI 拡張I/F 電源 メーカーA 2014/6/11 Interop2014_C2-08 8
  9. 9. 今の通信機器 10GbE/40GbE L2/L3 スイッチ,ルータと呼 ばれる製品の内部構成 スイッチ機能LSI BCM56840 10GbE x 24 40GbE x 2 (10GbE x 4 x 2) スイッチ機能制御部 メーカーB 2014/6/11 Interop2014_C2-08 9
  10. 10. コアの部品は,同じ •汎用LSIの活用が垣間見れる •Broadcom Trident I / BCM56841A3KFRBG US$ 500 Cisco Nexus 3000/ Arista 7050 / Force 10 S4810 / Juniper QFX3500 他など Ethernet スイッチングLSIのベースに製品を仕上げる = 2014/6/11 Interop2014_C2-08 10
  11. 11. (参考) LSI・ASIC・FPGA •LSI •ターゲット・クロックを元に回路デザインをして作成,製造 •コスト高い,高性能を追及できる.CPU等 •汎用LSI一般に販売されている.既製品 •専用LSIメーカ専用品 •ASIC •既成のASIC上に,必要な機能を実装する. •高性能を追及ができないが,LSIより安価に開発,量産効果 •FPGA •メモリーのお化け,いつでも自由に回路を書き換えられる. •規模が大きくなるといろいろ課題も生じる.FPGAそのものが高 価 •たくさん使うなら,ASICほうが安いとも. 2014/6/11 Interop2014_C2-08 11
  12. 12. 機器の構成イメージ コア機能 制御部 (x86/PorwerPC) Linux / *BSD / 等OS ソフトウェア制御 • ルーティングプロ トコル • ループ検出 • スタッキング制御 • CLI (FPGA) (ASIC) (汎用LSI) • 独自プロトコルなどの実装用 • 独自のスイッチング実装 汎用LSIのSERDESなど一部機能 のみを利用する場合もある 専用LSIや汎用LSI ASICを利用 この点の実装で汎用LSIであっても 製品間の違いがでてくる. 2014/6/11 Interop2014_C2-08 12
  13. 13. (参考)L2/L3 LSI機能ブ ロックデザイン( 10GbE x 64 ports ) Forwarding Engine TCAM L3 Longest Prefix Match L2 MAC TCAM Buffer memory SERDES SERDES ACLTCAM SERDES: シリアル-パラレル変換 SERDES SERDES 2014/6/11 Interop2014_C2-08 13
  14. 14. (参考)汎用LSI シャーシスイッチ・高機能化 •スケーラビリティ:多段構成を組め る •ボックススイッチからシャーシスイッチまで可 •Broadcom Trident II StrataXGS BCM56850 •1.28T/960G/720Gbpsのシリーズ •1.28Tbps : 32port 40GbE •HiGIG (Broadcom バックプレーン間接続用通 信方式)とファブリックモジュール用BCM56750 によるモジュラー構造構成 •高機能サービス実装 •FCoE / VxLAN 出典: Broadcom BCM56850 data sheet 2014/6/11 Interop2014_C2-08 15
  15. 15. ベンダーの開発動向 • スイッチ・ルータ用に独自LSIを設計・製作する ベンダー • 上位機種に採用,汎用LSIも併用 • 下位機種は,汎用LSIを採用 • 高性能を手に入れ,マーケティングやビジネス上のリスクも負う • スイッチ・ルータ用に独自ASICを製作するベン ダー • ベースとなるASICのチップ上に設計パターンを乗せるイメージ • ちょっと前までは,ASICで十分な性能でした. • 汎用LSIの機能を利用,独自実装するより安い • スイッチ・ルータ用に汎用LSIを活用するベン ダー • ホワイトボックススイッチの台頭 2014/6/11 Interop2014_C2-08 16
  16. 16. 何がそんなに大変なの? ワイヤーレートとデバイスの限界 •ワイヤーレートでのルーティングを達成すること •パケットを受信 •ルーティングテーブル参照 •フォワーディング •パケット送信 次のフレームが来るまでに完了させないといけない. •処理能力は,バンド幅(bps)ではなく,フレーム (パケット)数(fps・pps)を基準に考える. •バンド幅の拡大=1フレームの処理の猶予が少なくなる I/Fバンド幅 ワイヤーレート時 百万FPS フレーム処理時間 1Gbps 1.488095 672μs 10Gbps 14.88095 67.2ns 40Gbps 59.5238 16.8ns 2014/6/11 Interop2014_C2-08 17
  17. 17. 帯域が拡大 高速化は幅ではなく時間が効いてくる !10Gbps = 約67nsの猶予 •DRAM •DDR/DDR2/DDR3と高速化! •いやそれは,車線(アクセス幅)が広くなっている. •車の速度,ビットを取り出せる時間はあまりかわらない. •遅延 49ns~+アクセスタイム •まとまったデータを取り出すのは早いけど,初動が重い. •SRAM •CPUのキャッシュなど,高価で電力も必要 •Sandy Bridge Core i3 3.3GHzの場合,L1:4Cycle(1.2ns) L2: 12Cycle(3.6ns) L3:27.85Cycle(8.355ns) / 1Cycle =0.3ns •初動が速いけど,コスト(DRAMの4倍~),電力消費(DRA Mの4倍) 2014/6/11 Interop2014_C2-08 18
  18. 18. 処理の猶予とメモリデバイスの速度 • TCAM(TernaryCAM) • MACやIPを高速に一定時間で検索する • 連想メモリ,保存ではなく「検索」のメモリー • 0-1ーdの3ステートにより,Longest Matc h検索やワイルドカードで検索できる. • SRAMの8倍以上の価格,SRAMの2倍以上の消費電力 • TCAMとSRAMを組み合わせる • どんな問い合わせでも一定時間(2クロック)で答えが出る. • 実装上はすごく有利 • ACL,L2,L3の検索に活用 • 40Mbit品でIPv4が100万エント リ • 51.2万経路 で18Mbit必要・IPv6なら12. 8万経路 2014/6/11 Interop2014_C2-08 19 TCAM 経路検索 インデックス SRAM 参照 経路確定
  19. 19. TCAMの乗せれば解決? •いわゆる力技・正攻法 •消費電力大,冷却設計,回路線長の限界 •いわゆる逃げ •100万経路(相当)対応,相当って? •経路の特性を利用して,経路を圧縮,TCAMを圧縮 2014/6/11 Interop2014_C2-08 20
  20. 20. ここまでのまとめ •ハードウェア視点から見ると,広帯域化は,L 3・L2の宛先検索がボトルネックになる L3フルルート(100万経路越え) L2MACアドレステーブル(大量のMAC) デカいテーブルは,デバイス技術の観点から コスト・消費電力・設計が大変. 2014/6/11 Interop2014_C2-08 21
  21. 21. ディスカッション 2014/6/11 Interop2014_C2-08 22
  22. 22. テーマ •生き残れるのはどこだ! •スイッチング機器 •ルータ機器 2014/6/11 Interop2014_C2-08 23
  23. 23. 生存競争 1)運用やプロトコルにより,開発制約を緩く する 2A)直球で勝負 ハード・ソフト開発の正常進化 2B)アイデアで勝負できる 実用性に耐えうる実装をアイデアで開発 3)別の道へ進む 2014/6/11 Interop2014_C2-08 24
  24. 24. 生き様1)冒険して高性能達成 ミッド・バックプレーンを廃止 •もちろん,ブレークスルーする ベンダーもあります. •例)ファブリックと各IOモ ジュールを直交接続化 • ミッドバックプレーンは,線 路長が与える物理的な制約によ り,高速化・低遅延化がむつか しくなる. •ASIC+汎用LSIで広帯域 化・低遅延を実現 • ただし,モジュールスロットの バリエーションが組めない. 2014/6/11 Interop2014_C2-08 25
  25. 25. 生き様2) 経路を圧縮してTCAM削減 •もちろん,ブレークスルーするベンダーもあり ます. •例)TCAMを増やすのではなく,ハッシュ化 や,多段構成で検索するなどにより,フルルー ト相当を実現. 2014/6/11 Interop2014_C2-08 26
  26. 26. 生き様概況・生き残れる? •ルーター直球開発 •ルーター変化球 •フルルートルーターじゃないけど・ •用途の集約化で設計効率を高める •汎用LSI活用 2014/6/11 Interop2014_C2-08 27
  27. 27. 鍛え上げられる=完成度が高くなる シェアを落とす=完成度は?? •生き残るためにベンダーは, 生存競争を正攻法やアイデア で生き抜く 2014/6/11 Interop2014_C2-08 28 変化球 • ハッシュなど経路の圧縮によるTCAM削減 • 必要十分に絞ったTCAM量 • カスタムLSI,汎用LSI,ASIC 正攻法 • カスタムLSI • 十分なTCAM
  28. 28. ハードウエア屋の悩みを知ると,ダ メなところが見えてくる •デバイスの壁にぶち当たってるベンダーから話を聞く と,IPv6は罪作りなプロトコル •「ハードウェアにやさしい」なんて教えられましたが・・・ •ルーティングテーブルがデカくなる可能性がある •デュアルスタック=TCAM2倍以上 •運用の「もしかして」に備えた「余裕」により設計が むつかしくなる •200万ルート,それとも100万ルート? •ベンダーは黙々と頑張りますが,こんな状況にみなさ んはどうお考えですか? 2014/6/11 Interop2014_C2-08 29
  29. 29. マルチから特定用途機器へ変化 •マルチこなす機器から特定用途向け視点を持った進化 •データセンタ事業者・キャリア事業者の視点でどうとらえていますか? •たとえば? •DCに必要な機能に絞ったホワイトボックススイッチ+オリジナルOS? •(参考)ルーター&スイッチのトレンド •低遅延性 •L2/L3テーブルサイズ •VxLAN・SDN •OpenFlow •PTP,パケットへのタイムスタンプ挿入 •スタッキング・ループ防止 •スイッチング帯域 多機能から費用対効果を考慮した用途別すみわけ 2014/6/11 Interop2014_C2-08 30

×