SlideShare ist ein Scribd-Unternehmen logo
1 von 30
Downloaden Sie, um offline zu lesen
なぜネットワーク運用自動化が
進まないのか
〜とあるNW屋の泣き言〜
Why  is  it  difficult  
to  automate  network  operation
Taiji  Tsuchiya
2015/4/24 wakamonog x ssmjp x BIGLOBE = wasabi
Introduction
•  土屋 太二(Taiji  Tsuchiya)
– 28  years  old
– Twitter:@taijijiji
•  お仕事  Responsibility
– ネットワークエンジニア
Network  Engineer
– ISPコアネットワークの運用  
Network  operation  of  ISP  backbone
ネットワーク運用のお仕事
Work  of  network  operation
•  ルータの設定  Configuring  routers
•  設定手順書の作成  Creating  operation  manuals
•  トラフィック制御  Controlling  traffic
•  ネットワーク資源や構成情報の管理
Managing  network  topology  and  resources
•  機器の増強、廃止、リプレイスRenovating  equipment
•  回線やDCラックの調達  Provisioning  circuits  and  racks
ネットワークの自動化事情
Current  issues  surrounding  network  automation
•  サーバインフラと比べて
自動化が進んでない
Compare  to  servers,  there  has  not  been  as  much  
advancement  in  automation  
•  Immutable  Infrastructureや
Infrastructure  as  codeとは別世界
  Underlying  problems  differ  from  the  above  concepts
Why did this happen?
理由その1
Reason  1
操作対象OSが多い
Many  different  OSs
Manufacturer	
 OS	
Cisco	
IOS	
  (IOS-­‐XE)	
IOS-­‐XR	
NX-­‐OS	
Juniper	
 JUNOS	
Brocade	
NetIron	
Network	
  OS	
Arista	
 EOS	
_人人人人人人人人人_	
> メーカー独自のCLI <	
 ̄Y^Y^Y^Y^Y^Y^Y^Y ̄	
Manufacturer-­‐specific	
  CLI
理由その2
Reason  2
標準的な外部APIが
確立されていない
No  standard  API
Manufacturer	
 OS	
 API	
Cisco	
IOS	
  (IOS-­‐XE)	
 •  OnePK(*)	
  
•  NETCONF	
IOS-­‐XR	
 •  OnePK(*)	
  
•  NETCONF	
NX-­‐OS	
•  OnePK(*)	
  
•  NX-­‐API(*)	
  
•  NETCONF	
Juniper	
 JUNOS	
•  JUNOS	
  XML	
  Protocol(*)	
  
•  REST	
  API	
  
•  NETCONF	
Brocade	
NetIron	
   •  NETCONF	
  
•  REST	
  API	
Network	
  OS	
Arista	
 EOS	
 •  eAPI(REST	
  API	
  )	
(*) メーカ独自API
manufacturer-­‐specific	
  API	
※1 最新OSの対応状況ですが、Versionによって大きく異なります。
※2 ネットワーク装置の場合「バグの枯れ」を重視するため
   最新OS versionを導入するケースはほとんどありません。
Industry prefers low risk vs. improving on old OS versions
さくらインターネット 湯澤 民浩さん資料より引用
Internet Week 2014 ようこそ、ネットワーク運用自動化の世界へ!
https://www.nic.ad.jp/ja/materials/iw/2014/proceedings/s4/	
結果的にこうなりがち
Ultimately,  need  to  develop  specific  program  per  device.
理由その3
Reason  3
作業失敗時の
影響が大きい
Scope  of  risk
失敗時の影響
Scope  of  risk
•  サーバ :   数サービス 通信断
Server  :  Handful  of  services  may  go  down  
•  DC系スイッチ : 数十サービス 通信断
DC  swtichs  :  Limited  numbers  of  services  may  go  down  
•  コア系ルータ :    エリア 全断
Core  router  :  ALL  DOWN
5/17/15	
_人人人人人人人人人人_	
> 失敗したら総務省 <	
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y ̄	
Must  report  to  government
理由その4
Reason  4
エンジニアのスキルが
自動化から遠い
Lack  of  know-how
エンジニアの得意領域
preferred  fields
ネットワーク屋
network  engineer
•  ルータCLIマスター
router  CLI
•  Cisco/Juniper
なんでも来い
•  パケットに強い
packet  analysis
•  トラフィック制御が得意
traffic  control
•  サーバといえばDNS
サーバ屋
server  engineer
•  Linux/Unixマスター
•  Ubuntu/FreeBSD
なんでも来い
•  DBやWebサーバに強い
•  LL言語が得意
light  weight  language
•  ネットワークといえば
iptables
自動化開発に必要なスキルはこっち Key for automation
理由その5
Reason  5
自動化のアイディアが
出づらい文化
Culture  hard  to  break  through
ネットワークエンジニアの文化
Culture  of  network  engineer
•  染み付いたCLI文化      Strong  CLI  culture
•  インフラの分業化によって、入社時から
Ciscoスペシャリストを目指しがち
Higher  incentive  for  narrow  specialization  
•  技術革新がとても遅く、実装はメーカ次第
Manufacturers  slow  to  innovate  and  adopt  change.  
•  開発者  =  メーカの人
Developers  equal  manufacturers
理由その6
Reason  6
手作業で
なんとかなる作業量
Quantity  of  work  less  than  servers
作業量
Quantity  of  work
•  サーバ:      Servers
– 数千〜数万台  Several  tens  of  thousands
– 1台あたりの作業:  週に1-2回    
A  few  times  a  week  per  device
•  ネットワーク機器:      Network  devices
– コア: 10−100台
Core  devices:  A  several  dozen
– データセンタ 数百〜数千台
Data  Center  devices:  A  several  thousands
– 1台あたりの作業:  数ヶ月に1回
Once  several  months  per  device
※個人的な感覚で書いてます
理由その7
Reason  7
インフラ要員
人減らされがち
Not  enough  engineers
ネットワーク屋の働く環境
Environment  of  network  engineers
•  運用要員は必要最低限
The  number  of  engineers  is  minimum
•  開発にまとまった時間がさけない
Cannot  keep  enough  time  for  development
•  1件の障害で1週間の予定が吹き飛ぶ
Time  is  robbed  by  incidents
•  学習コストを乗り超えるのに決死の覚悟
Learning  cost  is  large
泣き言をたくさん言いましたが
やれる理由もありまぁす!
But  there  are  many  reasons  for  automation!
自動化をやれる理由
Points  in  favor  of  automation
•  ルータの自動操作は厳しいが、
状態取得は比較的容易
–  みんな大好きSNMP
      Automating  router  configuration  may  difficult,  but  automating  the  
retrieval  of  router  status  is  easy  using  SNMP.
•  ルータ操作以外の運用業務もたくさん
–  ルータを設定
–  設定を入れるための手順書を作成
–  トラフィック制御
–  ネットワーク資源や構成情報を管理
–  機器の増強、廃止、リプレイス
–  回線やDCラックの調達
There are many important things
other than router configuration
Automating configuration manuals
Managing network resources and
topology information
開発の敷居が下がってきた
It’s  getting  easier  to  develop  software
•  整備されたWeb開発フレームワーク
– Python  :  Django,  Flask
– Ruby  :  Rails
•  構成管理ツール
– Chef
– Ansible
– Fabric
Web Frameworks	
Provisioning Tools
ネットワーク業界の気になる動き
•  NETCONF
•  Open  Daylight
•  Whitebox  Switch
5/17/15	
Interesting industry developments
NETCONF(Network  Configuration  Protocol)  
•  XMLを利用したルータ管理プロトコル
•  RFC6241で標準化
•  業界の標準的なAPIを作る目的
•  現時点ではメーカごとにXML記述が異なる
– YANGモデル対応が一つの鍵
Open  Daylight
•  Linux  FoundationのOSSプロジェクト
•  SDNコントローラプラットフォームを協業開発
•  主要なネットワーク機器メーカや
サーバメーカが参加
Whitebox  Swtich
•  ODMベンダ製スイッチ
– ソフトウェアOSはユーザ自ら選ぶ
•  クラウドやコンテンツ屋のニーズから登場
•  実態としては、ネットワーク機能のある
Linuxサーバ
•  サーバと同様の管理ツールを利用可能
環境が揃ったら、あとやるしかない
Once  the  environment  is  set,  just  get  it  done!
•  エンジニアのスキルが試される時代
Network  engineers  need  a  variety  of  skills
•  泣きながら一歩ずつ山登るしかない
try,  try,  try
•  ひと山登れたら、情報共有しましょう!
Let’s  share  our  own  findings  and  achievements!
個人的な成果物は
published  on  github/Qiita
に公開していきます(これからね。。。)
https://github.com/taijiji
http://qiita.com/taijijiji
まずは自分から恥を晒します
My  working  projects...
ネットワーク業界にも
開発の輪が拡がると幸せ
I  hope  to  widen  the  circle  of  
automation  for  network  operations.
まとめ  Summary
自動化が進まない理由
1.  操作対象OSが多い
2.  標準的な外部APIが確立されていない
3.  作業失敗時の影響が大きい
4.  エンジニアのスキルが自動化から遠い
5.  自動化のアイディアが出づらい文化
6.  手作業でなんとかなる作業量
7.  インフラ要員  人減らされがち
自動化がやれそうな理由
1.  ルータの情報取得は比較的容易
2.  開発の敷居が下がってきた
3.  ネットワーク業界の気になる動き
NETCONF  /  Open  Daylight  /  ホワイトボックススイッチ
ネットワーク業界にも開発の輪を広げたい

Weitere ähnliche Inhalte

Mehr von Taiji Tsuchiya

Changing Infrastructure operation by DevOps And Agile Development
Changing Infrastructure operation by DevOps And Agile DevelopmentChanging Infrastructure operation by DevOps And Agile Development
Changing Infrastructure operation by DevOps And Agile Development
Taiji Tsuchiya
 
ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜
ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜
ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜
Taiji Tsuchiya
 

Mehr von Taiji Tsuchiya (20)

NetOpsCoding#5 introduction
NetOpsCoding#5 introductionNetOpsCoding#5 introduction
NetOpsCoding#5 introduction
 
Changing Infrastructure operation by DevOps And Agile Development
Changing Infrastructure operation by DevOps And Agile DevelopmentChanging Infrastructure operation by DevOps And Agile Development
Changing Infrastructure operation by DevOps And Agile Development
 
JSNAPyとPyEZで作る次世代ネットワークオペレーションの可能性
JSNAPyとPyEZで作る次世代ネットワークオペレーションの可能性JSNAPyとPyEZで作る次世代ネットワークオペレーションの可能性
JSNAPyとPyEZで作る次世代ネットワークオペレーションの可能性
 
クラウド型データセンタにおけるSDNの適用事例(Paper)  Case Studies of SDN in Cloud Datacenter
クラウド型データセンタにおけるSDNの適用事例(Paper)  Case Studies of SDN in Cloud Datacenterクラウド型データセンタにおけるSDNの適用事例(Paper)  Case Studies of SDN in Cloud Datacenter
クラウド型データセンタにおけるSDNの適用事例(Paper)  Case Studies of SDN in Cloud Datacenter
 
クラウド型データセンタにおけるSDNの適用事例
クラウド型データセンタにおけるSDNの適用事例クラウド型データセンタにおけるSDNの適用事例
クラウド型データセンタにおけるSDNの適用事例
 
Introduction to NetOpsCoding#3
Introduction to NetOpsCoding#3Introduction to NetOpsCoding#3
Introduction to NetOpsCoding#3
 
ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜
ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜
ネットワーク運用自動化の実際〜現場で使われているツールを調査してみた〜
 
Introduction to NetOpsCoding#2
Introduction to NetOpsCoding#2Introduction to NetOpsCoding#2
Introduction to NetOpsCoding#2
 
インターネットの舞台裏
インターネットの舞台裏インターネットの舞台裏
インターネットの舞台裏
 
BMP Test Results
BMP Test ResultsBMP Test Results
BMP Test Results
 
教えて前村先生
教えて前村先生教えて前村先生
教えて前村先生
 
ルータコンフィグのGit管理のススメ 〜Git管理以外を自動化してみた〜
ルータコンフィグのGit管理のススメ 〜Git管理以外を自動化してみた〜ルータコンフィグのGit管理のススメ 〜Git管理以外を自動化してみた〜
ルータコンフィグのGit管理のススメ 〜Git管理以外を自動化してみた〜
 
wakamonog update 2015
wakamonog update 2015wakamonog update 2015
wakamonog update 2015
 
"運用"におけるイノベーションを考える
"運用"におけるイノベーションを考える"運用"におけるイノベーションを考える
"運用"におけるイノベーションを考える
 
インターネットの仕組みとISPの構造
インターネットの仕組みとISPの構造インターネットの仕組みとISPの構造
インターネットの仕組みとISPの構造
 
ISPネットワーク運用で覗いてるもの
ISPネットワーク運用で覗いてるものISPネットワーク運用で覗いてるもの
ISPネットワーク運用で覗いてるもの
 
BMP共同検証
BMP共同検証BMP共同検証
BMP共同検証
 
Introduction to NetOpsCoding
Introduction to NetOpsCodingIntroduction to NetOpsCoding
Introduction to NetOpsCoding
 
NetOps Coding#1 のお知らせ
NetOps Coding#1 のお知らせNetOps Coding#1 のお知らせ
NetOps Coding#1 のお知らせ
 
なぜネットワーク運用自動化が進まないのか Whitebox switch編
なぜネットワーク運用自動化が進まないのか Whitebox switch編なぜネットワーク運用自動化が進まないのか Whitebox switch編
なぜネットワーク運用自動化が進まないのか Whitebox switch編
 

Kürzlich hochgeladen

Kürzlich hochgeladen (12)

知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 

なぜネットワーク運用自動化が進まないのか Why is it difficult to automate network operation