SlideShare ist ein Scribd-Unternehmen logo
1 von 14
NIIで
いろいろな
Hadoop環境(だけじゃないけど)を
作ったり壊したり
動かし続けたりしている話
谷沢智史(株式会社ボイスリサーチ)
誰?
谷沢智史
◦ 株式会社ボイスリサーチ エンジニア
◦ GitHub/Twitter: @yacchin1205
昔: オンラインゲームとか映像コンテンツとか
今: クラウド運用とかロボットとか
国立情報学研究所(NII)でプライベートクラウドの運用支援
国立情報学研究所には…
所内研究者向けベアメタルクラウドサービス
◦ 研究クラウド / アカデミックインタークラウド
授業や研究のため、
ここでHadoopを動かしてます
学術機関 … 要求が多様
教材用途: VMベースにして自由に壊せるようにしたい / それを1週間だけほしいー
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
Baremetal
VM VM VM VM VM
NN
ZK
NN
ZK
ZK
DN
DN
DN
…
学術機関 … 要求が多様
分析用途: ログ集約にはFluentdがいいなあ / 認証つけて /
OpenTSDBってのを使いたいよね / しばらく維持し続けたい / etc…
Baremetal
DN
Region
Server
Baremetal
DN
Region
Server
Baremetal
DN
Region
Server
Baremetal
DN
Region
Server
Baremetal
DN
Region
Server
Baremetal
DN
Region
Server
Baremetal
DN
Region
Server
Baremetal
DN
Region
Server…
Baremetal
NN ZK
Baremetal
NN ZK
Baremetal
Master ZK
Baremetal
Fluentd
Baremetal
Fluentd
Open
TSDB
KDC
Master
KDC
Slave
KDC
Slave
Hadoopエコシステムは広大・・・!
構築・運用をどうやろう?
Hadoopの管理ツールを使う?
◦ ディストリビューションで完結できれば、とても便利なツールがあるが…
◦ 管理ツールがサポートするソフトウェアに利用を絞れれば使えそう
構成管理ツールを使う?
◦ 例えばAnsibleとか… 多くのRoleが公開されている
◦ 構築: うまくパラメータ化し、Playbookにまとめれば構成管理ツールで完結できそう
◦ 運用: 知識「どういうときに、何をやるべきか? 」の表現・共有は構成管理ツールで
は難しそう
Literate Computing
for Reproducible Infrastructure
Jupyter(旧IPython) + Ansible
実行コード
実行結果
説明
をNotebookとして、
ひとまとめに
構築・運用作業を
Ansible Playbookとして抽象化
インストールとか … 現在はHDP 2.3ベース / NTTデータさんのご協力
構築・運用作業を
Ansible Playbookとして抽象化
フォーマットとか
手順・説明をNotebookに
作業をAnsible経由で
特定のノードで何かコマンドをたたきたいとか
◦ 運用 … Decommissionに必要なコマンド実行/パッケージのアップデート…
手順だけでなく経緯の説明も
操作とともに説明を書いたりとか
Hadoop以外のものも
Hadoop以外のものも同じ枠組みでまとめられる
◦ Xenのインストールとか、Fluentdのインストールとか…
1年試してみた感触…
過去やったことを簡単に再現できる
◦ 状態を持っているものはダメだったりする – 事前条件のチェックなどを書き足す
「どうやればいいの?」に対して、Notebookを渡して「これ見て」で済む
◦ 済まない場合もある – 説明を書き足す
構築・運用作業のリファクタリングが大変
◦ 同じような操作をどうパラメータ化して、次以降に楽をするか?
◦ 作業の実施そのものが楽になる分… 操作や説明の継続的改善に取り組む必要
運用作業にもJupyter使ってみましょ!!!!!!!!!

Weitere ähnliche Inhalte

Andere mochten auch

TeXの後継として、HTML5&CSS組版〜Vivliostyleプロジェクト
TeXの後継として、HTML5&CSS組版〜VivliostyleプロジェクトTeXの後継として、HTML5&CSS組版〜Vivliostyleプロジェクト
TeXの後継として、HTML5&CSS組版〜VivliostyleプロジェクトShinyu Murakami
 
OSC2016 Kyoto Heat + Ansible + Jupyter
OSC2016 Kyoto Heat + Ansible + JupyterOSC2016 Kyoto Heat + Ansible + Jupyter
OSC2016 Kyoto Heat + Ansible + Jupyteririx_jp
 
RDOとPackstackのご紹介
RDOとPackstackのご紹介RDOとPackstackのご紹介
RDOとPackstackのご紹介Etsuji Nakai
 
Building Reproducible Network Data Analysis / Visualization Workflows
Building Reproducible Network Data Analysis / Visualization WorkflowsBuilding Reproducible Network Data Analysis / Visualization Workflows
Building Reproducible Network Data Analysis / Visualization WorkflowsKeiichiro Ono
 
ICST 2017 Day1 Opening Ceremony Research Track
ICST 2017 Day1 Opening Ceremony Research TrackICST 2017 Day1 Opening Ceremony Research Track
ICST 2017 Day1 Opening Ceremony Research TrackHironori Washizaki
 
インフラエンジニアの綺麗で優しい手順書の書き方
インフラエンジニアの綺麗で優しい手順書の書き方インフラエンジニアの綺麗で優しい手順書の書き方
インフラエンジニアの綺麗で優しい手順書の書き方Shohei Koyama
 

Andere mochten auch (8)

TeXの後継として、HTML5&CSS組版〜Vivliostyleプロジェクト
TeXの後継として、HTML5&CSS組版〜VivliostyleプロジェクトTeXの後継として、HTML5&CSS組版〜Vivliostyleプロジェクト
TeXの後継として、HTML5&CSS組版〜Vivliostyleプロジェクト
 
OSC2016 Kyoto Heat + Ansible + Jupyter
OSC2016 Kyoto Heat + Ansible + JupyterOSC2016 Kyoto Heat + Ansible + Jupyter
OSC2016 Kyoto Heat + Ansible + Jupyter
 
RDOとPackstackのご紹介
RDOとPackstackのご紹介RDOとPackstackのご紹介
RDOとPackstackのご紹介
 
LDA入門
LDA入門LDA入門
LDA入門
 
Building Reproducible Network Data Analysis / Visualization Workflows
Building Reproducible Network Data Analysis / Visualization WorkflowsBuilding Reproducible Network Data Analysis / Visualization Workflows
Building Reproducible Network Data Analysis / Visualization Workflows
 
ICST 2017 Day1 Opening Ceremony Research Track
ICST 2017 Day1 Opening Ceremony Research TrackICST 2017 Day1 Opening Ceremony Research Track
ICST 2017 Day1 Opening Ceremony Research Track
 
インフラエンジニアの綺麗で優しい手順書の書き方
インフラエンジニアの綺麗で優しい手順書の書き方インフラエンジニアの綺麗で優しい手順書の書き方
インフラエンジニアの綺麗で優しい手順書の書き方
 
Jupyter notebook
Jupyter notebookJupyter notebook
Jupyter notebook
 

Mehr von Satoshi Yazawa

Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみたJupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみたSatoshi Yazawa
 
ベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみた
ベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみたベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみた
ベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみたSatoshi Yazawa
 
dodaiのProvisioning周辺探訪 - dodai勉強会 #4
dodaiのProvisioning周辺探訪 - dodai勉強会 #4dodaiのProvisioning周辺探訪 - dodai勉強会 #4
dodaiのProvisioning周辺探訪 - dodai勉強会 #4Satoshi Yazawa
 
OpenStackとdodai - dodai勉強会 #1
OpenStackとdodai - dodai勉強会 #1OpenStackとdodai - dodai勉強会 #1
OpenStackとdodai - dodai勉強会 #1Satoshi Yazawa
 
NIIクラウドチームとDocker
NIIクラウドチームとDockerNIIクラウドチームとDocker
NIIクラウドチームとDockerSatoshi Yazawa
 

Mehr von Satoshi Yazawa (7)

Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみたJupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
 
ベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみた
ベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみたベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみた
ベアメタルクラウドの運用をJupyter NotebookとAnsibleで機械化してみた
 
dodaiのProvisioning周辺探訪 - dodai勉強会 #4
dodaiのProvisioning周辺探訪 - dodai勉強会 #4dodaiのProvisioning周辺探訪 - dodai勉強会 #4
dodaiのProvisioning周辺探訪 - dodai勉強会 #4
 
OpenStackとdodai - dodai勉強会 #1
OpenStackとdodai - dodai勉強会 #1OpenStackとdodai - dodai勉強会 #1
OpenStackとdodai - dodai勉強会 #1
 
NIIクラウドチームとDocker
NIIクラウドチームとDockerNIIクラウドチームとDocker
NIIクラウドチームとDocker
 
20120611 SC研究会
20120611 SC研究会20120611 SC研究会
20120611 SC研究会
 
20120518 SE勉強会
20120518 SE勉強会20120518 SE勉強会
20120518 SE勉強会
 

Kürzlich hochgeladen

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 

Kürzlich hochgeladen (8)

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 

NIIで いろいろな Hadoop環境(だけじゃないけど)を 作ったり壊したり 動かし続けたりしている話

Hinweis der Redaktion

  1. (タイトル)という題で、ボイスリサーチの谷沢が発表させていただきます。
  2. 自分はここ最近クラウド運用やロボットのお仕事をやらせていただいているのですが、この中でおこなっている、国立情報学研究所(NII)でのプライベートクラウド上でのHadoopの構築・運用について、お話しさせていただこうと思います。
  3. NIIには、プライベートクラウドとしてOpenStackベースのベアメタルクラウドを持っています。 授業や、研究目的でこのクラウド上でHadoop環境を構築、運用しています。
  4. 学術機関ならではかもしれないのですが、いろいろな要求があります。 たとえば、授業での教材としてHadoop環境がほしくなる場合があります。このように、ベアメタル1台当たり、XenでVMを立ち上げて、そのVM上にHadoopクラスタを1つずつ作ってほしい、なんてことがあったります。演習としてVMをつぶしてみたりとか実験をしてみるという目的に使うわけです。 他にも、
  5. 研究用途で複数のベアメタルでHadoopクラスタを構築するということもあるのですが、この際はKerberosもあわせて設定してよとか、Hadoop以外のソフトウェアも組み合わせてねということもあります。 今日のセッション、LTもさまざまな話題があるわけですが、Hadoopエコシステムは広大で、
  6. これをどのように構築・運用していくのかはなかなか悩ましいわけです。 例えばHadoopの管理ツールを使うという手がありますが、うまく管理ツールでカバーできる範囲に絞れればよいのですが、なかなかそれもうまくいかない場合があります。 また、構成管理ツールもいろいろあっていい感じなのですが、構築についてはPlaybookとしてうまくまとめられればそこで完結できるわけですが、運用については「どういうとき、何をすべきか」という部分をすべて書き下して構成管理ツールに閉じ込めるのはちょっと難しいのかなと思います。 そこで、
  7. NIIでは、IPython、今はJupyterと呼ばれていますが、このようなNotebookの環境を使って、Ansibleの能力を組み合わせながら、実行コード、実行結果、説明をひとまとめに管理しながら構築、運用作業をおこなう、ということをやってみています。
  8. 例えば構築の場面では、AnsibleのPlaybookとして、インストールに必要な処理とか、
  9. フォーマットに必要な処理をまとめて、これらのPlaybookを実行するコマンドをNotebookのセルに記述し、実行できるようにしています。実行結果はこのようにセルの下に表示されます。
  10. 個々の説明にはMarkdownが書けて、このように見出しを入れつつ、手順に沿って、説明を加えながら記述する、ということをやっています。実行可能な手順書という感じです。
  11. Playbookのほかに、コマンドを直接書いたりですとかも可能です。運用に必要なコマンド実行などはコマンドで書く場合が多いです。
  12. 個々のコードのすぐそばに経緯などもかけるので、あとでなんでこれやったんだっけ?みたいなことも割と少なくて済む気がします。
  13. 当然Hadoop以外の、仮想化基盤やアプリケーションもこのような形でまとめていけます。たとえば、Fluentd設定前、HDFSにアーカイブ先のディレクトリを準備する、とか、必要なKerberos設定を作るとかそんなこともまとめられます。
  14. こんな感じで、1年試してみました。コンセプトの詳しい説明は、続く政谷さんのLTにお願いしますが、いいことつらいことを簡単に書いてみます。 まず、簡単に過去やったことを実行できることは非常に楽です。ただ、当然操作対象の状態が、Notebook実行時とは異なっている可能性がありますから、そこは事前条件のチェックなどを加えることで工夫しています。 次に、説明が楽です。何かこんなときどうすればよいの?と聞かれたときは、「このNotebook見て」で済ませられます。ここでわからない範囲があれば、説明不足な点など書き足していってみています。最後にこれはつらいことですが、 構築、運用作業のリファクタリングがちょっと大変です。Notebookのセルの実行を、どこまで自動的にできるようにするか、例えば条件のチェックや出力のチェックを人手に頼るかなどの点で、「ここ面倒だよね」というところは随時自動化なりするようにしています。大変ですが、このように継続的に手順を見直して改善していくことで、より賢い運用ができるのではないかなーと思っています。 ということで、運用作業にもJupyter、いいですよ、ということで自分のLTは終わりにさせていただきます。どうもありがとうございました。