10. TensorBoard
ちなみに4コア(4Thread)割り当ててるので、以下の文言が出てくる
Local device intra op parallelism threads: 4
Direct session inter op parallelism threads: 4
summaryで出力したログのディレクトリ(data)を指定する(絶対パスの方が良いみた
い.ここではrootのtensorflow以下にクローンしたので、こんなパス)
$ tensorboard
--logdir=/root/tensorflow/
tensorflow/examples/tutorials/mnist/data
http://192.168.99.100:6006 にアクセスする(IPはVBoxのデフォルト値)
27. Vector Representations of Words
自然言語処理
人が日常的に使っている言葉をコンピュータに処理させるもの
Word2Vec
単語をベクトル化して表現するする定量化手法
「同じ文脈の中にある単語はお互いに近い意味を持っている」というシンプルな考え方
論文:「Efficient Estimation of Word Representations in Vector Space」
http://arxiv.org/pdf/1301.3781v3.pdf
38. Vector Representations of Words
精度は3割くらい
時間は14時間くらいかかってた(word2vec_optimized.pyの方だとそれよりも早
いっぽい。未確認)
論文のAbstractでは「16億単語から高品質な単語ベクトルを学習するのに1日かから
ない」とあるので、それくらいの単語数はいるのかも?