今日も窓辺でプログラム

外資系企業勤めのエンジニアが勉強した内容をまとめておくブログ

Bash on Windows 起動時に ~/.bashrc が読み込まれない

現象

Bash on Windows 環境で ~/.bashrc に設定を追記しても、bash起動時に設定が読み込まれない、という現象に遭遇しました。

source ~/.bashrc

とすれば設定は反映されるものの、毎回これは面倒くさい…。

解決策

GitHubのIssueにありました。
.bashrc file didn't load when start bash in windows · Issue #2067 · Microsoft/WSL · GitHub

Bash on Windows 起動時に~/.bash_profileは参照されているようなので、次のように~/.bashrcを参照する設定を追記してあげれば解決です。

if [[ -f ~/.bashrc ]] ; then
    . ~/.bashrc
fi


Wikipediaでword2vecの学習してEmbedding Projectorで可視化してみる

はじめに

前回の記事で、Wikipediaの全行に対してループを回せるような環境を用意しました。
www.madopro.net

そのコードを利用して、今回はWikipediaの全記事をもとに

  • gensimを使ってword2vecモデルを学習して、
  • その結果をEmbedding Projectorを使って可視化

してみたいと思います。

続きを読む

Wikipediaの日本語記事を全行を、分かち書きしてforループで回す

はじめに

機械学習の勉強をするにあたって、日本語Wikipedia全文を学習データにできるとよさそう、ということでデータのダウンロードから、分かち書きされた文章をPythonのfor文で回す段階にもっていく方法をまとめました。

  • はじめに
  • 環境
  • コード
  • Wikipedia全記事のダウンロード
  • Wikipedia Extractor
  • 行ごとにfor文を回す
  • 分かち書きして一つのファイルに保存
  • 実行してみる
  • おわりに
  • 参考ページ
続きを読む

scikit-learnのtrain_test_splitで訓練データとテストデータを分割する

はじめに

scikit-learnのtrain_test_splitという関数を使うと、データセットを訓練データをテストデータに簡単に分割できます。
同じくscikit-learnに付属している数字手書き文字のデータセットを使用した例を紹介します。

続きを読む