今日も窓辺でプログラム

外資系企業勤めのエンジニアが勉強した内容をまとめておくブログ

2018-01-01から1年間の記事一覧

VSCodeでscrollPageDownした時にカーソルも付いてきてほしい

問題点 今までVisual Studio Codeに表示しているテキストをページスクロールする時にはscrollPageDown, scrollPageUpにショートカットを割り当てて使っていました。 手元の環境だと、scrollPageDownなどでテキストをスクロールした際に、文字入力のカーソル…

Scala + SparkでDatasetを使ってTFIDFを計算する

はじめに 前回の記事ではSparkをローカルで試せる環境を用意しました。 Windows Subsystem for Linux(WSL)でSpark環境を構築してみる - 今日も窓辺でプログラム 今回は日本語のテキストファイルに含まれる単語数をカウントする処理をSpark上で行ってみたいと…

Windows Subsystem for Linux(WSL)でSpark環境を構築してみる

Sparkで走らせるプログラムの開発のため、WindowsのローカルでSparkを走る環境を用意したかったので作業内容をメモしておきます。 環境 Windows 10 Version 1803 WSLでUbuntu 16.04をインストール 以下手順に出てくるコマンドはWSLで走らせたbashに入力した…

Tensor2Tensorを使って独自データでseq2seqしてみる

はじめに Tensor2Tensorという、広く使われているモデルやデータセットが実装されているディープラーニングのライブラリがあります。 GitHubのREADMEによると、Tensor2TensorはGoogle Brainチームなどによって開発されているようで、中身はTensorFlowで実装…

SentencePieceを使用してRNN言語モデルを学習させてみる

はじめに 前回の記事ではpytorchのサンプルコードを参考にし、Wikipediaの記事の一部に対してRNN言語モデルを学習させてみました。 RNN言語モデルのpytorch実装をWikipediaの記事で学習させてみる - 今日も窓辺でプログラムその際にWikipediaの記事を単語に…

RNN言語モデルのpytorch実装をWikipediaの記事で学習させてみる

はじめに pytorchのGitHubに上がっているサンプルを見ていたら、RNNを使って言語モデルを実装しているものがありました。 examples/word_language_model at master · pytorch/examples · GitHub本当はいろんなネットワークを1から実装するのがよいのでしょう…