前の記事で書いたように、なろうのデータを解析中。
小説ごとに単語を数えて、単語が出てくる小説の数をカウントしようという作戦。
しかしなにしろ時間がかかるので、マルチスレッドに改造したのだけれど、いかんせん速度が出ない。
2スレッドぐらいまでは速度が上がるけど、それ以降速度が上がらない。
4コアだからもうちょっとあがるはずなのに。
CPUも全然使い切っていないので、どこかがネックになっている模様。
複数のインスタンスを作ってもcmecab-javaがmecabのプロセスを一つしかつくらないとか?
javaのネイティブプログラムの扱いを知らないのでなんとも言えない。
まぁ、気長にやるしかないようです。
捨てたものはちょっといい箱。
使うかもと言ってとっておいてやっぱりごみになるんだ。
体重は64.0kg