なろうのデータ解析中……

前の記事で書いたように、なろうのデータを解析中。

小説ごとに単語を数えて、単語が出てくる小説の数をカウントしようという作戦。

しかしなにしろ時間がかかるので、マルチスレッドに改造したのだけれど、いかんせん速度が出ない。

2スレッドぐらいまでは速度が上がるけど、それ以降速度が上がらない。

4コアだからもうちょっとあがるはずなのに。

CPUも全然使い切っていないので、どこかがネックになっている模様。

複数のインスタンスを作ってもcmecab-javaがmecabのプロセスを一つしかつくらないとか?

javaのネイティブプログラムの扱いを知らないのでなんとも言えない。

まぁ、気長にやるしかないようです。

 

捨てたものはちょっといい箱。

使うかもと言ってとっておいてやっぱりごみになるんだ。

体重は64.0kg

SNSでもご購読できます。

コメントを残す