Skip to content

Doc2Vecで「小説家になろう」の作品を収集し、単文の類似度を算出するプログラム。

Notifications You must be signed in to change notification settings

fury00812/Doc2Vec_with_narou

Repository files navigation

ファイルについて

Narou_collecter.py

データの収集・加工プログラム。 webサイト「小説家になろう」からデータを取得し、作品ごとに単文で分割しファイル出力する。

Similarity_a_file.py

実行プログラム。一つのファイル(1作品)を使用して学習するモデル。

funcs_makeData,funcs_treatData

データ収集、加工の機能をまとめた自作関数群。

works

収集したなろう小説データ。

参考

参考1 - Gensim Doc2Vecチュートリアル

https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-lee.ipynb

参考2 - B'zの歌詞について、dov2vecによる類似検索と、感情分析を行う

http://bci-blog.blogspot.com/2016/12/bzdoc2vec.html

About

Doc2Vecで「小説家になろう」の作品を収集し、単文の類似度を算出するプログラム。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages