-
Notifications
You must be signed in to change notification settings - Fork 691
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
用C++改写后,性能如何? #1
Comments
分词速度没测,暂时也没法测,因为还没写完。而且只使用到DAG + DP这个程度,没使用HMM。 发件人: Sun Junyi |
之前实现了最大熵发现新词的功能,C++比python快了近10倍。所以感觉用最大概率来分词,C++版本肯定要比python快很多。 |
@fxsjy 按现在的v1.1版本的话,我大概测了一下速度。差不多是jieba分词的4倍左右吧。 |
g++ -o segment.demon segment.cpp -L/usr/lib/CppJieba/ -std=c++0x -lcppjieba |
@lzzgeo |
最近进行了大量改写,无意中发现了以前一个写的很不好的地方影响了性能,修复之后版本为v2.2.0 |
强烈支持cppjieba版本,在前段时间我已经正式使用cppjieba了,同时fork了你的一个版本,并在你的项目里加入了cppjiebapy的封装以支持python的调用:https://github.com/jannson/cppjieba |
@jannson anyway,感谢支持和fork。 |
@aszxqw 恩,开个分支更好,但昨天看了你的更新,你更改代码之后应该可以让cppjiebapy完全独立出来了,因为只用调用xxx.hpp头文件就可以调用分词库函数了。先不急开分支,我看能不能完全独立出来,以让cppjieba代码整洁。 |
@jannson |
独立出来的cppjiebapy:https://github.com/jannson/cppjiebapy |
请问cppjieba支持词性标注吗?急需评估,期待您的回复,谢谢 |
@banderuilq 不好意思。暂时没有,计划是在春节之前加上。 |
Update TextRankExtractor.hpp: use yanyiwu's correction
cppjieba使用大的字典(367w), 我主要使用计算关键词抽取,速度变的很慢。请问有什么优化策略? |
抱歉啊,我没再关注了,对于分词,我没做过深入研究哈
------------------------------------------------------------------发件人:LOGIC <[email protected]>发送时间:2018年3月27日(星期二) 14:57收件人:yanyiwu/cppjieba <[email protected]>抄 送:sam <[email protected]>; Mention <[email protected]>主 题:Re: [yanyiwu/cppjieba] 用C++改写后,性能如何? (#1)
cppjieba使用大的字典(367w), 我主要使用计算关键词抽取,速度变的很慢。请问有什么优化策略?—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub, or mute the thread.
|
你好,我是结巴分词的作者,请问cppjieb的分词速度如何?
The text was updated successfully, but these errors were encountered: