Skip to content

方法说明.html

Alex.Mo edited this page Jun 25, 2019 · 3 revisions

标准分词

方法签名: String segment(String txt);

返回: 分词列表。

签名参数说明: txt:要分词的语句。

范例: 下例验证一段话第5个分词是阿法狗。

程序清单 http://localhost:9876/api/segment?txt=程序员(英文Programmer)是从事程序开发、维护的专业人一般将程序员分为程序设计人员和程序编码人

程序运行结果: 人/n,编码/n,程序/n,和/cc,人员/n,设计/vn,程序/n,分为/v,程序员/nnt,将/d,一般/ad,人/n,专业/n,的/ude1,维护/v,、/w,开发/vn,程序/n,从事/vi,是/vshi,)/w,Programmer/nx,英文/nz,(/w,程序员/nnt。

关键词提取

方法签名: String extractKeyword(String txt,int keySum);

返回: 关键词列表。

签名参数说明: txt:要提取关键词的语句,keySum要提取关键词的数量。

范例: 给出一段话提取一个关键词是“程序员”。

程序清单 http://localhost:9876/api/extractKeyword?txt=程序员(英文Programmer)是从事程序开发、维护的专业人一般将程序员分为程序设计人员和程序编码人员但两者的界限并不非常清楚,特别是在中国软件从业人员分为初级程序员、高级程序员、系统分析员和项目经理四大类。&keySum=2

程序运行结果: 分为,程序员。

短语提取

方法签名: String extractPhrase(String txt, int phSum);

返回: 短语。

签名参数说明: txt:要提取短语的语句,phSum短语数量。

范例: 给出一段文字,能代表文章的五个短语,第一个短语是算法工程师。

程序清单 http://localhost:9876/api/extractSummary?txt=程序员(英文Programmer)是从事程序开发、维护的专业人一般将程序员分为程序设计人员和程序编码人&sSum=6

程序运行结果: 程序开发,开发维护,分为程序,从事程序,人员程序,专业程序员。

自动摘要

方法签名: String extractSummary(String txt, int sSum);

返回: 摘要语句。

签名参数说明: txt:要提取摘要的语句,sSum摘要句子数量。

范例: 自动提取三句摘要句子。

程序清单 http://localhost:9876/api/extractSummary?txt=算法可大致分为基本算法、数据结构的算法、数论算法、计算几何的算法、图的算法、动态规划以及数值分析、加密算法&sSum=6

程序运行结果: 基本算法,图算法,动态规划,分析加密算法,分为基本,几何算法。

拼音转换

方法签名: String convertToPinyinList(txt);

返回: 拼音列表。

签名参数说明: txt:要转换拼音的语句。

范例: 给出一段文字中第二个字的拼音。

程序清单 http://localhost:9876/api/convertToPinyinList?txt=鸭绿江的绿跟绿色的绿不是一个读音

程序运行结果: yin1,du2,ge4,yi2,shi4,bu2,lv4,de5,se4,lv4,gen1,lv4,de5,jiang1,lu4,ya1。

添加词库

方法签名: String addCK(String filePath);

返回: 空—完成,其它—错误信息。

签名参数说明: filePath:新的词库文件,每个词使用回车换行分隔。

范例: 读取新词库文件,将文件内容中第7个词“新美“添加到词库。

程序清单 http://localhost:9876/api/addCK?filePath=F:/DK_FreeRch_work/freerch-nlp/src/test/resources/custom_dictionary.txt 查看添加的词库 http://localhost:9876/api/segment?txt=互联网家装质量问题频繁新美大杀入胜算几何

程序运行结果: 几何/n,胜算/n,大杀入/nz,新美/nz,频繁/a,问题/n,质量/n,家装/nz,互联网/n。

训练分类模型

方法签名: String trainModel(String corpusPath,String modelPath);

返回: 空。

签名参数说明: corpusPath:语料库本地目录(训练用的文本),modelPath模型保存目录。

范例: 根据文本训练出来的模型。

程序清单 http://localhost:9876/api/trainModel?corpusPath=F:/DK_FreeRch_work/freerch-nlp/src/test/resources/搜狗文本分类语料库微型版&modelPath=F:/DK_FreeRch_work/freerch-nlp/src/test/resources/搜狗文本分类语料库微型版/model.ser

程序运行结果: 在modelPath路径生成model.ser文件。

文本分类

方法签名: String classifier (String modelPath,String filePath);

返回: 分类信息。

签名参数说明: modelPath模型保存目录,filePath待分类文本保存目录。

范例: 根据训练出来的模型对新的文本进行分类,分为健康类。

程序清单 http://localhost:9876/api/classify?modelPath=F:/DK_FreeRch_work/freerch-nlp/src/test/resources/搜狗文本分类语料库微型版/model.ser&filePath=F:/DK_FreeRch_work/freerch-nlp/src/test/resources/搜狗文本分类语料库微型版/健康/11111.txt

程序运行结果: 在filePath路径生成11111.txt文件。

Clone this wiki locally