Skip to content
/ farseer Public

一个轻量级搜索引擎,支持关键词搜索联想停用,敏感词过滤,使用 TF-IDF 计算关键词的相关度

Notifications You must be signed in to change notification settings

98d/farseer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Farseer

一个简单的轻量级分布式搜索引擎,Farseer 没有 Elastic Search 中 type 等复杂的概念,只关注于查询和索引两件事 farseer

Tech-Stack

Spring Boot, MySQL, MyBatis, Redis, Canal

Feature

  • http 协议,提供 restful api 进行操作
  • 智能分词,对输入的句子进行分词查询
  • 为数据建立倒排索引
  • 查询某个数据的倒排索引
  • 对指定关键词过滤 e.g. java -csdn
  • 实现关联度算法, tfidf 算法,优先查询出关联度高的数据
  • 关键词高亮
  • 关键词联想
  • 敏感词过滤
  • 停用词
  • 文本搜图
  • 以图搜图

Extra

  • Trie
  • AC 自动机
  • canal 监听数据库
  • 布隆过滤器,redis 做缓存加速搜索

About

一个轻量级搜索引擎,支持关键词搜索联想停用,敏感词过滤,使用 TF-IDF 计算关键词的相关度

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages