github源码
:https://github.com/Worthy-Wang/mini_search_engine
这是一款基于RSS的搜索引擎,项目展示成果如下:
1.首先搭建好线程池,启动线程时都在等待任务队列出任务
2.启动封装好的服务器程序,当客户端发来请求时,将此请求封装成一个任务,加入任务队列,让子线程去完成该任务
3.搜索引擎类的封装,对于查询词的计算
开源库tinyxml2(DFS遍历节点)
, 正则表达式
,文件流字符串流操作
, Unix目录操作
,单例模式(饿汉)
开源库cppjieba分词
,set停词集合
,TopK算法(判断网页重复)
unordered_map倒排哈希表
,TF-IDF算法(计算权重)
基于对象线程池设计
,Posix线程类,互斥锁,条件变量
,任务队列
,自动加解锁类
,子线程安全退出机制
,回调函数
,智能指针unique_ptr
基于对象服务器设计
,回调函数
,socket网络编程
,IO多路复用epoll
,eventfd(IO线程与计算线程分离)
,客户端安全退出机制
,智能指针shared_ptr
文件流字符串流操作
,TF-IDF算法
,余弦相似度算法
,开源库jsoncpp
本文地址:https://blog.csdn.net/Worthy_Wang/article/details/107309474
如对本文有疑问, 点击进行留言回复!!
Linux - 基础正则表达式、扩展正则表达式、grep使用正则表达式
知识梳理(新增日期类&正则表达式&泛型&迭代器&比较器& 基于Pinyin4J实现中文排序)
荐 Machine Learning——sklearn系列(一)——回归
网友评论