为ElasticSearch安装IK分词——论汉语博大精深……

一.什么是分词,为什么要分词

          分词技术就是搜索引擎针对用户提交查询的关键词串进行的查询处理后根据用户的关键词串用各种匹配方法进行分词的一种技术。

分词的目的是为了更容易、更精准的命中搜索关键词,更容易是因为分词将搜索关键词分开为多个查询关键词,只要匹配上一个就视为相关结果,更精准是因为分词之后可以比较关键词的命中率,从而实现排序,将你更需要的结果排列在前面。

二.为何选择IK分词器

在Elasticsearch中,内置了很多分词器,但默认的分词器对中文的支持都不是太好。所以需要单独安装插件来支持,比较常用的是IK, Pinyin,Paoding, MMSEG等还有个smartcn分词,不过其实比较鸡肋,汉语实在博大精深,最了解的汉语的还是自己人,官方的standard分词器简直惨不忍睹……基本上就是把字全部拆成一个,准确率感人。目前一般推荐使用的是IK分词,词库丰富,且跟进了ES的最新版本,所以这次我们选择安装的也是IK分词器。

三.安装步骤

虽然ElasticSearch拥有直接安装plugin的功能,但是……IK分词器的最新版本并没有提供可以直接通过bin/plugin安装的包,如果你试过的话,会得到如下结果 阅读全文→

ElasticSearch安装教程——自家的小百度

一.什么是ElasticSearch

          ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
         我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的。我们希望我们的搜索解决方案要快,我们希望有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP的索引数据,我们希望我们的搜索服务器始终可用,我们希望能够一台开始并扩展到数百,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。Elasticsearch旨在解决所有这些问题和更多的问题。

二.为什么要安装ES?

         ES作为一个成熟的全文搜索引擎提供了从分词到索引的全套解决方案,对于我这种懒得(其实是不会)造轮子的人来说再合适不过了,虽然网上已经有了很多教程,ES本身的安装也很简单,但是我这还是记录下,防止自己脑抽哪天忘了怎么装。

 

三.安装步骤

        ES是使用java开发的,所以首先我们就必须安装java啦,对于centos来说,我们可以选择openjdk也能选择sunjdk,我比较倾向于sunjdk,毕竟是个人折腾,不开源的东西总有些特别的优化。

然后一波进度条走完就安装好了,不过我们还需要额外配置下环境变量

         然后我们就完成了最基本的环境配置,可以开始下载安装ES了,前往ElasticSearch官网下载页面,然选择你需要的版本,使用wget下载到服务器中并解压,然后cd到解压目录直接执行bin/elasticsearch就行,但是!!! 阅读全文→

Centos下使用nvm安装管理node.js

一.什么是Node.js

  Node.js是一个基于Chrome JavaScript运行时建立的平台,用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞I/O模型而得以轻量和高效,非常适合在分布式设备上运行数据密集型的实时应用。

二.起因

        由于其特性所以有很多应用是使用Node.js开发的,这次我想用的某个爬虫就是Node.js应用,所以我只能去研究下怎么安装了,看了下网上一堆教程,唯一的感觉是这货版本真的多……作为一个选择强迫症,纠结装哪个版本是痛苦的,直到我发现了NVM——Node Version Manager,一个能够方便安装并管理(切换)Node.js的神器,从此我想切哪个版本切哪个233。

三.安装步骤

        参照其github的readme,安装nvm基本上是一键的

Install script

To install or update nvm, you can use the install script using cURL:

or Wget:

The script clones the nvm repository to ~/.nvm and adds the source line to your profile (~/.bash_profile, ~/.zshrc, ~/.profile, or ~/.bashrc).

 

最后一部分的环境变量设置脚本也完成了,一般不用你去手动执行,我们只需稍等片刻然后关闭ssh窗口并重新打开就能执行nvm命令了 阅读全文→

下载神器——Aria2,打造你自己的离线下载服务器

这年头vps商家都玩得比较嗨,不少大硬盘的vps,之前的一般使用方法是挂水晶……(这是真的),然而现在水晶已经坑死了,所以找点其它用途吧,做备份盘,这个方法不错,但是一般也用不完,所以我一般拿来存一些比较少的资源啥的,比如本子(?!)咳,你们一定听错了,我们跳过这个话题,反正就是拿来下一些源比较少速度比较慢或者一时用不上但是之后可能会用到的东西,丢在电脑里可能会不小心丢掉而且下载可能会比较耗时间,所以vps可能是另外一个选择。 好吧,不扯淡了,我们讲讲怎么安装aria2,这个基本上是一键……,centos使用:yum install aria2  debian使用:apt-get install aria2,系统版本不同源自带的aria2版本也会不同,centos6的话是aria2 16.0X的版本,centos7能到18.x,至于debian,一向包更新的比较快,基本上都是18.x,当然,如果你对源自带的版本不满意,可以去sf下载源码自己编译,这个我就不说了,一般自带的版本也够用了,安装没啥问题,一般使用的话是直接在ssh里用命令下载:

阅读全文→