-
Elasticsearch架构原理
架构原理本书作为 Elastic Stack 指南,关注于 Elasticsearch 在日志和数据分析场景的应用,并不打算对底层的 Lucene 原理或者 Java 编程做详细的介绍,但是 Elasticsearch 层面上的一些架构设计,对我们做性能调优,故障处理,具有非常重要的影响。所以,作为 ES 部分的起始章节,先从数据流向和分布的层面,介绍一下 ES 的工作原理,以及相关的可控项。各位读者可以跳过这节先行阅读后面的运维操作部分,但作为性能调优的基础知识,依然建议大家抽时间返回来...…
-
Elastic Stack安装教程
环境准备 CentOS7.1 JDK1.8 elasticsearch-5.4.3JDK安装配置下载地址:http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.tar.gzelasticsearch安装配置下载解压使用命令从官网下载最新版本的Elasticsearch压缩包cd /var/wdwget -N https://artifacts.elastic.co/downloads/ela...…
-
Lucene学习笔记
概要: 全文检索的原理和基本概念(铺垫) Lucene简介,索引文档和检索文档的过程(主要) Lucene 相似度评分算法(拓展) 全文检索原理(铺垫)数据分类生活中的数据总体分为三种: 结构化数据,固定格式和长度,如数据库数据,元数据等 非结构化数据,无固定格式和长度,如邮件,word文档,商品描述信息,非结构化数据也称为为全文数据 半结构化数据,如XML,HTML等,当然根据需要按结构化数据来处理,也可抽取出纯文本按非结构化数据来处理搜索分类按照数据的...…
-
使用MAT(Memory Analyzer Tool)分析内存泄漏
在工作中,有时会遇到OutOfMemoryError,我们知道遇到Error一般表明程序存在着严重问题,可能是灾难性的。所以找出是什么原因造成OutOfMemoryError非常重要。Memory Analyzer tool(MAT)来化解我们遇到的难题。从可用内存和请求数量的变化情况判断是突发性的内存泄露还是不断积累的结果换句话说,首先定位内存泄露的性质:突发内存泄露: 表现:可用内存直线下降,短时间内消耗殆尽。 原因:定时任务执行、用户集中访问等,频繁调用有内存泄露的代码块。 排...…
-
Zookeeper、Solr和Tomcat安装配置实践
三台服务器: 192.168.19.210(myid=210) master 192.168.19.211(myid=211) slave1 192.168.19.212(myid=212) slave2ZooKeeper集群配置安装ZooKeeper集群,在上面3分节点上分别安装,使用的版本是zookeeper-3.4.5。首先在master上安装配置:cd /tmpwget -N http://mirrors.cnnic.cn/apache/zookeeper/zookeeper...…
-
用Octopress在Github搭建个人博客
一、安装Octopress运行的必要软件1.Octopress官网及软件下载: 官方首页:http://octopress.org 这里是RubyInstaller下载地址 (码:aurm)。 这里是DevKit下载地址 (码:vkd5)。 2.安装RubyInstaller3.安装DevKit4.启动Ruby命令框,用CD的命令进入你存放DevKit的目录中,执行以下命令继续安装ruby dk.rb initruby dk.rb install二、...…
-
Git配置和常用命令
Git是一个分布式版本控制/软件配置管理软件,原来是linux内核开发者林纳斯·托瓦兹(Linus Torvalds)为了更好地管理linux内核开发而创立的。Git配置git config --global user.name "felics"git config --global user.email "huangthink@gmail.com"git config --global color.ui truegit config --global alias.co checkoutg...…