Rest风格操作

一种软件架构风格，而不是标准，只是提供了一组设计原则和约束条件。它主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁，更有层次，更易于实现缓存等机制。

基本Rest命令说明：

method	url地址	描述
PUT	localhost:9200/索引名称/类型名称/文档id	创建文档（指定文档id）
POST	localhost:9200/索引名称/类型名称	创建文档（随机文档id）
POST	localhost:9200/索引名称/类型名称/文档id/_update	修改文档
DELETE	localhost:9200/索引名称/类型名称/文档id	删除文档
GET	localhost:9200/索引名称/类型名称/文档id	查询文档通过文档id
POST	localhost:9200/索引名称/类型名称/_search	查询所有数据

1. 关于索引的基本操作

创建

PUT /test1/type1/1
{
  "name": "rootwhois",
  "age": 18
}

字段的类型：

字符串类型 text 、 keyword
数值类型 long, integer, short, byte, double, float, half_float, scaled_float
日期类型 date
布尔值类型 boolean
二进制类型 binary

等等.....

指定字段的类型

创建规则

PUT /test2
{
"mappings": {
  "properties": {
    "name": {
      "type": "text"
    },
    "age": {
      "type": "long"
    },
    "birthday": {
      "type": "date"
    }
  }
}
}

获取
```
GET test2
```
Image

如果自己的文档字段没有指定，那么es 就会给我们默认配置字段类型！

Image

Image

修改

使用put进行覆盖（旧）

PUT /test1/type1/1
{
  "name": "rootwhois_new",
  "age": 19
}

post _update修改
```
POST /test1/type1/1/_update
{
  "doc": {
    "name": "张三"
  }
}
```
Image

修改后版本号version会增加，result为update

删除
```
DELETE test1
```

2. 关于文档的操作

2.1. 基本操作

添加数据

PUT /test1/user/2
{
  "name": "张三",
  "age": 12,
  "desc": "法外狂徒",
  "tags": ["渣男", "旅游", "交友"]
}

获取数据
```
GET /test1/user/2
```
Image

更新数据

使用put进行覆盖（旧）

PUT /test1/type1/1
{
  "name": "rootwhois_new",
  "age": 19
}

post _update修改
```
POST /test1/type1/1/_update
{
  "doc": {
    "name": "张三"
  }
}
```
Image

修改后版本号version会增加，result为update

简单搜索

可以根据默认的映射规则，产生基本的查询。
```
GET test1/user/_search?q=name:张三
```
Image

2.2. 复杂操作

搜索

GET /test1/user/_search
{
  "query": {
    "match": {
      "name": "zhangsan"
    }
  }
}

结果过滤

GET /test1/user/_search
{
  "_source": ["name"]
}

只返回name

排序

GET /test1/user/_search
{
  "sort": [
      {
          "age": {
              "order": "desc"
          }
      }
  ]
}

降序排序

分页

GET /test1/user/_search
{
  "from": 0,
  "size": 20
}

from从哪里开始

size单页面的数据

布尔值查询

GET /test1/user/_search
{
  "query": {
      "bool":{
          "must":[
              {
                  "match": {
                      "name": "zhangsan"
                  }
              },
              {
                  "match": {
                      "age": 3
                  }
              }
          ]
      }
  }
}

参数

must 相当于and，所有的条件都要符合
should相当于or，满足其一即可
must_not相当于not，所有条件都不符合

多条件查询

过滤器filter

GET /test1/user/_search
{
  "query": {
      "bool":{
          "age":[
              {
                  "filter": {
                      "range": {
                          "age": {
                              "gte": 10,
                              "lte": 20
                          }
                      }
                  }
              }
          ]
      }
  }
}

range：取值范围

gte：大于等于

gt：大于

lte：小于等于

lt：小于

eq：等于

匹配多个条件
```
GET /test1/user/_search
{
  "query": {
    "match":{
      "tags":"男 技术"
    }
  }
}
```
多个条件使用空格隔开

满足其中一个结果就可以被查出

可以通过分值进行判断（权重）

精确查询

GET /test1/user/_search
{
  "query": {
    "term":{
      "tags":"男"
    }
  }
}

term查询是直接通过倒排索引指定的词条进程精确的查找

关于分词：

term：直接查找精确的值
match：会使用分词器解析（先分析文档然后通过分析的文档进行查询）

关于类型：
text会被分词器解析
term不会

多个值的精确查询

GET /test1/user/_search
{
  "query": {
      "bool":{
          "should":[
              {
                  "term": {
                      "name": "zhangsan"
                  }
              },
              {
                  "term": {
                      "name": "lisi"
                  }
              }
          ]
      }
  }
}

高亮显示

{
  "query": {
    "match": {
        "content" : {
            "query" : "我的宝马多少马力"
        }
    },
    "hightlight": {
        "pre_tags": "<p class='key' style='color:red'>",
        "post_tags": "</p>",
        "fields": {
            "name": {}
        }
    }
  }
}

field中设置要高亮的位置

pre_tags和post_tags用于自定义标签，默认为<em></em>。

elasticsearch 查询（match和term）

es中的查询请求有两种方式，一种是简易版的查询，另外一种是使用JSON完整的请求体，叫做结构化查询（DSL）。由于DSL查询更为直观也更为简易，所以大都使用这种方式。 DSL查询是POST过去一个json，由于post的请求是json格式的，所以存在很多灵活性，也有很多形式。这里有一个地方注意的是官方文档里面给的例子的json结构只是一部分，并不是可以直接黏贴复制进去使用的。一般要在外面加个query为key的机构。

1. match

最简单的一个match例子：

查询和"我的宝马多少马力"这个查询语句匹配的文档。

{
  "query": {
    "match": {
        "content" : {
            "query" : "我的宝马多少马力"
        }
    }
  }
}

上面的查询匹配就会进行分词，比如"宝马多少马力"会被分词为"宝马多少马力", 所有有关"宝马多少马力", 那么所有包含这三个词中的一个或多个的文档就会被搜索出来。并且根据lucene的评分机制(TF/IDF)来进行评分。

2. match_phrase

比如上面一个例子，一个文档"我的保时捷马力不错"也会被搜索出来，那么想要精确匹配所有同时包含"宝马多少马力"的文档怎么做？就要使用 match_phrase 了

{
  "query": {
    "match_phrase": {
        "content" : {
            "query" : "我的宝马多少马力"
        }
    }
  }
}

完全匹配可能比较严，我们会希望有个可调节因子，少匹配一个也满足，那就需要使用到slop。

{
  "query": {
    "match_phrase": {
        "content" : {
            "query" : "我的宝马多少马力",
            "slop" : 1
        }
    }
  }
}

3. multi_match

如果我们希望两个字段进行匹配，其中一个字段有这个文档就满足的话，使用multi_match

{
  "query": {
    "multi_match": {
        "query" : "我的宝马多少马力",
        "fields" : ["title", "content"]
    }
  }
}

但是multi_match就涉及到匹配评分的问题了。

4. 我们希望完全匹配的文档占的评分比较高，则需要使用best_fields

{
  "query": {
    "multi_match": {
      "query": "我的宝马发动机多少",
      "type": "best_fields",
      "fields": [
        "tag",
        "content"
      ],
      "tie_breaker": 0.3
    }
  }
}

意思就是完全匹配"宝马发动机"的文档评分会比较靠前，如果只匹配宝马的文档评分乘以0.3的系数

5. 我们希望越多字段匹配的文档评分越高，就要使用most_fields

{
  "query": {
    "multi_match": {
      "query": "我的宝马发动机多少",
      "type": "most_fields",
      "fields": [
        "tag",
        "content"
      ]
    }
  }
}

6. 我们会希望这个词条的分词词汇是分配到不同字段中的，那么就使用cross_fields

{
  "query": {
    "multi_match": {
      "query": "我的宝马发动机多少",
      "type": "cross_fields",
      "fields": [
        "tag",
        "content"
      ]
    }
  }
}

term

term是代表完全匹配，即不进行分词器分析，文档中必须包含整个搜索的词汇

{
  "query": {
    "term": {
      "content": "汽车保养"
    }
  }
}

查出的所有文档都包含"汽车保养"这个词组的词汇。

使用term要确定的是这个字段是否“被分析”(analyzed)，默认的字符串是被分析的。

拿官网上的例子举例：

mapping是这样的：

PUT my_index
{
  "mappings": {
    "my_type": {
      "properties": {
        "full_text": {
          "type":  "string"
        },
        "exact_value": {
          "type":  "string",
          "index": "not_analyzed"
        }
      }
    }
  }
}

PUT my_index/my_type/1
{
  "full_text":   "Quick Foxes!",
  "exact_value": "Quick Foxes!"  
}

其中的full_text是被分析过的，所以full_text的索引中存的就是[quick, foxes]，而extra_value中存的是[Quick Foxes!]。

那下面的几个请求：

GET my_index/my_type/_search
{
  "query": {
    "term": {
      "exact_value": "Quick Foxes!"
    }
  }
}

请求的出数据，因为完全匹配

GET my_index/my_type/_search
{
  "query": {
    "term": {
      "full_text": "Quick Foxes!"
    }
  }
}

请求不出数据的，因为full_text分词后的结果中没有[Quick Foxes!]这个分词。

1. bool联合查询: must,should,must_not

如果我们想要请求"content中带宝马，但是tag中不带宝马"这样类似的需求，就需要用到bool联合查询。联合查询就会使用到must,should,must_not三种关键词。

这三个可以这么理解

must: 文档必须完全匹配条件
should: should下面会带一个以上的条件，至少满足一个条件，这个文档就符合should
must_not: 文档必须不匹配条件

比如上面那个需求：

{
  "query": {
    "bool": {
      "must": {
        "term": {
          "content": "宝马"
        }
      },
      "must_not": {
        "term": {
          "tags": "宝马"
        }
      }
    }
  }
}

Rest Style Operation