放松心态的简短句子 心态好的句子经典语录
你现在阅读的是一篇关于放松心态的简短句子的文章,里面有丰富多彩的内容,还有给你准备心态好的句子经典语录和放松心态的简短句子的精彩内容哦。
放松心态的简短句子 心态好的句子经典语录
生而为人,在喧闹的人间,世事纷纷扰扰。人来人往,熙熙攘攘。如果不坚守初心,不为世俗而忧愁烦恼,内心很难得到一份宁静。
别人一句话,你在心里病一场,别人一个无心的举动,你在深夜辗转难眠。总觉得这个世界在故意欺负你,周围的所有人都和你过不去。
殊不知,这一切都是心胸不够开阔。眼里容不下一粒沙,心里装不下别人的一句话。
山本文绪曾写过:比世人的目光还要可怕的,实际上是你自己那颗在意世人目光的心。
一切都源于心太小,所以小事件件记心上,大事一发生自己的世界就崩塌了。心里装太多的事,找不到出口,快乐就难了。
每个人短暂的一生,无论此生活得多么光鲜亮丽或者艰难困苦,最后的归宿都一样。多一点烦恼,不如多一点快乐。
丰子恺在《活着本来单纯》写到:心小了,所有的小事就大了;心大了,所有的大事都小了;看淡世事沧桑,内心安然无恙。
诚然,心胸开阔了,自然不在乎世人的眼光,大事小事看得开。不为小事而烦恼,不为大事而忧愁。良言放心上,恶语抛脑后。脸上常常带着笑,不让愁上眉头。
大事小事都看淡,内心保持一份淡定与从容,快乐自然源源不断。
心胸开阔了,世界也就明亮了
宰相肚里能撑船,心胸开阔,凡事自然看得开。不猜测人心,不记爱恨情仇。别人恶言恶语,不放在心上。不与人争高下,不在别人背后议长短。
心胸开阔了,自然不会沉浸在自己的世界里,终日郁郁寡欢。抱怨上天的不公,埋怨人心的难测,感叹命运的坎坷。
人生几度风雨,几度忧愁。没有一帆风顺的人生,每个人都在风风雨雨中成长,跌倒又爬起来继续奔跑。大部分的人都要靠自己。
想明白了,自然豁然开朗。心中有阳光,世界自然明亮。
心胸开阔了,人就成长了
当你不会为一件小事而气得暴跳如雷,当你不会为失去某些东西而闷闷不乐,当你不会为突如其来的不幸而惊慌失措时,证明你成长了。
时光长河缓缓流淌,人脸上的痕迹可以被抹掉,但人内心淡定与从容是永存的。踏遍千山万水,经历过风风雨雨,练就一颗强大的心。
心宽了,人也就成长了。小时候为一个玩具,和小朋友争;长大以后即使被误会,也不会解释,内心依然淡定自若。从争到不争,从在乎世人的眼光,到不在乎。
一旦想明白了,做人的乐趣就多了。越成长,越快乐。
心胸开阔了,快乐自然就多了
因为别人的一句话,可以生气一天。别太傻,气坏了自己的身体,到最后吃亏的是自己。
因为别人比自己优秀,比自己富有。嫉妒心爬满整个身体,别人一举一动过分关注,忘了自己的生活。怒火久久难以熄灭,烧坏了自己,却对别人丝毫没有影响。
心态放平和,坦然面对一切。山外有山,人外有人。不嫉妒花的娇艳,不嫉妒别人的优秀。人有人路,蛇有蛇道。宇宙万物,各有各的生存之道,也各有各的美好。
不嫉妒不羡慕任何人,心胸放宽一点,让快乐爬满整个身心。烦恼和忧愁,统统都随风飘散。
亦舒曾写过:每个人说另外一个人,道理总是一箩筐一箩筐,丈八的灯,照见别人,照不见自己。
审视自己,总是最难得,说别人却轻而易举。生而为人,不在背后说别人,是一种礼貌,更是一种修养。
多审视自己,心胸变狭隘了,就及时调整。只有心胸开阔了,快乐才会源源不断。
愿你能永远做一只快乐鸟,不为世俗而纷扰,只在天地人间快乐飞。
心态好的简短经典句子(村上春树最治愈的三句话)
庄子言:
“人生天地之间,若白驹过隙,忽然而已。”
其实人的一生很短暂,不过恍惚之间就过去了。如果我们老是执着于过去,自己也会过得不舒坦。
这世界上有太多过得不快乐的人,这些人之所以活得不快乐,也是因为学不会放开。
人呀,最重要的还是过得快乐才是最重要的,一辈子很短,别为难了自己。
就像森鸥外《泡沫记》说到:
“人生苦短,感到欢乐的弹指之间,若不开怀大笑,日后岂不后悔?”
如果真的有释怀不了的时候,不如让自己静下来去读读村上春树的这几句话,或许你情绪会稳定很多。
不管全世界所有人怎么说,我都认为自己的感受才是正确的。无论别人怎么看,我绝不打乱自己的节奏。喜欢的事自然可以坚持,不喜欢怎么也长久不了。 ?
确实呀,每个人喜欢的东西都不一样,不必去按照别人所谓的标准去追求自我。
这世间,贫富贵贱万象百态,对于那些不能随着人的意志而转移的事情,那就坦然地面对,你要做的,就是做好你自己。
只有在做自己,去追求自己喜欢的事物都道路上,我们才会坚持越走越远。不喜欢的事物,不管怎么逼自己也做不长久的。
所以无论何时何地,都要遵从自己的内心,我们是为自己而活的,不用在意外界的看法。
人生本来就是有无数的岔路口,在没有经历过的时候,谁也无法判断哪些选择一定是到达终点的最优路径。
相信大多数人都会经历过迷茫期,或者有的人也正经历着迷茫期。这都是很正常,有谁的青春不迷茫呢?
人生说短,其实这条路也很长,长到我们走着走着不知道如何走下去。很多人对自己的人生没有规划,找不到目标,所以迷茫也是言之有理的。
不管怎样,要知道即使迷茫也要继续往前走,有些路没走过根本不知道自己想不想走这条路,走的路正不正确。
听过这么这段话:
“过往的30年,似乎没什么变化,但当时认为很普通的选择,最后突然串起来,一个个不确定性组成了确定性的结果。”
一生走得路很多,但是一路走下来都会留下你都痕迹,最终这些痕迹也慢慢朝着你所要的方向去走。
一个人走的路多了,走得远了,才能把所有的不确定变成确定,从而走出一条属于自己的康庄大道。
不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。
很多人都会有这样的心理,就是老是习惯性地去担心未来,总给自己的未来设定了很多不好的场景。
但是现实中,这些你所设想的画面或许永远也不会发生,只是你自己杞人忧天。
别想太多,有些事情该发生的时候总会发生,你无法预料更无法掌控。能做的就是用一颗强大的心去面对人生的种种。
或许根本不会发生,而自己却每天都活在担忧中,这样恐惧地活着是不会快乐的。
《被讨厌的勇气》这本书中有一句话:“过多的自我意识,会束缚自己。”
说的就是这个道理。
要学会调节好自己的心态,别害怕未知的人生,人生的路没有想象中的那么容易,但是也没有想象中的那么可怕。
人活在当下就好,只有活在当下你才能够拥有自由的人生。
往期作品
运动,是改变自己最好的方式(建议收藏)
为什么要坚持运动?这是最好的回答
保持自己最好的状态:运动
免费英语句子分析器(Elasticsearch)
文本分析是将非结构化文本(例如电子邮件的正文或产品说明)转换为针对搜索优化的结构化格式的过程。何时配置文本分析
当索引或搜索text字段时,Elasticsearch执行文本分析。
如果索引不包含text字段,则无需进一步设置;您可以跳过本节中的页面。
但是,如果您使用text字段或文本搜索未返回预期的结果,则配置文本分析通常会有所帮助。如果您正在使用Elasticsearch执行以下操作,则还应该研究分析配置:
- 建立一个搜索引擎
- 矿山非结构化数据
- 优化搜索特定语言
- 进行词典或语言研究
文字分析概述
文本分析使Elasticsearch能够执行全文搜索,其中搜索返回所有相关结果,而不仅仅是精确匹配。
如果要搜索Quick fox jumps,则可能需要包含的文档,A quick brown fox jumps over the lazy dog也可能需要包含诸如fast fox或的相关单词的文档foxes leap。
代币化
通过令牌化,分析使全文搜索成为可能:将文本分解为较小的块,称为令牌。在大多数情况下,这些标记是单个单词。
如果您将该词组索引the quick brown fox jumps为单个字符串,并且用户搜索quick fox,则不会将其视为匹配项。但是,如果您对词组进行标记并分别索引每个词,则可以单独查询查询字符串中的词。这意味着他们可以通过搜索进行匹配quick fox,fox brown或其他变化。
正常化
令牌化可以根据单个条件进行匹配,但是每个令牌仍在字面上进行匹配。这意味着:
- 即使您可能希望一个字词与另一个字词Quick匹配quick,也 不会进行 搜索
- 尽管fox和foxes共享相同的词根,但搜索foxes 将不匹配fox,反之亦然。
- 搜索jumps将不匹配leaps。尽管它们不共享根词,但它们是同义词,并且具有相似的含义。
为了解决这些问题,文本分析可以将这些标记标准化为标准格式。这样,您就可以匹配与搜索字词不完全相同但足够相似且仍然相关的令牌。例如:
- Quick可以小写:quick。
- foxes可以词干或简化为词根:fox。
- jump并且leap是同义词,可以将其索引为一个单词:jump。
为确保搜索词按预期与这些单词匹配,您可以将相同的标记化和规范化规则应用于查询字符串。例如,Foxes leap可以将搜索标准化为搜索fox jump。
自定义文本分析
文本分析由分析器执行,它是控制整个过程的一组规则。
Elasticsearch包含一个默认的分析器,称为 标准分析器,它在开箱即用的情况下适用于大多数用例。
如果要定制搜索体验,则可以选择其他 内置分析仪,甚至可以 配置自定义分析仪。定制分析器使您可以控制分析过程的每个步骤,包括:
- 标记化之前对文本的更改
- 文本如何转换为令牌
- 在索引或搜索之前对令牌进行规范化更改
分析仪的解剖
的分析?-无论是内置或自定义-只要是包含三个低级别的积木包:字符过滤器,断词和记号过滤。
内置的分析器将这些构件预先打包到适合于不同语言和文本类型的分析器中。Elasticsearch还公开了各个构建基块,以便可以将它们组合以定义新的custom分析器。
字符过滤器
甲字符过滤器接收原始文本字符的流,并且可以通过添加,移除,或改变字符变换流。例如,可以使用字符过滤器将印度-阿拉伯数字(????????)转换为其等效的阿拉伯-拉丁语(0123456789),或<b>从流中剥离HTML元素。
分析器可能具有零个或多个 按顺序应用的字符过滤器。
分词器
甲标记生成器接收字符流,其分成单个令牌(通常单个单词),并且输出流的令牌。例如,whitespace令牌生成器在看到任何空格时都会将文本分成令牌。它将把文本 "Quick brown fox!"转换成术语[Quick, brown, fox!]。
分词器还负责记录每个术语的顺序或位置以及该术语表示的原始单词的开始和结束字符偏移量。
分析器必须恰好 具有一个标记器。
令牌过滤器
甲令牌滤波器接收到令牌流,并且可以添加,删除或改变令牌。例如,lowercase令牌过滤器将所有令牌转换为小写字母, stop令牌过滤器从令牌流中删除常见词(停用词)the,然后 synonym令牌过滤器将同义词引入令牌流。
令牌过滤器不允许更改每个令牌的位置或字符偏移量。
分析器可能具有零个或多个 按顺序应用的令牌过滤器。
索引和搜索分析
文本分析发生两次:
索引时间
索引文档后,text将分析所有字段值。
搜索时间
在字段上进行全文搜索时text,将分析查询字符串(用户正在搜索的文本)。
搜索时间也称为查询时间。
每次使用的分析器或一组分析规则分别称为索引分析器或搜索分析器。
索引和搜索分析器如何协同工作
在大多数情况下,应在索引和搜索时使用同一台分析仪。这样可以确保将字段的值和查询字符串更改为相同形式的标记。反过来,这可以确保令牌在搜索过程中符合预期。
例
在text字段中使用以下值索引文档:
在敏捷的棕色狐狸跳过了狗!
字段的索引分析器将值转换为令牌并对其进行规范化。在这种情况下,每个标记都代表一个词:
[快速,棕色,狐狸,跳跃,跳过,狗]
这些索引然后被索引。
稍后,用户在同一text字段中搜索:
“狐狸”
用户期望此搜索与之前索引的句子匹配 The QUICK brown foxes jumped over the dog!。
但是,查询字符串不包含文档原始文本中使用的确切单词:
- quick 与 QUICK
- fox 与 foxes
为了解决这个问题,使用相同的分析器分析查询字符串。该分析器产生以下令牌:
[快,狐狸]
为了执行搜索,Elasticsearch将这些查询字符串标记与text字段中索引的标记进行比较。
代币 | 请求参数 | text 领域 |
quick | X | X |
brown | X | |
fox | X | X |
jump | X | |
over | X | |
dog | X |
因为字段值和查询字符串的分析方法相同,所以它们创建了相似的标记。标记quick和fox是完全匹配。这意味着搜索与"The QUICK brown foxes jumped over the dog!"用户期望的匹配包含的文档。
何时使用其他搜索分析器
尽管不那么常见,但有时在索引和搜索时使用不同的分析器是有意义的。为此,Elasticsearch允许您 指定一个单独的搜索分析器。
通常,仅当对字段值使用相同形式的标记时,才应指定单独的搜索分析器,并且查询字符串会创建意外或不相关的搜索匹配项。
例
Elasticsearch用于创建仅与以提供的前缀开头的单词匹配的搜索引擎。例如,搜索tr应返回tram或 trope-但从不返回taxi或bat。
文档被添加到搜索引擎的索引中;该文档在一个text字段中包含一个这样的词:
“apple”
字段的索引分析器将值转换为令牌并对其进行规范化。在这种情况下,每个标记都表示该词的潜在前缀:
[ a ,ap ,app ,appl ,apple ]
这些索引然后被索引。
稍后,用户在同一text字段中搜索:
“ appli”
用户希望此搜索仅匹配以开头的单词appli,例如appliance或application。搜索不匹配apple。
但是,如果使用索引分析器来分析此查询字符串,它将产生以下标记:
[ a ,ap ,app ,appl ,appli ]
当Elasticsearch将这些查询字符串标记与为索引的标记进行比较时apple,它会找到多个匹配项。
代币 | appli | apple |
a | X | X |
ap | X | X |
app | X | X |
appl | X | X |
appli | X |
这意味着搜索将错误地匹配apple。不仅如此,它还可以匹配以开头的任何单词a。
要解决此问题,您可以为该text字段上使用的查询字符串指定其他搜索分析器。
在这种情况下,您可以指定一个搜索分析器,该分析器生成一个令牌而不是一组前缀:
[应用]
此查询字符串标记将仅与以开头的单词的标记匹配 appli,从而更好地符合用户的搜索期望。
词干
词干是将单词还原为词根形式的过程。这样可以确保在搜索过程中单词匹配的变体。例如,walking和walked可以被词干为同一个词根: walk。词干一旦词干出现,就会在搜索中匹配另一个词。
词干依赖于语言,但通常涉及从单词中删除前缀和后缀。
在某些情况下,词干的词根形式可能不是真实词。例如,jumping和jumpiness都可以作为jumpi。虽然jumpi 不是真正的英语单词,但搜索无关紧要。如果将单词的所有变体都简化为相同的词根形式,则它们将正确匹配。
词干令牌过滤器编辑
在Elasticsearch中,词干由词干令牌过滤器处理。这些令牌过滤器可以根据其词干的方式进行分类:
- 算法词干分析器,它基于一组规则来 词干
- 字典词干,通过在字典中查找来 词干
由于词干会更改令牌,因此我们建议在索引和搜索分析期间使用相同的词干令牌过滤器。
算法词干编辑
算法词干对每个单词应用一系列规则,以将其简化为词根形式。例如,英语的算法词干可以从复数单词的末尾删除-s 和-es后缀。
算法词干有一些优点:
- 他们需要很少的设置,并且通常开箱即用。
- 他们使用很少的内存。
- 它们通常比字典词干分析器快。
但是,大多数算法词干仅会更改单词的现有文本。这意味着它们可能不适用于不包含其词根形式的不规则单词,例如:
- be,are和am
- mouse 和 mice
- foot 和 feet
以下令牌过滤器使用算法词干:
- stemmer,它提供了几种语言的算法词干,其中一些带有其他变体。
- kstem,是英语的词干分析器,它将算法词干与内置词典结合在一起。
- porter_stem,是我们推荐的英语算法提取器。
- snowball,它对几种语言使用 基于Snowball的词干规则。
字典词干编辑
字典词干查找提供的字典中的词,用字典中的词干词替换未阻止的词变体。
从理论上讲,字典词干非常适合:
- 阻止不规则单词
- 辨别拼写相似但概念上不相关的单词,例如:organ 和 organizationbroker 和 broken
在实践中,算法词干分析器通常优于字典词干分析器。这是因为字典词干提取器具有以下缺点:
- 词典质量词典词干分析器仅与其词典一样好。为了运作良好,这些词典必须包含大量单词,并定期更新并随语言趋势而变化。通常,当提供字典时,它是不完整的,并且其某些条目已经过时了。
- 大小和性能词典词干必须将其词典中的所有单词,前缀和后缀加载到内存中。这会占用大量RAM。低质量词典在删除前缀和后缀时也可能效率较低,这会大大减慢词干的处理速度。
您可以使用hunspell令牌过滤器执行字典词干。
如果可用,我们建议您在使用hunspell令牌过滤器之前尝试针对您的语言的算法词干分析器。
控制词干编辑
有时,词干可以产生共享的根词,这些词的拼写相似但在概念上不相关。例如,词干提取器可以将skies和 都减少skiing为相同的词根:ski。
为了防止这种情况并更好地控制词干,可以使用以下令牌过滤器:
- stemmer_override,可让您定义用于阻止特定令牌的规则。
- keyword_marker,将指定的标记标记为关键字。关键字令牌不会被后续的词干令牌过滤器阻止。
- conditional,可用于将标记标记为关键字,类似于keyword_marker过滤器。
对于内置语言分析器,您还可以使用 stem_exclusion参数来指定不会被词干限制的单词列表。
令牌图
当令牌生成器将文本转换为令牌流时,它还会记录以下内容:
- 的position流中的每个标记的
- 的positionLength,位置是令牌的跨距数
使用这些,您可以为流创建一个有 向无环图,称为令牌图。在令牌图中,每个位置代表一个节点。每个标记都表示指向下一个位置的边或弧。
同义词编辑
一些令牌过滤器可以将新的令牌(例如同义词)添加到现有令牌流中。这些同义词通常与现有标记的位置相同。
在下图中,quick其同义词fast都具有的位置 0。它们跨越相同的位置。
多位置代币编辑
一些令牌过滤器可以添加跨多个位置的令牌。这些可以包括用于多词同义词的令牌,例如使用“ atm”作为“自动柜员机”的同义词。
但是,只有某些令牌过滤器(称为图形令牌过滤器)positionLength才能准确记录多位置令牌。此过滤器包括:
- synonym_graph
- word_delimiter_graph
在下面的图形domain name system及其同义词中dns,两者的位置均为0。然而,dns有一个positionLength的3。图中的其他标记的默认positionLength值为1。
使用令牌图进行搜索编辑
索引将忽略该positionLength属性,并且不支持包含多位置标记的标记图。
但是,查询(例如match或 match_phrase查询)可以使用这些图从单个查询字符串生成多个子查询。
例
无效的令牌图编辑
以下令牌过滤器可以添加跨多个位置但仅记录默认值positionLength的令牌1:
- synonym
- word_delimiter
这意味着这些过滤器将为包含此类令牌的流生成无效的令牌图。
在下图中,dns是的多位置同义词domain name system。但是,dns默认positionLength值为1,导致图形无效。
避免使用无效的令牌图进行搜索。无效的图形可能会导致意外的搜索结果。
相思之苦的经典句子(真的想你)
好想附在你的耳畔,轻声告诉你,我好想你,一别成殇,对你的惦记从未放下。
好想,踏一缕清风,轻轻走进你的世界里,看看你的样子,听听你的声音,向你诉说我一往而深的痴迷。
一份爱,还似从前一般深挚,却只能以一种寂寞的方式静默无语。
自你离去,我掩藏了所有痴心的话语,无声无息的爱着你。
那些说不出的爱恋,都压抑在心底,你不来,爱就是一辈子静默无声的秘密。
想你,念你,圈地为牢恋你,执迷不悟念你,我爱你
时光一日一日,一年一年,在悄无声息中流逝。
逝水流年,漂浅了太多记忆,却未曾让我放下你,一遇倾心,一生爱你,一朝别离,一世想你。
你离开后,我为自己筑起一座心牢,将你的记忆长锁在我的心牢里,别人走不进来,我也不舍得将你忘记。
为你执迷不悟,是我自己愿意,哪怕相思再苦,我也甘之若饴。
有幸遇见你,深深爱着你,无论你在哪里,你都是我心中最特别的存在,今生缘分断了,还有相思情牵。
亲爱的,我爱你!这一句我爱你,今生今世,我只说给你。
曲终人散,人去念依然
听过世间最无奈的话语:
蝴蝶为花碎,花却随风飞,花舞花落泪,花落为谁悲。
蝶恋花,为花醉,为花舞,奈何,花却随风飞,为风痴,为风悲。
世间情缘又何尝不是如此,深爱之人未必能够相守,情深至极未必可以相依。
感慨,今生情深缘浅,无缘与最深爱的你相依相伴,那缘曲终人散,对你的深情却留在心间,一念情深,一生沉沦。
为你,我倾尽了世间最真的爱,为你,我流过了今生最无奈的眼泪。
明明知道,若是缘分散了,思念还在,眉间心上的思念会苦了自己,可偏偏想你总是心不由己,爱你总是情难自抑。
我真的爱你,断了情缘,断不开思念,曲终人散,人去念依然。
真的想你,寄一封信给你,心中满满都是我的思念
想你,念你,却不能去看看你,因为我怕,怕我的冒昧会带给你困扰。
爱你,恋你,却不能打电话给你,因为我怕,怕我会压抑不住内心涌动的相思。
相思的话语不能说,对你的爱恋放不下,情深痴痴,痴念深深,只能深深地压抑在自己心底,藏成心底最深的秘密。
我的秘密就是想你,一个人孤单地想,寂寞的念,在风中想,在月下念,春来的时候想,秋尽的时候念……。
想你,想你,想你,想你,我以为我能忘记你,却要用整整一个余生去想你。
想你,想你,想你,想你,我以为我能不想你,却发现,“晓看天色暮看云,行也是你,坐也是你”。
用心爱过的人,就算无缘夫妻,也会在心里铭记一辈子;走进心中的爱,就算不能再相见,也会在梦中续写爱的永远。
亲爱的,我真的想你,真的真的好想你,寄一封信给最爱的你,信中满满都是我对你的相思。
想你,念你,就算今生不能朝朝暮暮,你也是我永恒的相思。
免费英语句子分析器(ElasticSearch原理知识点和整体结构详解)
ElasticSearch整体结构
通过上文,在通过图解了解了ES整体的原理后,我们梳理下ES的整体结构
- 一个 ES Index 在集群模式下,有多个 Node (节点)组成。每个节点就是 ES 的Instance (实例)。
- 每个节点上会有多个 shard (分片), P1 P2 是主分片, R1 R2 是副本分片
- 每个分片上对应着就是一个 Lucene Index(底层索引文件)
- Lucene Index 是一个统称由多个 Segment (段文件,就是倒排索引)组成。每个段文件存储着就是 Doc 文档。commit point记录了所有 segments 的信息
补充:Lucene索引结构
上图中Lucene的索引结构中有哪些文件呢?
更多文件类型可参考
文件的关系如下:
补充:Lucene处理流程
上文图解过程,还需要理解Lucene处理流程, 这将帮助你更好的索引文档和搜索文档。
创建索引的过程:
- 准备待索引的原文档,数据来源可能是文件、数据库或网络
- 对文档的内容进行分词组件处理,形成一系列的Term
- 索引组件对文档和Term处理,形成字典和倒排表
搜索索引的过程:
- 对查询语句进行分词处理,形成一系列Term
- 根据倒排索引表查找出包含Term的文档,并进行合并形成符合结果的文档集
- 比对查询语句与各个文档相关性得分,并按照得分高低返回
补充:ElasticSearch分析器
上图中很重要的一项是语法分析/语言处理, 所以我们还需要补充ElasticSearch分析器知识点。
分析 包含下面的过程:
- 首先,将一块文本分成适合于倒排索引的独立的 词条 ,
- 之后,将这些词条统一化为标准格式以提高它们的“可搜索性”,或者 recall
分析器执行上面的工作。 分析器 实际上是将三个功能封装到了一个包里:
- 字符过滤器 首先,字符串按顺序通过每个 字符过滤器 。他们的任务是在分词前整理字符串。一个字符过滤器可以用来去掉HTML,或者将 & 转化成 and。
- 分词器 其次,字符串被 分词器 分为单个的词条。一个简单的分词器遇到空格和标点的时候,可能会将文本拆分成词条。
- Token 过滤器 最后,词条按顺序通过每个 token 过滤器 。这个过程可能会改变词条(例如,小写化 Quick ),删除词条(例如, 像 a, and, the 等无用词),或者增加词条(例如,像 jump 和 leap 这种同义词)。
Elasticsearch提供了开箱即用的字符过滤器、分词器和token 过滤器。 这些可以组合起来形成自定义的分析器以用于不同的目的。
内置分析器
Elasticsearch还附带了可以直接使用的预包装的分析器。接下来我们会列出最重要的分析器。为了证明它们的差异,我们看看每个分析器会从下面的字符串得到哪些词条:
"Set the shape to semi-transparent by calling set_trans(5)"
- 标准分析器
标准分析器是Elasticsearch默认使用的分析器。它是分析各种语言文本最常用的选择。它根据 Unicode 联盟 定义的 单词边界 划分文本。删除绝大部分标点。最后,将词条小写。它会产生
set, the, shape, to, semi, transparent, by, calling, set_trans, 5
- 简单分析器
简单分析器在任何不是字母的地方分隔文本,将词条小写。它会产生
set, the, shape, to, semi, transparent, by, calling, set, trans
- 空格分析器
空格分析器在空格的地方划分文本。它会产生
Set, the, shape, to, semi-transparent, by, calling, set_trans(5)
- 语言分析器
特定语言分析器可用于 很多语言。它们可以考虑指定语言的特点。例如, 英语 分析器附带了一组英语无用词(常用单词,例如 and 或者 the ,它们对相关性没有多少影响),它们会被删除。 由于理解英语语法的规则,这个分词器可以提取英语单词的 词干 。
英语 分词器会产生下面的词条:
set, shape, semi, transpar, call, set_tran, 5
注意看 transparent、 calling 和 set_trans 已经变为词根格式。
什么时候使用分析器
当我们 索引 一个文档,它的全文域被分析成词条以用来创建倒排索引。 但是,当我们在全文域 搜索 的时候,我们需要将查询字符串通过 相同的分析过程 ,以保证我们搜索的词条格式与索引中的词条格式一致。
全文查询,理解每个域是如何定义的,因此它们可以做正确的事:
- 当你查询一个 全文 同时, 会对查询字符串应用相同的分析器,以产生正确的搜索词条列表。
- 当你查询一个 精确值 域时,不会分析查询字符串,而是搜索你指定的精确值。
举个例子
ES中每天一条数据, 按照如下方式查询:
GET /_search?q=2023 # 12 resultsGET /_search?q=2023-09-15 # 12 results !GET /_search?q=date:2023-09-15 # 1 resultGET /_search?q=date:2023 # 0 results !
为什么返回那样的结果?
- date 域包含一个精确值:单独的词条 2023-09-15。
- _all 域是一个全文域,所以分词进程将日期转化为三个词条: 2023, 09, 和 15。
当我们在 _all 域查询 2023,它匹配所有的12条推文,因为它们都含有 2023 :
GET /_search?q=2023 # 12 results
当我们在 _all 域查询 2023-09-15,它首先分析查询字符串,产生匹配 2023, 09, 或 15 中 任意 词条的查询。这也会匹配所有12条推文,因为它们都含有 2023 :
GET /_search?q=2023-09-15 # 12 results !
当我们在 date 域查询 2023-09-15,它寻找 精确 日期,只找到一个推文:
GET /_search?q=date:2023-09-15 # 1 result
当我们在 date 域查询 2023,它找不到任何文档,因为没有文档含有这个精确日志:
GET /_search?q=date:2023 # 0 results !
以上内容是关于放松心态的简短句子和心态好的句子经典语录的内容,小编幸苦为你编辑整理,喜欢的请点赞收藏把。