百度中文分词技术如何在SEO中灵活运用?

自媒体 投稿&转载 1347浏览

SEO优化过程中写文章应该注意:一篇文章一般在500-800个字,一个长尾词一般在8个字,最好在文章的第一段里出现,出现次数3-6次,超过6次会被搜索引擎K掉,这是今天的干货。

SEO除了“中文分词”还有“文本分析”

百度是如何来分词的呢?分词技术现今非常成熟了。

第一:字符串匹配的分词方法

(1)正向最大匹配法

就是把一个词从左至右来分词。

举个例子:”不知道你在说什么”

这句话采用正向最大匹配法是如何分的呢?“不知道,你,在,说什么”。

(2)反向最大匹配法

“不知道你在说什么”反向最大匹配法来分上面这段是如何分的。“不,知道,你在,说,什么”,这个就分的比较多了,反向最大匹配法就是从右至左。

(3)就是最短路径分词法。

就是说一段话里面要求切出的词数是最少的。

“不知道你在说什么”最短路径分词法就是指,把上面那句话分成的词要是最少的。“不知道,你在,说什么”,这就是最短路径分词法,分出来就只有3个词了。

(4)双向最大匹配法。

而有一种特殊的情况,就是关健词前后组合内容被认为粘性相差不大,而搜索结果中也同时包含这两组词的话,百度会进行正反向同时进行分词匹配。

第二:词义分词法

就是一种机器语音判断的分词方法。很简单,进行句法、语义分析,利用句法信息和语义信息来处理歧义现象来分词,这种分词方法,现在还不成熟,处在测试阶段

第三:统计分词法

根据词组的统计,就会发现两个相邻的字出现的频率最多,那么这个词就很重要。就可以作为用户提供字符串中的分隔符,这样来分词。

比如,“我的,你的,许多的,这里,这一,那里”等等,这些词出现的比较多,就从这些词里面分开来。

如果一天写10篇文章,一年就可以写3650篇文章,给你的网站写3650个关键词并合理布局到你网站中,可以使用关键词挖掘工具提词,根据用户需求进行关键词的筛选,吸引流量指日可待。分词还有一种好处,那就是提升内页的排名。SEO是心理学,去猜想用户使用什么词搜索,从而进行非常有意思的工作。

推荐阅读

分析牛:查询分词权重,巧妙布局网页关键词

今天和大家分享一个纯干货,关键词的布局,也许很多人会说,这个还不容易,title出现一次,keywords出现一次,description在出现一次,然后正文的H标签里在出现一次,最后在每段的开头,末尾尽量的在出现几次就解决了。 怎么查询分词权重 也......

基于主特征空间相似度计算的切分算法【百度搜索研发部】

我们为什么要切分? 说到切分(segmentation),大多数人最容易想到的就是中文分词。作为没有天然空格区分的语言,切词可以帮助计算机去索引文章,从而便于信息检索等方面。该部分主要用到了分词的一个方面:降低搜索引擎的性能消耗。我们常用的汉字有50......

宝塔面板后台怎么设置SSL加密访问

由于早期并未默认开启https访问,因此没有相关风险提示。现在面板默认启用了https加密访问,以提高安全性。...