SEO笔记

做SEO的由来就不赘述了,这里有一些SEO的经验,如果发现做SEO效果不好,还可以花点钱做SEM(Search Engine Marketing),买点关键词,流量来得快效果好。

初次SEO的经历

SEO(Search Engine Optimization)就是针对搜索引擎的优化,搜索引擎的搜索排名规则是什么,我们就照着符合他的规则,投其所好来做。想想我们什么时候会使用搜索引擎,我们一般是希望了解某件事物,或者说我们在网上找东西,找一个问题的相关内容或答案。这时候我们最难受的是什么,是寻而不得,或者被误导得到不希望的答案;那相对就是很快的得到想要的答案。

google搜索-滴滴云

那搜索引擎需要做些什么,我们先看看搜索引擎的基本工作原理包括如下(这里只做基本原理分析,不涉及搜索引擎具体的技术实现,我也没做过😀):

  1. 信息采集模块:在互联网中发现和搜集网页信息;
  2. 查询表模块:对这些信息分类建立索引存库;
  3. 检索模块:由检索器根据用户输入关键字匹配索引库,根据查询速度、相关性评价排序,并将结果返回给用户。

针对搜索引擎的工作原理我们来分析怎样让我们的网站更容易被用户搜索到。每时每刻都有无数的网页在互联网中更新,搜索引擎的信息采集模块要是通过渲染结果的方式来爬取这些网页信息,那将是一个耗时费力,成本巨大的事情,所以他一般不这么做,而是会抓取网页的字符内容。搜索引擎最后的结果会用到网页内容相关度来排序,大部分搜索结果都是成千上万条,他怎么知道我的网页里什么是重点内容呢?作为站点维护人员想让自己的网页容易被搜索到,那应该主动告诉搜索引擎。因此这里有一些约定熟成的规则,就是网页的语义化标签。搜索引擎要建立强大的索引库,以保证搜索结果的及时准确,还会根据我们的网页中的链接去抓取相关网页的内容。前面讲到互联网上每天有无数的页面更新,采集器是一个深度和广度遍历的过程,搜索引擎精力也有限呀,采集到我们的网页的时候可能不是那么及时,而且我们的网站要不能快速响应,采集器也很难搜集到。所以我们应该主动上报给搜索引擎,给搜索引擎提交网站地图,这也是一个双赢的过程。

note: 搜索引擎一般不渲染网页来抓取信息,所以用div+css显示的很大的标题不一定会被识别为网页的重要内容,可以根据情况换成语义标签h1...h6,对采集器以示友好。

关于搜索引擎抓取的问题可以参考google搜索抓取统计信息报告的文档

到这里我们也有了优化的方向,如下:

  1. 网页内容(代码)优化
  2. 网站结构和页面加载速度
  3. 外链和内链
  4. 特殊搜索引擎优化

网页内容(代码)优化

代码层次

精简标签代码层次结构,便于采集器的内容抓取。

网站结构和页面加载速度

网站结构: 目录结构尽量偏平化、添加面包屑导航,以便采集器在抓取内链的时候能快速到达子页面,建立内容关联。

网站页面加速: 这里的加速主要指网页内容本身请求响应速度,可以通过gzip压缩网页文件,静态化网站页面减少服务器构建响应内容时间,页面中减少内联代码,减少页面首次加载的内容,不涉及搜索的内容异步加载等。

网页标签

<meta> keywords 和 description

<meta name="keywords" content="滴滴云 云服务 滴滴云服务 ... didi cloud">

<meta name="description" content="滴滴云基于滴滴出行的业务技术和经验积累,...高效稳定、高性价比、安全可靠的IT基础设施云服务">

keywords: 我要告诉搜索引擎我的网页和那些内容相关,用户在搜索的时候可以匹配上。为了提升页面容易被用户搜索到,关键词的选择还是需要花一些精力的,对此也有很多在线工具可以辅助我们挖掘关键词,内容控制在100个字符以内。

description: 是对网站内容的整体描述,在搜索引擎的搜索结构描述部分可看到,搜索引擎也会抓取描述中的关键字,内容控制在100-200个字符。

note: 关键词最好和网站内容匹配,有的搜索引擎会对关键词和网页内容匹配评分,相关度不大可能会被评为虚假内容,而影响搜索排名。有的网站在做关键词的时候绕过这个规则,使用一些keywords为热门词汇的中转页面来欺骗搜索引擎,当用户点击搜索到的链接后到达这些中转页面,网站自动重定向到网站真实的页面。

<img> 添加alt属性

img标签的alt,用于描述图片内容,可以在图片无法渲染的情况下展示出来,也是搜索引擎能抓取到的内容。

<img src="//dicloud.didistatic.com/static/dicloudpub/www/img/didiyun-share-icon.12a15ef8a2.png" alt="滴滴云(DC2)">

<title> 这类内容程度描述性标签

<title><h1><h6><strong><b><i><em>

title 控制在10-60个字符

note:我们可以投其所好,针对搜索引擎添加语义化标签,但不能滥用,如果一个网页中有很多个重点,那大家的重要性就没有比较了,就像老师给同学们划了一本书的重点,那划和没划就没有太大区别了,因此一些无关的图片和内容我们也应该避开干扰。相对,搜索引擎在抓取内容的时候也可能会标记网页内容的质量和采集过程评价,进而影响排名。

外链和内链

搜索引擎在采集网站信息的时候会抓取网页中的链接深挖采集链接对应的网页,并对没在库的网站新增索引记录,已在库的网站更新计数作为搜索排名的一个重要参考因素。

内链: 我们通过如:网站底部一些关于我们、公告等链接;产品列表;分页链接等自然关联上了。
外链: 前期我们最缺的就是外链,作为一个新的站点,在互联网中是几乎没有外链的,没有外链搜索引擎就找不到我们的站点。根据需要,文档搭建、友站、知乎、贴吧、开发者社区等中添加我们网页的链接,就像趁热度一样,代码写完这些我们都得一一补上。

搜索引擎优化

除了等待搜索引擎来爬取我们的网页信息,我们还可以通过向搜索引擎提交网站链接或者通过sitemap批量主动上报给各搜索引擎,让其更好的抓取我们站点的信息,以便被用户搜索到。我们也可以通过在站点根路径中添加robots.txt文件设置一些规则来限制搜索引擎的抓取行为。

根据sitemaps.org的描述,Sitemap 可方便管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。各个搜索引擎在实现上可能有一些差别,但基本都兼容。

下面以google搜索引擎和我们官网站点地图截取部分为例来讲解sitemap.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
  <url>
    <loc>https://www.didiyun.com</loc>
    <changefreq>daily</changefreq>
    <priority>1.00</priority>
  </url>
  <url>
    <loc>https://www.didiyun.com/activity.html</loc>
    <changefreq>daily</changefreq>
    <priority>0.90</priority>
  </url>
  <url>
    <loc>https://www.didiyun.com/production/dc2.html</loc>
    <changefreq>daily</changefreq>
    <priority>0.60</priority>
  </url>
</urlset>

<url> 控制搜索引擎以url为key收录
<changefreq> 控制搜索引擎抓取频率,小于我们上线更新的时间,
<priority> 控制搜索引擎抓取权重

关于sitemap的其他参数可以参考各家搜索引擎的支持情况,如:Google Search Sitemap,后面具体的搜索引擎sitemap提交链接中有对应的文档。

向搜索引擎提交sitemap

提交站点地图,一些验证是必不可少的,首先的明确你提交的网站是你的,这个一般有DNS和文件验证方法。
DNS:搜索引擎提供认证信息配置方法,在我们站点的域名解析中添加对应的txt解析,确认。
文件认证:搜索引擎提供认证文件,一般为google72ag...842d.html/baidu_verify_FesGBaaTy.html格式的认证文件,下载并部署到站点下如https://www.didiyun.com/google72ag...842d.html,确认认证成功后则可操作变更提交。

方法一 结合Search Console

  1. 打开Search Console

  2. 点击ADD A PROPERTY打开添加站点

Alt text

  1. 选择Website或者Android App,输入你的站点后点击添加

  2. 验证你的站点,按要求把给定的下载下来并上传到你的站点路由地址为图中所示 https://www.didiyun.com/google72ag...842d.html

Alt text

  1. 验证通过后在列表中点击网址

Alt text

  1. 点击网址进入管理页 Crawl->sitemap,人后点击ADD/TEST SITEMAP添加站点地图

Alt text

Alt text

方法二 使用站点地图报告提交站点地图

使用 ping 工具。 在您的浏览器或命令行中向此地址发送 GET 请求,并指定站点地图的完整网址。请确保站点地图文件可供访问:
https://www.google.com/ping?sitemap=<full_URL_of_sitemap>
示例:
https://www.google.com/ping?sitemap=https://www.didiyun.com/sitemap.xml
返回:
已收到站点地图通知
您的站点地图文件已成功添加到我们要抓取的站点地图列表中。如果这是您首次就此站点地图通知 Google,请通过 https://www.google.com/webmasters/tools/ 添加它,以便跟踪其状态。请注意,我们无法将提交的所有网址都添加到索引中,对于何时或是否显示这些网址,也无法预测或保证。

方法三 结合Search Console

将下面这行内容插入到 robots.txt 文件中的任意位置,以设定指向您站点地图的路径。我们会在下次抓取您的网站时找到该站点地图:
Sitemap: https://www.didiyun.com/sitemap.xml

百度搜索

  1. 进入百度站长平台

  2. 打开我的网站->站点管理->添加网站

Alt text

  1. 然后第二步选择站点类型(游戏、信息技术等等),然后第三步验证网站,文件验证与google search类似,此外还提供了其他HTMLmeta标签和CNAME方式
<meta name="baidu-site-verification" content="sha12asdl2L" />
  1. 到网站抓取下链接提交,选择sitemap,然后添加你网站sitemap的url,然后提交

Alt text

  1. 也可以直接选择手动提交

Alt text

https://www.didiyun.com
https://www.didiyun.com/activity.html
https://www.didiyun.com/production/dc2.html
...

360 搜索

  1. 打开 360搜索站点提交

Alt text

搜狗 搜索

  1. 打开 搜狗

Alt text

  1. 打开bing url submit

Alt text

其他搜索引擎提交地址

第二次SEO

到这个时候我们已经有一定的外链了,比如:我们的文档系统就有很多的链接到网站的对应产品页;各技术论坛已经有了一些带链接的评测文章,以及我们优惠活动宣贯加持等。这一次主要是结合GA等数据分析对一些关键词的更新,这也是一个长期持续的过程。随着时间的推移,热点也在不断变化,今年或这个季度渲染热,我们就加渲染方面的关键词,GPU云服务器比较火,那就加对应的关键词。

note:更新完了后别忘了通知搜索引擎及时抓取。

第三次SEO

通过一些SEO的工具评测指导优化

虽然有一些指导性的开发规范,但经过一段时间的新增和迭代后,从整体来看我们的网站中依旧有一些新的SEO优化点。比如:

  • 某个页面设计时没有需要用到h1这种总结性大标题的地方
  • 某次开发的页面过大,加载速度慢
  • 某个页面有重复代码
  • 某个外链失效了

所以SEO是一个长期持续的过程, 这里列举一些我用到的工具:

checkbot 是一个chrome插件,但打开和其他大多SEO评测的网页一样链接,他除了SEO评测和建议,还会检测网页速度和安全变给出修改建议。建议不一定都需要改,我们有的业务需要或者遇到其他难点,但不满足某个评测规则,也是可以忽略的,综合来说符合上面的搜索引擎抓取和搜录规则就好。

关键词挖掘

seo.chinaz.com

增加优质外链

  1. 官方博客系统
  2. 云使者
  3. 合作伙伴计划
  4. 开源项目支持
  5. OpenAPI文档
  6. 外部的各社区发文增加外链

第四次SEO

SEO是一个长期持续的过程,写软文是SEO的一个好办法,所以这个系列你懂的。

附录

相关链接