`
wangminshe89
  • 浏览: 667774 次
文章分类
社区版块
存档分类
最新评论

搜索引擎和网站的目录结构

 
阅读更多
搜索引擎和网站的目录结构

对一个网站来说,搜索引擎是否会检索其子目录下的网页?譬如对于http://www.google8.net/archives/000062.html ,搜索引擎是否会索引?敷衍了事的答案是“会”。对一个站点中包含的子目录,只要链向该层子目录的链接提供有搜索引擎能够跟进的导航配置和URL结构,那么所有的搜索引擎都会对子目录提供遍历。网络目录结构 理想情况下,尤其对于一个规模比较小的站点来说,其目录结构应该是单一的(flat),即对实际的网页不存在或只有一层子目录。而对规模大一些的站点来说,两到三层子目录是最理想的。从搜索引擎的角度看,一个单一的目录结构为最佳。图形、脚本、CGI-BIN和样式表除外。它们应被放入子目录中而不是根目录下。
  URL结构同时向搜索引擎和你的访问者清晰地表明了在你的网站中,你认为哪些网页是最重要的。换言之,如果你觉得有一个页面是非常重要的,则该网页的URL就应使用顶级URL而不应将其放在子目录下。
  顶级网页的URL结构一般如下所示:
  http://www.google8.net/google.html
  含一层子目录的URL结构一般为:
  http://www.google8.net/archives/000063.html  其中:google8.net是域名,archives一级子目录名,000063.html是网页名。
  含两层子目录的URL的结构一般为:
  http://www.wuyue.cn/curtain/2/product1.html  其中:wuyue.cn是域名,curtain是一级子目录名,2是二级子目录名,product1.html是二级子目录下网页名,等等,依此类推。
  在对一个网站的检索中,只要你的网站提供有搜索引擎能够跟进的导航配置和URL结构,则搜索引擎通常会遍历至少三层子目录。不过,比子目录的层次数更为重要的一点却是:在你的子目录下是否有来自其它网站的外部链接。假如你的网站有第四层目录,且在该目录下提供了非常重要的内容,同时又包含了大量的外部链接,那么你尽可以放心,搜索引擎照样会对你的这个第四层目录进行检索的。
搜索引擎营销的小伎俩
  在搜索引擎的营销中,有很多搜索引擎营销商都喜欢使用这样一个小伎俩:由于他们知道搜索引擎会自动检索多层子目录,于是他们就有意用复合关键词/短语专门创建一个子目录,以确保搜索引擎能够看到这个目标关键词。但在我看来,这种伎俩其实不会有什么实际的效果,因而并不可取。
  例如,一个销售有机茶的公司,如果使用以上策略,则可能有如下的URL和目录结构:
  http://www.tranquiliteasorganic.com/Oolong-tea/Oolong.html
  其中:
  1. tranquiliteasorganic.com是域名。
2. Oolong-tea是一级子目录名,在其域名中包含了关键词“oolong tea”,以连字符分开。
  3. Oolong.html是二级目录下的网页名。
  对使用了子目录的URL结构http://www.tranquiliteasorganic.com/Oolong-tea/Oolong.html ]和顶级URL http://www.tranquiliteasorganic.com/Oolong.html ,哪一种要更好呢?对我来说,我是不会纯粹为了能够在搜索引擎中取得好排名而去更改子目录结构的。原因就在于在域名或URL中使用关键词这个办法或者压根不重要,或者效果微乎其微。
  我的答案要取决于这是一个什么样的网站。如果有机乌龙茶有很多种,而且这个网站提供了相当数量的关于乌龙茶的内容独特和质量高的网页,那么我推荐使用子目录结构。同样,为了保证网站的一致性和易用性,我还希望他们能够为提供的所有类型的茶都设立子目录。可是既然我很难相信会有大量关于乌龙茶的内容独特和质量高的网页,因而我怀疑这个子目录是否有必要。
使用Robots Exclusion Protocol协议(拒绝Robots访问协议)
  在一个用数据库驱动的网站上,在不同子目录中放入类似或完全相同的内容是颇为普遍的,因为这样可以提高用户体验。
  我们再以上面的那个茶叶站点为例,假设该站点对每种茶叶都设立了不同子目录,并提供有大量内容独特和高质量的网页,那么对乌龙茶(oolong tea),绿茶(green tea)和茶具这三者,它们的URL结构分别如下:
  1. 乌龙茶页:http://www.tranquiliteasorganic.com/Oolong-tea/Oolong.html
  2. 绿茶页:http://www.tranquiliteasorganic.com/Green-tea/Green.html
  3. 茶具页:http://www.tranquiliteasorganic.com/Tea-accessories/accessories.html
  如果该网站亦提供有散装的乌龙茶和绿茶,那么对于该网站下一个关于泡茶茶具的网页,将其放入乌龙茶,绿茶和茶具子目录这三个目录下也是合乎逻辑的。从易用性和用户体验的角度来看,这不失为一个好策略。然而对于搜索引擎来说,它们却往往把这样的内容视为冗余内容。搜索引擎不喜欢比较多数据库驱动的站点的一个原因就是,它们常常一次又一次地得到相同的内容。
  因而,如果泡茶茶具这个网页在上述三个一级子目录中都存在,搜索引擎是否会认为这是冗余内容,而且可能因为这个站点提供这样的内容而处罚它呢?最有可能发生的是,搜索引擎只显示该网站上包含很多链入链接的那个网页,而不会显示网站上的其它网页。
  同时,也有很多缺乏职业道德的搜索引擎营销商过分使用该策略,对完全相同的信息生成大量冗余内容。因而极有可能被搜索引擎认为是SPAM而受到处罚。
  为了使网站百分百的安全,你可以在网站的冗余内容中放入一个纯文本文件robots.txt(Robots Exclusion Protocol),在这个文件中声明该网站中不想被robot访问的部分,这样就可以限定搜索引擎对你网站的检索范围。不过,你还需要对站点的统计数据进行仔细的分析,看看哪个子目录是最常用到的,对这样的子目录可不要放robots.txt文件哦。
  在上述情形下,使用robots.txt文件解决了两个问题。首先,它向搜索引擎传达了你并非故意传输冗余内容。其次,由于相关的容在适当的子目录下仍然有效,所以对用户体验并无负面影响。
结论:
  一般来讲,搜索引擎在对子目录的检索上不存在问题。如果你发现把你的网站划分为子目录结构能够为用户提供更好的用户体验,那么你尽可以这么做。但是不要只是为了引起搜索引擎的注意而创建子目录。有许多策略都能够达到这样的目的,它们不但无需花费你很多时间,而且还会给你的网站带来比较好的投资回报(ROI)。
  这个用户提出的问题引出了在搜索引擎业界中引发激烈争论的问题:一个网站何时使用子目录(subdirectories),子域(subdomains)或迷你网站(mini-sites)最合适?网站业主是否应利用目标关键短语创建自己网站的URL?是否子目录的名称中应包含关键短语?那又是后话了。
分享到:
评论

相关推荐

    搜索引擎优化培训教程

     目录结构和 URL  导航结构  框架结构  图像优化  表格使用  网页减肥 第四部分:SEO 指导下的技术支持  Title 和 Meta 标签  动态网页优化 第五部分:搜索引擎优化的重点:链接策略  搜索引擎分类目录 ...

    走进搜索引擎.pdf

    《走进搜索引擎》是一本搜索引擎原理与技术的入门书籍,面向那些有志从事搜索引擎行业的青年学生、需要完整理解并优化搜索引擎的专业技术人员、搜索引擎的营销人员,以及网站的负责人等,是从事搜索引擎开发的工程...

    垂直搜索引擎的设计与实现

    论文研究了搜索引擎的相关技术,通过分析基于查询串方式的搜索引擎和分类目录式搜索引擎的整体结构,设计了垂直搜索引擎的系统结构,并对其中涉及的关键技术:触b搜集器、信息抽取技术、中文分词和检索技术进行了深入...

    网站结构目录在搜索引擎中的自然权重.pdf

    网站结构目录在搜索引擎中的自然权重.pdf

    基于ASP搜索引擎系统++论文

    2.3.1 目录式搜索引擎 5 2.3.2 全文搜索引擎 6 2.3.3 元搜索引擎 6 第三章 搜索引擎的发展趋势 8 3.1 搜索引擎的多元化 8 3.2 搜索引擎的专业化 9 3.3 搜索引擎的智能化 9 3.4 搜索引擎的多媒体化 9 3.5 搜索引擎的...

    简易全文本搜索引擎设计

    1.2 搜索引擎的发展方向 1 2 系统开发技术分析 2 2.1 系统开发环境 2 2.2 IIS简介 2 2.3 SQL SERVER 2000简介 3 2.4 ASP简介 3 3 概要设计 3 3.1 需求分析 3 3.2 数据库设计 4 3.3 系统设计结构图 5 4 系统前台模块...

    HiGo垂直搜索引擎系统 v7.3.rar

    HiGo垂直搜索引擎开源版系统需要独立服务器支持,也可以用你本地电脑做服务器来调试,基于lucence mysql asp.net,支持数据索引,中文分词,模糊查询,爬虫采集,精确采集规则模式和模糊采集规则模式相混合(模糊采集...

    网络爬虫一种搜索引擎

     (3) 万维网数据形式的丰富和网络技术的不断发展,图片、数据库、音频/视频多媒体等不同数据大量出现,通用搜索引擎往往对这些信息含量密集且具有一定结构的数据无能为力,不能很好地发现和获取。  (4) 通用搜索...

    Java搜索引擎的研究与实现(含文档+源码)

    Java搜索引擎的研究与实现(含文档+源码) 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web...

    搜索引擎优化高级编程(PHP版)

    2.4.6 搜索引擎博客和资源 2.5 小结 第3章 友好的搜索引擎URL地址 3.1 为什么URL地址重要 3.2 动态URL地址和静态URL地址 3.2.1 静态URL地址 3.2.2 动态URL地址 3.2.3 URL地址与网站单击率 3.2.4 URL地址与重复内容 ...

    搜索引擎高级体系结构设计文档

    目录 一.综述 4 二.关注点 5 2.1 功能需求 5 2.2 质量需求 6 2.3 约束 8 三.体系结构需求定义 8 3.1 体系结构需求描述及体系结构约束 8 3.2 用例视图 20 3.3非功能需求的可验证性场景描述 21 四.初始体系结构 29...

    搜索引擎整站源码SQL+蜘蛛+竞价排名系统+新站登陆

    重新设计数据结构和程序代码,在数据结构上与以前的版本有极大的区别,V3.0数据结构更有效提升程序执行的效率。前台、后台界面和操作重新设计,破除了K风系列产品以往的后台风格。在商业方面改进了功能的效果和操作...

    阿里妈妈SEO培训教材《中小网站搜索引擎友好设计》.rar

    中小网站搜索引擎友好设计 搜索引擎友好设计的重要性 一、网站定位 二、网站设计 1、网页静态化 2、搜索引擎不利因素 ...5、网站信息 ...四、网站内容 ...五、网站优化 ...2、网站目录结构与URL 3、关键词密度

    自己动手写搜索引擎(罗刚著).doc

    自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5...

    HiGo垂直搜索引擎系统开源版(基于lucence mysql asp.net) v2.2.rar

     HiGo垂直搜索引擎开源版系统需要独立服务器支持,也可以用你本地电脑做服务器来调试,基于lucence mysql asp.net, 支持数据索引,中文分词,模糊查询,爬虫采集,精确采集规则模式和模糊采集规则模式相混合(模糊...

    基于ASP的搜索引擎的开发

    本文通过分析国内外搜索引擎的发展现状,提出了一种利用ASP技术实现一个B/S体系结构的搜索引擎系统的方案,以期达到功能强大,操作简单,通用性强,可以满足用户对信息搜索需要的搜索引擎系统。文中着重论述了该系统...

    一个小型搜索引擎的设计与实现

    本文通过分析国内外搜索引擎的发展现状,提出了一种功能强大,操作简单,通用性强,可以满足用户对信息搜索需要,利用ASP技术实现的一个B/S体系结构的搜索引擎系统方案。文中着重论述了该系统的功能与实现、数据流程...

    搜索引擎——原理、技术与系统(附作者课堂录音及讲稿)

    目录 前言第一章 引论 上篇 WEB搜索引擎基本原理和技术第二章 WEB搜索引擎工作原理和体系结构第三章 WEB信息的搜集第四章 对搜集信息的预处理第五章 信息查询服务 中篇 对质量和性能的追求第六章 可扩展搜集子系统...

    多用户搜索引擎 

    本程序部分查考了国内外个别网站的结构、思路、图片等,在功能上也是尽量效仿国内外的著名搜索引擎,如果您感觉我们侵犯了您的某一方面的权益,请以Email方式告知,我们将尽快删除有关内容。 相关下载: ...

    飞涛本机搜索引擎

    3.用户可以自行指定搜索范围,既可以增加多个文档,也可以增加选定的目录,或者增加整个硬盘里的所有文档。 4.灵活的模版化设计,稍具网页设计知识的用户,即可自行修改软件www目录下的搜索界面。 5.不用...

Global site tag (gtag.js) - Google Analytics