网站物理结构指的是网站目录及所包含文件所存储的真实位置所表现出来的结构,物理结构一般包含两种不同的表现形式:扁平式物理结构和树形物理结构。
对于小型网站来说,所有网页都存放在网站根目录下,这种结构就是扁平式物理结构。采用扁平式物理结构的网站。
这种扁平式物理结构对搜索引擎而言是最为理想的,因为只要一次访问即可遍历所有页面。如果网站页面比较多,太多的网页文件都放在根目录下的话,查找、维护起来就显得相当麻烦,扁平式物理结构一般适用于只有少量页面的小型、微型站点。
对规模大一些的网站,往往需要二到三层甚至更多层级子目录才能保证网页的正常存储,这种多层级目录也叫做树形物理结构:即根目录下再细分成多个频道或目录,然后在每一个目录下面再存储属于这个目录的终极内容网页。
采用树形物理结构的好处是维护容易,但是搜索引擎的抓取将会显得相对困难。互联网上的网站,因为内容普遍比较丰富,所以大多都是采用树形物理结构。逻辑结构优化
与网站的物理结构不同,网站的逻辑结构也称为链接结构,主要是指有网页内部链接所形成的逻辑结构,或者称为链接结构。逻辑结构和物理结构的区别在于,逻辑结构由网站页面的相互连接关系决定,而物理结构由网站页面的物理存放地址决定。
在网站的逻辑结构中,通常采用“链接深度”来描述页面之间的逻辑关系。“链接深度”指从源页面到达目标页面所经过的路径数量,比如某网站的网页A中,存在一个指向目标页面B的链接,则从页面A到页面B的链接深度就是1。
和物理结构类似,网站的逻辑结构同样可以分为扁平式和树形两种:
—扁平式逻辑结构:扁平式逻辑结构的网站,实际上就是网站中任意两个页面之间都可以相互连接,也就是说,网站中任意一个页面都包含其他所有页面的链接,网页之间的链接深度都是1。网络上,很少有单纯采用扁平式逻辑结构作为整站结构的网站。
—树形逻辑结构:是指用分类、频道等页面,对同类属性的页面进行链接地址组织的网站结构。在树形逻辑结构网站中,链接深度大多大于1。
网站结构优化工作中会出现哪些蜘蛛陷阱
第一:flash。相信,这个许多网站都会有的。为了让用户体验更好,网站看起来更加的美观,放大量的flash动画。‘大量’,我这里说的是大量哦。大量的flash动画造成的后果只有一个,那便是搜索引擎蜘蛛是抓取到了你的网页,但是。在抓取后的预处理这一块,犯难了。因为提取不到一个中文文字。没有中文文字,搜索引擎蜘蛛怎么会知道抓到的网页的内容什么啊。特别是,用flash做成的导航,最危险了。第二:Session ID这个,少部分的网站可能会用。网站一旦使用了Session ID后,每一个访问者来到你这个网站中都会产生一个不同的ID号。搜索引擎蜘蛛也是如此。一旦第一次搜索引擎蜘蛛来过,抓取过你网站的URL地址后。下一回它来,Session又会给蜘蛛一个不同的ID号,蜘蛛又会重复抓取一遍你的网站,但是URL不一样。这样造成的后果便是,搜索引擎蜘蛛会认为你这个网站中有大量重复的内容。会对你的网站越来越不感兴趣,最后都不来了。对于非要使用Session ID的网站,避免的方法是让程序员设计出来一套专门识别搜索引擎蜘蛛的代码。区别开是蜘蛛还是用户。第三:各种跳转搜索引擎蜘蛛对于各种跳转也是十分的敏感的。因为黑帽SEO最喜欢用跳转这种手段了。黑了别人的网站,然后在别人的网站上挂上一个指向自己网站的跳转。第四:框架结构第五:动态的URL地址动态的URL地址一般过于长,带有较多的参数。好比“?”“=”“id”等,搜索引擎蜘蛛一旦爬行进入,很有可能会出不来。所以网站建议使用静态地址。第六,必须登录了,才可以进入到网站中有些网站为了采集用户信息,非要登录了才能进入到网站中。可是,搜索引擎蜘蛛不是人,它不会登录。它进入不了你的网站,那么你的收录便很有问题了。
网站结构优化包括哪些
网站结构主要包括四方面:一,友好的网站结构1, 扁平or树型:
2, 链接结构1)首页链接应该链向重要的频道页,频道页再链向下面的节点页或普通页面。频道页、节点页和普通页面都应该可以链回到首页2)无论哪些页面之间互相链接,都需要一个描述恰当的锚文本3)链接不要放在JS、FLASH等搜索引擎不可见的位置,使用图片做链接入口应该完善alt标签二,通过导航让百度更好地认识站点对于用户,导航要解决的问题是:我在网站的什么位置,我想看上一级、甚至上上一级更多内容的入口在哪里;对于spider,导航要解决的问题是:这个页面属于哪个领域,要表达的主题是什么。所以说,清晰的导航系统不仅有助于提高用户体验,对SEO的意义也是重大的,所有SEO做得出色的网站基本都拥有清晰明确的导航。三,合理的domain结构除了在网站建设的时候站长会思考到底使用二级域名还是子目录,在网站运营的过程中,也会考虑是否要把子目录的内容拆分成二级域名。四,url结构很重要1,url结构规律化:同一个网页有不同url,会造成多个url同时被用户推荐导致权值分散;同时百度最终选择展现的那个url不一定符合你的预期。站点应该尽量不把sessionid和统计代码等不必要的内容放在url,如果一定要这样做可以通过robots禁止百度抓取这些非规范url2,最好能让用户从url即可判断出网页内容,便于蜘蛛解析的同时便于用户间传播3,url尽量短4,不要添加蜘蛛难以解析的字符 5,动态参数不要太多太复杂,目前百度对动态url已经有了很好的处理,但是参数过多过复杂的url有可能被蜘蛛认为不重要而抛弃