您的当前位置:首页正文

找回丢失的流量

2024-01-11 来源:个人技术集锦
维普资讯 http://www.cqvip.com

I夭地l锦囊妙计Perfect Skill 文:付斌 前不久做了一个网站http://www soulunwen corn,中文站 的网站.所谓的扁平结构就是指目录比较浅,我以前的页面都是放在wwW— 名叫“搜论文”(图1),整站是使用风讯制作的,大概有2万多 ROOT/HTML目录下的。看到这一条忠告后我决定把所有的页面向上提一个目 页面,全部静态HTML页都是用模板+FS0生成的.因为页面太 录.放在WWWROOT目录下 多所以生成起来比较费肘。总算是用了一天时问全部生成完毕, 至此,我的策划已经很完整了,找了个时间将全站发布成HTML。可是.问 等着日后慢慢更新了。 题才刚刚开始。 但是因为太希望搜索引擎尽快搜录我的站点,要知道一个 就在我发布完页面的第二天,我发现百度已经开始大量地收录我的网站页 习站的平均流量有百分之七十以上来自搜索引擎.而对于一个 面了.用sjle:soulunwen COrn命令在百度搜索框中盎询发现被搜录的页面已 祈站来说可能会达到百分之九十以上,可偏偏百度就是无动于 经达到几千页。我当然十分高兴,但是仔细观察了一下地址.天啊!这不是第一 襄。于是笔者就开始想办法优化站点的结构。初期找出了自己站 次发布的页面地址吗7如图2,这篇文章的地址本来应该是www soulunwen. 电的几个问题.尽管不知道百度不搜录网站的原因,但我还是信 corn/type1_5/19310862 htm,结果现在成了WWW soulunwen com/Html/typeI 誓旦旦地对站点进行了调整。根据百度的帮助,网站“需要”调 一5/19310862 htm。 整内窖有以下几点: 整整少了一级目录,百度这下和我开了一个大玩笑,居然把以前的页面搜 1百度说“尽量少使用frame和iframe框架结构”.于是我 录了。如果有人通过这个链接点入(可能性还不小),访问到的就是一个“找不 把原站多个框架精简变成了 个,但是为了生成速度加快,把去 到页面”。可这篇文章好好地在那啊,这个流量就会演费,要知道,流量带来的 掉的iframe全都改成了JS。 不光是【P数,还有广告费呢。唉.怎么办呢? 2百度说“请不要在标题中堆积与正文无关的关键词”,于 想来想去,想出几套方案: 是我大幅度精简了页面中的META部分。 1把所有的页面再放到HTML目录下,因为网页内部链接的问题,就需要 3根据资料还反映出百度更偏好于搜录站点趋于扁平结构 重新生成全站网页了。生成到不怕,顶多是浪费点时间,关键是你把网页放回去 了,回头百度又把你放之前的搜录,岂不是白忙7 蚴 啊 脚幽世越 皿 !u2.再生成一套整站,放在HTML目录中一份.两套网站保证不会丢失流量。 ■t I帕h lJ 一皿■ ∞c砷 ,■q U 说得简单,但是做起来费时,况且还浪费了大量的服务器空间。看来也不行。 3我的服务器可以自定义404错误页,不妨利用一下,在错误页上写一句 SauLunWlm.oom 话:“请把URL去掉HTML四个字符后再次访问”,这样就能看到文章了。但是 这样做的人又有几个呢,连自己都觉得好笑。 0 棼 4能不能用ASP程序来实现,如果可以就好办了,用变量获取当前的 鞋 URL.去掉其中的HTML四个字符,再刷新页面不就搞定了?理论上没有问题, 曼暴论文 免蕾试■ t学僵■ 蜢n 虹皿盥 垃 置班 且皇叠盘且让墨皿 照生吐 啦芏亘盘牲芏逝 柬削 但是用户访问失败后只能接触到404页面,服务器又不是自己的.没有权利把 匮芏 此趾业 旦£! _I匡 直蝗 垃口满勘 址旺蜢鲤 工啦 妊IIi 书 常用崔■ 冀他文昔 404页面设置成ASP的,只能是默认的404.hfm。看来还是不行。 t 鱼同皿衄蛆曼搬 垂l『皿 翌挠 王 王也盎埴 蛐丘盛当塑擅盘静职僵妻i 值 蛙 鲎盘 iL墨 【百擅坦怦甜 i 垃i 捣墨 啦 擅 箍 c擅强垃!i 璺l&主I矗 卑书 5.ASP实现不了,但是JAVASCRIPT的功能也不小啊,要不然试试用JS 千审站鱼m-喝 地日 写一段程序实现URL的截取.问题就解决了!对,404页啊!你不让我用ASP, ; i 出生 ;二 妇 广 r;ib- 我就不用,JS照样能搞定。 维普资讯 http://www.cqvip.com 方案确定了.可惜我的JAVASCRIPT写得不好.没有什 么思路.量重要的就是函数不熟悉。上网搜索7一下。才有些 明白。 最终写出的代码如下: <scri D1 I8ngu自ge=JaVaScr}D{> var e=window tocation href; s=s replace(/Htm怕, ). 1ocation href=8 </sc ript> 下面对这小段代码解释一下.windowlocation href就是 当前的URL了,将它取得后赋给变量s 下一句用到了JS中 的replace函数.它在JS中很重要.因为有了ASP.所 才被 别人忽略.它的用法如下 REPLACE(str.from—str.te str) 返回字符串str.其字符申from—str的所有出现由字符串 to_sir代替。举个例子: REPLACE( WWW.mysql corn。.~w.。Ww。)。 ’WwWwW mysql corn 所以这里使用replace函数把HTML字符铸换成空。 location href=s一句就是重新进入页面.把s变量所谓新的 URL截八 览器。 另外.为了美观,在404页中加入如下代码: <p class=。body ><b><span lang=。zh-cn >网页载人中. 请稍等</span)(,b><,D> 效果如圈3 再把网页的头部处理一下 <title>网页载人中.请稍等一 ^Ⅳw soulunwen.com<ttltle> 这样用户在访问页面时觥会自动进八上一级目最.就算 是页面跳转速虚很慢也会出现网站的站标和“网页载人中. 请稍辞”的宇样。至此问题樽到了解决。所有被百度收录的 面面都能正确地找到网址.真的没有浪费一点流量啊。 不过有个小问题.上面所说的是用户访问形如WWW. 』门9310862htm的页面,如果 用户访问的是一个不存在白|)面面就会造成死循环【虽然可能 性很小.但还是有可能1.还没想到特别完美的办法解决.如 果读者有好的方法欢迎到我的站点blog soulunwentom注 册个博客大家分享。 

因篇幅问题不能全部显示,请点此查看更多更全内容