2.我的网站怎样才能在雅虎的搜索结果里出现?
多方面的因素会影响一个网站在雅虎搜索结果出现与否以及其所在位置。雅虎的搜索程序在访问并抓取您的网站后,页面并不是立即出现在搜索结果里的,被抓取和被索引的文件会在下次数据库更新时出现。
3.网站排列位置由什么决定?
网站排列位置主要由网站自身质量和与关键词的相关性强弱排列。对于使用采用不正当手段骗取排名的网站搜索引擎会自动降低排名,比如:在网页标题中堆积大量无关关键词,在网页的meta keywords中堆积大量无关关键词等,而主动链接这些作弊网站的网站,也会被搜索引擎降低排名。如果发现自己的网站已经无法找到,请尽快检查是否有以上问题:尽量保持网页标题在80个字节以内,不要使用meta keywords,检查友情链接中是否有网站有对搜索引擎作弊行为。
搜索引擎会在下一个索引周期(约2-4周左右)完成后重新检查是否有欺骗搜索引擎行为并决定收录。
4.按照给出的链接进入一个网站,页面上却显示出错误讯息,这是为什么?
当您看到“拒绝访问”(Permission Denied),或“未找到该档案”(Document Not Found),这样的错误讯息可能是因为以下原因:
5.想要更准确有效地找到网站,有什么窍门吗?
尝试使用特定的搜索词汇去描述您要找的内容。通常,比较广义的关键字搜索出来的结果会很多,而当您想要更精确的搜索结果时,最好选用一些狭义的关键字做搜索。
举例说明:
试用:“口水鸡 做法”取代“口水鸡”
试用:“数码相机”取代“相机”
对于一些多义词,最好先在搜索框里精确化您要找的那个意思。例如,您要找《射雕英雄传》这部小说,而不是同名的电视剧或者网络游戏,您可以在“射雕英雄传”后面加上“小说”两个字。
6.如何包含和去除关键字?
雅虎搜索的默认的设置是包含您输入的所有关键字。
7.怎样清除搜索框里以前的搜索记录?
当您要输入新的查询时,有时在搜索栏会出现以前所键入的关键字。这是IE浏览器的一个功能,跟雅虎搜索没有关系。
如要清除其中某个关键字,你需要先点选那个字,然后按 DEL(清除)键,就可消除。
另外,您可以直接关闭IE的这项功能,做法如下。
IE:/Tools/InternetOptions/Content/AutoComplete
或
IE:工具>选项>内容>自动完成
即,打开IE浏览器,选择“工具”栏,打开“Internet 选项”,然后选择“内容”标签,单击“自动完成”,此时会弹出一个新的窗口。请您勾除“自动完成功能应用于”下的复选框,然后单击“确定”以保存该设置,最后请您关闭IE浏览器。当您再一次启动IE浏览器后,以前自动保存在您IE中的词条就会消失了。
8.英文字母的大小写对搜索结果有无影响?
雅虎搜索引擎不区分英文字母大小写。无论您输入大写还是小写字母都可以得到相同的搜索结果。
例如:输入"yahoo",或"YAHOO",结果都是一样的。
9.雅虎是如何抓取我的网站的?
雅虎应用雅虎搜索引擎技术(Yahoo! Search Engine Technology,简称YST),它是一套基于算法的Web索引抓取程序,能够自动探测网络内容。YST 这套机器搜索程序从因特网上采集文档,建立起一个可搜索的索引系统。这些文件(即您的网站文件)能被YST程序发现和抓取的主要原因是,在因特网其他的网页上包含有这些文档的直接链接。
YST 搜索程序严格遵守robots.txt标准执行抓取,因此,对于那些您不希望被雅虎搜索引擎返回的结果,搜索程序不会执行抓取。任何被robots.txt标准认为不适宜抓取的文件,既不会被包括在抓取文档中,也不会进入到搜索引擎的数据库。
10.怎样能够减少搜索引擎对我的站点发出的请求?
由于我们从整个因特网上抓取数以十亿计的网页,对于网络抓取我们采取大量系统,因此,您的网络服务器会从不同的YST抓取程序的客户端IP地址登录请求。不同的抓取程序系统彼此配合,来限制任何来自单一网络服务器的活动。所谓单一网络服务器,是由IP地址判断的。因此,如果您的服务器主机拥有多个IP,它的活动则会处于更高的级别。
在robots.txt 里,YST有一个特定的扩展名,可以通过它对我们的抓取程序设定一个较低的抓取请求频率。
您可以加入Cral-delay:xx指示,其中,“XX”是指在crawler程序两次进入站点时,以秒为单位的最低延时。如果crawler频率对您的服务器是一个负担,您可以将这个延时设定为任何您认为恰当的数字,例如60或300。
例如,您想设定一个20秒的延时,语句如下:
User-agent: Slurp
Crawl-delay: 20
11.如何使雅虎只索引某些网页?
雅虎的YST搜索引擎遵守noindex(不做索引)的meta-tag。您可以在web文档的上部写入:
<META NAME="robots" CONTENT="noindex">
这时,YST 会追踪这个文档,但不会索引,也不会将其收入搜索引擎的数据库。
12.看见重复发出的下载请求,这是怎么回事?
通常来说,在一次抓取过程中,YST 搜索程序只会对网站的每一个文件拷贝一次。但也有偶然情况,也就是说当抓取程序被中止并重新启动时,它会重新抓取最后一次拷贝的文件。但这类情况并不经常发生,也不会导致您的系统故障,请您放心。
13.这个网页抓取程序是如何发现我的网站上的文件?
YST搜索程序跟踪HREF链接,而并不跟踪SRC链接。这意味着,我们的程序不会通过SRC指向的链接去追溯或索引这些框架文件。
14.雅虎的抓取程序能够跟踪动态链接吗?
YST 搜索程序支持网页框架,并努力抓取复杂的网页,例如通过表单生成的页面、内容生成系统(content generation systems)以及动态页面生成软件。
YST搜索程序争取抓到更多不需经过网站管理员专门支持的网页,但现实中仍然还有很多网站无法被机器搜索到,无论是通过雅虎还是其他同样强大的搜索系统。
15.如何使我的网站被雅虎收录?
一般情况下,雅虎的搜索引擎会自动进行处理收录网站。
16.我的网站不想出现在雅虎的搜索结果中,如何删除?
如果您需要删除雅虎网页结果中的您自己整个网站或部份网页的记录,可以在您服务器的根目录中放置一个 robots.txt 文件,其内容如下:
User-Agent: *
Disallow: /
这是大部份网络搜索程序都会遵守的标准协议,加入这些协议后,它们将不会再抓取您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:
http://www.robotstxt.org/wc/norobots.html
只要您网络服务器的根目录中有这个 robots.txt 文件,YST 搜索程序就不会进入您的网站,您的网站也不会出现在雅虎的搜索结果中。
如果您的情况非常紧急,不能等到我们的 YST 搜索程序下次抓取您的网站时再进行删除,您可以反馈给我们,会有专人负责处理。
17.我可以只删除个别的网页吗?
如果只需要保护个别网页,不想让搜索引擎显示这几个页面,可在那一页加入以下 HTML 代码:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
有关这个标准 meta 标签的详细信息,请访问:http://www.robotstxt.org/wc/exclusion.html#meta
如果您的情况非常紧急,不能等到 YST 搜索程序下次抓取您的网站时再进行删除,请您可以反馈给我们,会有专人负责处理。
18.我的网站改版了,能帮我修改网站摘要吗?
每个网站的摘要全部由程序自动生成,没有人工干涉,也无法人工修改。雅虎搜索引擎会定期自动更新,更新后,您的网站就会出现新的摘要。
19.雅虎收录的网页涉及个人隐私或企业机密,请问如何将这些网页尽快删除?
雅虎与这些网站无关,同时雅虎也无权删除他人网站上的网页。雅虎搜索遵循客观、公正的原则。 如果您认为,在搜索结果中,他人网站上含有对您或您公司的侵权信息,并希望该信息从雅虎搜索结果中消失,请先联系这些网站管理员,只要这些网站删除内容后,这些信息会在几天或几周内从雅虎搜索结果中自动消失。如果您希望该网页信息从雅虎搜索结果中尽快消失,请先确认已联系该网站管理员删除指定网页,然后提供身份证明、网站权属证明及详细侵权情况资料,通过传真或邮件的方式提供给雅虎,雅虎在收到上述法律文件后,将会为您尽快移除被控侵权的网页。