| 开始时,需要有Google站点图产生器。因为我的示例站点建立在Linux服务器上,所以下载了产生器的“tar.gz”版本。我的主机支持运行Python脚本程序并且我使用的是Python 2.2.3版本。 将下载的命名成sitemap_gen-x.x.tar.gz文件放置于服务器的某个位置。我将下载的文件放在示例位置的根目录上。下一步,使用“gunzip”命令解压。 Gunzip –dc sitemap_gen-x.x.tar.gz | tar xvf 文件的内容将被解压到去掉“.tar.gz”后缀名的文件夹中。 在此文件夹中,找到example_config.xml文件 并将其拷贝到config.xml。编辑这个文件,注重下面几个必需(有些是可选)的参数。 - base_url基本_url(必须):你的站点的顶层URL,在我的例子中是http://www.allinvites.com。
- store_into存储信息(必需):路径和文件名将被写入到站点图中,在我的例子中是“/home/alowe/www/sitemap.xml.gz”,你不需要预先创建这个文件
- default_encoding默认编码(可选):默认值是UTF-8,假如你的系统上的URL和文件路径需要不同的编码方式,则改变这个值。
- verbose具体信息(可选):默认值是“1”,可以设置成0到3之间的任何数。0提供无诊断的输出,3提供重要的输出。
- url or urllist(url或urll列表)(可选):用这两个指令之一告诉站点图产生器那个URL应该包含到站点图中。可以在config文件中通过url指令单个列出每一个URL,或者可以使用urllist指令和指向一单独的包含所有需要的URL文本文件来列出所有的URL。在示例中我使用url指令来列出URL,在下文可以看到。假如你采用irllist指令,那么你需要在单独的文本文件中使用url指令。
- url指令包含有一个必需的参数:href.Href参数,正如你所希望的,是一个全路径,包含有你的域,你想要包括的URL。也可以使用可选的属性:changefreq, lastmod, 和 priority.
- Changefreq (从不、每年、每月、每周、天天、每时或一直)用于指示站点图中URL的内容间隔多久刷新一次。
- Use lastmod (ISO8601 datestamp format) to identify when content last changed.
- 使用lostmod来标记最近一次更新的时间。
- 使用priority来告诉站点图那些与其它站点图内容相关的非凡URL的相对重要性。例如,值0.5表示站点图中URL的重要性质有值为1的URL的一半的重要性。这个优先权值可以影响搜索引擎对站点搜索的次序,但是不要认为将每个URL设置成最大值是最有帮助的。这仅仅是告诉搜索引擎你的站点上所有单个的URL具有相同的重要性。它不是被用来比较你的内容与其它站点内容重要性的。
- directory目录(可选):使用这个标记来具体说明在特定的目录中将要包含的URL列表。这个指令有3个参数:path(路径), url, 和 default_file(默认文件)。当url指令用于提供目录的网络路径时,path路径是目录的全路径名(例如:/home/alowe/www)。使用 default_file指令是告诉站点图产生器你的服务器的默认文件的名字(例如:index.php或 index.html)
- accesslog:使用两个参数:路径和编码,答应站点图产生器为URL解析日志(log)文件
- Filter:使用此指令来包含或派出指定的文件。我将在www.allinvites.com配置文件示例中给出说明。
示例 如上所述,这是我为www.allinvites.com向Google站点图提交的示例配置文件:
|
| 共5页: 上一页 [1] 2 [3] [4] [5] 下一页 |
评论加载中…