各种搜索引擎优化咨询公司建议,要将网站包含在Google新闻中,网址必须符合相当严格且非显而易见的格式,即 他们必须 :
显示三位数字。每篇文章的URL必须包含一个由至少三位数组成的唯一编号。例如,我们无法使用此URL抓取文章:
http://www.google.com/news/article23.html
。但是,我们可以使用以下网址抓取文章:http://www.google.com/news/article234.html
。请记住,如果文章中唯一的数字包含一个类似于一年的孤立的四位数字,例如http://www.google.com/news/article2006.html
,我们将无法抓取它。
但是,Google新闻中列出了许多新闻发布商,并且其中没有唯一的非年份号码(即“卫报”,其使用的格式为http://www.guardian.co.uk/technology/2010/jul/08/article-name
)。
有没有人有任何使用此类网址列出网站的经验,他们是否必须通过Google的其他步骤才能将其列入其中,或者提交的内容是否足够简单?
显然还有其他因素在起作用,对于新网站的开始,遵循Google制定的指南可能会有所帮助。
之所以出现这个问题,是因为我正在与之合作的客户被告知他们需要修改他们的网址以包含这个唯一编号,即使他们已成功列在Google新闻中。
客户是一个完善的印刷出版物,在此之前已经保持了几年的在线存在,我们正在努力重塑并更新他们的网站。
我们在文章页面中包含的其他重要元素是:
/yyyy/MM/article-title-here
)唯一需要做的工作是 将网站提交给Google新闻 - 一旦正确完成,网站就会非常愉快地包含在内。
如果您创建了 新闻站点地图 该规则被放弃。这些其他出版商很可能就是这样做的。