互联网新闻开放协议

开放协议概述

       《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引。
        由于现在百度新闻机器抓取成功率大幅提高,XML文件提交的新闻质量存在各种问题,因此原则上我们不再接受新提交的XML文件,已经收录的XML文件我们会继续收录,请不要主动提交XML文件,我们不再受理相关审核。
        如果您的站点还没有被百度新闻收录,请参考下面的收录标准,符合收录标准的站点请在贴吧提交http://tieba.baidu.com/f?kw=新闻搜索,我们会在7个工作日内完成审核。

                  您可以在百度新闻搜索框内输入“site:网站域名”查看收录来自您网站的新闻信息。

新闻源收录问题

1、百度新闻收录什么样的网站?
    我们收录
  • 正式出版的报刊和杂志、广播、电视台网络版
  • 政府及组织机构的官方网站
  • 拥有高质量的原创资讯内容,在其目标领域内具有一定的用户认知度和一定规模的忠实阅读群的门户、地方信息港、行业资讯网站

  • 我们不收录
  • 博客、论坛、软件下载等非新闻资讯类网站
  • 企业网站
  • 个人网站
  • 没有固定用户群和影响力的网站
2、如何申请收录? 3、怎么查看我的网站是否被收录了?
  • 可以通过执行site语法查看,直接在百度新闻搜索中输入site:您的域名,如site:baidu.com。如果可以查询到结果,那您的网站就已经被百度新闻收录了。
4、为什么我的网站只有部分内容被百度新闻收录?
  • 我们不允诺所有的内容都收录,一方面会倾向收录权威、原创的新闻内容,一方面可能存在少量漏抓情况。
  • 我们明确不收录如下内容:个人信息、博客、论坛、广告、招标、报价、下载、试题、教程、招聘信息、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱。
5、为什么我的网站内容突然不再被百度新闻收录了?
  • 如果您的网站之前是被百度新闻收录的,但突然从百度新闻的搜索结果中消失或停止更新,可能的原因有:
    A.您的网站出现服务器不稳定等情况,会导致暂时抓取失败,如果观察两三天依然有问题,可以通过贴吧反馈给我们,我们会在5个工作日内处理回复。贴吧反馈地址:http://tieba.baidu.com/f?kw=新闻搜索
    B. 您的网站进行了改版、域名更改,没有及时被检测到,您可以如上反馈。
    C. 您的网站新闻质量出现问题,或者被举报,我们保留处理的权利。
6、为什么我的原创新闻没有展现,但是其他转载站点的新闻展现出来了?
  • 首先,您可以先定位一下原因:在百度新闻搜索框中直接输入新闻url,如果查询无结果,说明您的新闻没有被收录;如果查询有结果,说明您的新闻没有被正确展现。
  • 上述两种具体情况都可以通过贴吧反馈帮助我们改进算法,但不允诺可以立刻解决,贴吧反馈地址:http://tieba.baidu.com/f?kw=新闻搜索
返回页首
©2010 Baidu