百度站长门诊开放日Lee问答整理-首页百度快照更新与排名没有关系
转载于站长网:8月10日百度站长门诊开放日Lee问答整理
问题1:我希望今天lee能对站长的问题,都尽量精准,能用数字说明的就说数字,如果一直说质量什么的、对用户体验什么的,这各人理解起来差距很大的,比如什么叫对用户有帮助,哈哈,站长不需要你对所有都说出标准,但是至少这些站长们提的问题,您能确定化得数字就数字说明,谢谢了!
Lee:首先,公布数字是不可能的,任何一个搜索引擎都不会这么干,我们需要保证判断算法的寿命。
问题2:一个网站内有部分页面的title等设置一样,那么会不会影响到这些页面的相关关键词排名,还是从中选择一个权重高的合适的页面出来参与排名竞争?
Lee:这种问题请参考《百度搜索引擎优化指南》,其中已经有非常明确的说明,多个网页title一样,意味着这部分网页搜索引擎判断其中心内容非常困难,也就不容易准确的给其一个合理的权值。
问题3:请问:百度对于网站分隔符、网站结构是否有自己的标准?目前医疗网站内容同质化严重,请问百度是如何来判定网站权重和自然排名的?
Lee:网站的结构在保证用户体验的前提下,适当的做一些对spider的优化会有助于收录,我们推荐扁平的树型结构。
《百度搜索引擎优化指南》中有详细的说明。
关于同质内容,先透露一下,我们正在设计一套较完善的原创识别算法,不久之后也会邀请站长朋友给我们一些建议及抄袭的实例用做算法调整之用。
问题4:此外网站一个网页多大合适,有的页面大小过200k,我一般都注意在110k以内,这个有数字标准吗?
Lee:网页大小建议以用户能接受的程度为准,对百度来讲,我们能接受的网页大小肯定已经超出普通网页平均大小的数十倍,完全不用担心。
问题5:百度对于一篇原创文章的判断到底是怎样的标准?比如一篇原创文章可能最先是一个新站或权重较低的站发布的,但是已经被百度收录后,发表到其他高权重门户网站、论坛,这些网站可能会给文章来源站一个来源网址,可能是锚文本链接,也可能是纯网址;但过了很久,百度都无法识别文章的真正来源,总会将文章来源给那些高权重站。试问,这样对用户的体验好吗?虽然之前有人问过类似问题,百度官方也有回答,但很模糊,想具体了解下,百度到底如何界定原创文章?
Lee:近期我们会就原创识别问题和大家做专门的交流,为了保证算法的寿命周期,我们不会公布算法的细节,但大家的意见和碰到的具体问题,都考虑到算法中。
问题6:现在点击器泛滥,导致很多内容很不好的网站排名很好,认真做内容的网站反而不能排在前面,希望这个百度能重视,用户体验才是第一位的
Lee:如果大家遇到此类问题,请到投诉反馈,我们有专门的同学轮流分析并安排到合适的项目中去解决,我也是其中之一。
问题7:百度对于链接买卖、站群和克隆站的打击策略是怎样的?
Lee:超链应该是用户真心实意对网站的投票,买卖链接有违超链的本意,我们反对链接买卖。很快我们将就此类问题做一个专门的说明,同时也会说明我们对买卖链接的处理原则。
问题8:如果站长们不投诉,被误伤的网站会一直被惩罚吗?有没有恢复的期限,是半年,还是一年?或者更长?
Lee:我们的策略都会定期的review/改进,不同的策略有不同的周期,天级到月级不等,我们会持续的改进策略,以减少误伤。
问题9:针对一些大站 比如B2B 分类信息站 其大部分每天更新的都是产品详细页 因为客户都比较懒,发布的信息都非常简单 没有几个字 导致大部分页面看起来相似度都很好(因为产品内容详细页都是一个模板) 请问百度是怎么来评定这个站 并对其的收录情况及评价情况有何标准?
Lee:搜索引擎对网页价值的判断,不是从字数出发的,而是从其资源质量出发的
只要是对用户有价值的内容,不论长短,我们都会给一个合理的评价如果这个网站上提供的内容或者服务非常有价值,无可替代,那对搜索引擎来讲,就是一个高质量的网站。
问题10:现在凭借发布时间来判断两篇相同文章哪篇是原创还无法实现,这一点百度说明过,但是现在的情况是很多新站,权重低的网站站长自己辛辛苦苦一点点码字写出来的原创文章,被高权重网站转载,虽然注明了出处,但是对于百度来说,如果仅仅因为转载网站权重高就判断为原创文章,那就意味着低权重网站被误判为抄袭或转载,这样显然很不公平,请问对于判断文章原创问题,百度搜索团队是否有解决方案,或者直接回答我们“百度是否能判断出哪篇文章才是原创的”。
Lee:刚刚已经说过了,我们正在计划在原创方面做一些改进。原创识别是一个很有技术含量的话题,不是简单的几种规则就能做好的,互联网很复杂,人心更复杂,不过我们有信心逐步的去解决这个问题,其中也需要站长朋友多提供相关的问题和建议。
问题11:关于描述的抓取怎么抓取的,看到一个网站的描述,不是meta name="description" 里面的内容而是企业简介里面的内容。感觉不是乱抓取,跪求大大回答
Lee:我们的《百度搜索引擎优化指南》算是白写了。。。其中有很详细的说明,建议你认真看一遍第22、23页。
问题12:百度什么时候能发放,外链查询工具,还有网站权重对百度是否有用的工具。
Lee:外链查询工具请密切关注站长平台,也许会有惊喜。
问题13:我的网站运营方式有点像中国知网文章内容没有显示完整的会员必须登陆并要通过上传原创文章交换的方式获得积分才可以下载全文这样会不会意味着用户体验不好百度予以降权?
Lee:知网就已经是此类网站最佳的例子了,既然他在搜索引擎中表现很好,那还担心什么。。。
问题14:自从大K站之后,许多的网站百度快照一直停留不动,不知道这是什么原因。是算法在调整,还是我们应该在网站自身找原因。
Lee:关于快照的更新时间,尤其是首页的更新时间,我一直建议不要参考,这个时间跟网站的价值没有任何的关系,近期我们也会出一个专门的说明。
问题15:您好,专家,我想请教一下。为什么带3w的网站最近老是不稳定,有时候被收录,有时候又找不到了。而,排名全部是集中在带3w的上的,一没有,排名都消失了。请问是什么原因,要如何解决?
Lee:看不到实例的话,谁也说不准到底是什么原因
建议你到百度投诉 给一下具体的实例
应该是一种异常现象
问题16:我们有一个专题专栏,里面大都是一些静态页面,但是百度一直不予收录,不知道是什么原因,其他的都收录了,就下面这个列表页
中国文物网-深度列表
Lee:根据你提供的query,我找出这个栏目随便看了几个网页,都收录了
贵站犯了一个非常常见的错误,同一个网页,有两种以上的url形式,我们收录的,是不带index.aspx的那种。建议参考《百度搜索引擎优化指南》中关于url规范的部分。
问题17:很想知道,在百度眼里什么样的站是高质量的站,每一个站都是从没用户到有用户,一点点积累起来的。
看完7.19~7.31站长投诉反馈公告,只觉得有种想打人的冲动,不知道是不是普通站长太微小了,百度看不上,还是希望站长们一起放弃百度。
看见大把的垃圾站活着,自己辛辛苦苦做的站却没了,知道世界不公平,那也不能没有游戏规则了吧,你们百度说别人的站是低质量,举例也说了,那我们不是这样的站为什么也被K了呢?你们可以把你们认为的低质量都一样举例说明出来吗?
Lee:关于这个问题,请大家换位思考一下,作用一个搜索引擎,所追求的最终目标是为用户提供最有价值的信息,我们希望大家有一个最低限度的判断,那就是将自己作为一个普通的用户,通过搜索引擎搜索到自己的网站时,自己相不相信自己网站上的信息,自己觉不觉得这是互联网上最好的信息。
我们通过反馈渠道收集到声称自己网站是原创、高质量网站的反馈,其中80%多都是无效的,甚至大量声称老中医3-5天治愈绝症的网站,通篇内容读不通,声称自己是高质量的网站。
如果互联网非常纯洁,那我们也不会花费大量人力去识别网站的质量,也就不会有误伤。
但互联网越来越不保险,我们的策略也越来越复杂,只要对技术有一定了解的人,都应该知道误伤是无法避免的,我们也尽最大的努力将误伤降到最低限度。
我不知道你的网站是不是真的非常高质量,如果确认,可以通过上面几帖提到的反馈途径反馈给我们来追查一下。
问题18:虽然百度的官方不承认有降权蜘蛛的说法,但是例如:123.125.*段的蜘蛛出现,网站在排名、收录上快照、都会存在异常,是否可以理解为这段IP的蜘蛛虽然不是降权蜘蛛,但可以认为是自身网站出现了问题,百度对于网站的考察和警示呢?是百度对网站所提出的警告呢?
Lee:Baiduspider只有一种,不存在什么降权蜘蛛。不过你所提到的对网站的警示,我们会在站长平台中考虑。
问题19:我有一个商城类网站,因为会经常产生大量下架商品,产生下架商品后,程序会返回一个只有模板的空页面,没有任何具体商品信息。以前我把这些下架商品所在的页面设置为404,在日志里看到大量的404状态码,请问这样会不会影响我网站的质量,长期下去造成收录和排名下降?
Lee:我们鼓励站长为死链返回规范的404代码,不欢迎给死链返回200代码。
只要是正确的返回404,对网站没有任何影响,还可以减少baiduspider抓取给服务器造成的负担。如果死链数量较多,建议通过站长平台提交死链列表,更高效一些。
问题20:<meta name="keywords" content="百度" /> 内容是否还会参与排名?
Lee:meta keywords早就进历史的垃圾堆了,我们会直接忽略。
问题21:LEE,问个技术问题。link标签 rel=canonical 属性百度支持吗? 这个问题很关键。我们有大量同质的内容。我们想把同质内容标准化。
Lee:canonical 目前不支持,不过已计划要支持了。
更多网站优化内容请访问:http://www.siweb.cn/seoblog/
百度关键词排名优化:http://siweb.cn/seo/baidu-seo.html