Google给撑着了?
5月到6月这段时间Google搜索结果的变化引起了相当多的主意。人们发现,它的这次变化和往常例行的变化有很大的不同。对于这些变化,Google官方没有做出任何明确的、正式的解释,只是含糊其辞的敷衍过去。
不过,google-watch在他6月9日的文章Is Google broken?中,对此作了解释。
按照Daniel Brandt的推测,这次变化是由于Y2K原因引起的。大多数Google代码是在1998-2000年之间用C和C++写成的,程序运行在Linux下。在2000年6月,Google声称索引了10亿页面,在2002年11月,他们声称到达30亿页面。那么,按照这个增长速度,如果没有别作过任何改变的话,现在应该是35亿页面(今天的结果是30.8亿页面)。Brandt在Google中搜索了“the”这个最常见的单词,得到的结果是37.6亿(今天,我刚才搜索的结果是34.4亿)。很显然,这里应该没有包括其他语言,比如中文了。很显然,至少从英文被索引的页面快接近40亿。每个页面是有个ID来指认的。这么多数量意味着什么呢?freshbot(Google的“机器人”)快要用完它包里的数字了。
Brandt说,只要到42亿就会出现问题。他推测Google的核心程序用的是ANSI C中的无符号长整型(unsigned long integer),在Linux中,这样的变量占4个字节宽,也就是说,它的范围是0到2的32次方,也就是42亿多。显然,如果真是这样的话,必须在问题发生之前解决它,这就不难理解最近这段时间Google所作的大修了。更为具体的细节,可以在Brandt的这篇文章中看到。
不过这些也都只是猜测而已。尽管如此,却别Google指斥为合谋对付Google的阴谋。Brandt在文章中对这个指斥作了反驳。
真的,我必须重新思考自己对Google的态度。它是一个很好的入口,但如果是唯一入口的话,那就太糟糕了。
Zheng 在 June 14, 2003 11:34 PM 发布
|