存档

文章标签 ‘google’

Google每天要处理多少数据?答案:20PB

2008年1月9日 没有评论

大家知道Google是世界上访问最大的网站之一,但有谁知道它每天处理多少数据呢?
这里可以告诉你一个大致的数据,约20PB(20000TB,1TB=1024GB).的确是非常惊人的一个数字.这些数据每天通过巨大的群集来处理,截至2007年9月,Google的集群数量已经达到11000台.
这些服务器的配置大多采用两颗英特尔至强(HT)处理器和4GB内存,两个160GB的硬盘,并采用以太网连接,每台大约在2400美元左右,以下是详细的统计表格.

 
Number of jobs (1000s) 29 171 2,217
completion time () completion time () 634 874 395
Machine years used 217 2,002 11,081
map input data ()) 3,288 52,254 403,152
map output data ()) 758 6,743 34,774
reduce output data ()) 193 2,970 14,018
machines per job machines per job 157 268 394
Unique implementations
map 395 1,958 4,083
reduce 269 1,208 2,418
分类: 混论分类 标签: ,

主动提交Sitemap,让谷歌、雅虎、百度、MSN统统收录你的博客

2008年1月4日 16 条评论

被动等着各大搜索引擎来收录你的博客绝对不是一个好办法,你需要主动出击,让各大搜索引擎完全收录你的博客。如果你主动提交你的Sitemap等相关信息的话,你的博客能够被更好地搜索到自不必说,搞不好你的Google Rank还会很快地由0升到1哦。
  向Google提交Sitemap:用Google XML Sitemaps插件非常不错这个就不用说了.
  向雅虎提交Sitemap:在“雅虎站长工具”里的“我的网站收藏”里输入你的博客网址,点击“加入搜藏”,然后点击“开始认证”,在页面头部加入雅虎要求你在META里加入的代码,更新。完成之后点击“提交认证”即可。
  雅虎认证通过后点击“Sitemap/RSS”的“管理”,输入sitemap.xml,点击“添加Sitemap/RSS”,雅虎的Sitemap必须是.txt格式的文件,这里我们只能提交RSS了,输入rss/(不要忽略/),提交即可。
  另外你也可以在“这里”提交一下你的博客让雅虎收录。
  向MSN提交Sitemap:点击这里提交你的博客。
  向百度提交你的网站:点击这里提交。
  另外还可以在百度博客里提交你的博客。

最快的最好的方法,那就是获得尽可能多的外部链接。这些链接不一定在链接网站的首页,在其内页就OK。事实上,你的网站刚建成,还没有什么访问量,想找一些好的首页链接也是不太容易的。最好找一些PR值高一点(比如6以上),内容天天更新而且更新较多的网站,这些网站Google会每天漫游并更新其数据库。当Google漫游这些站点时发现了你的URL,就会顺着URL Crawl你的网站。笔者以前曾多次使用这种方法,非常有效,当然现在不用了,直接在一个稍高PR的网站首页做个链接就OK。 

通常使用何种方法2-4天就会被Google和MSN列入。Yahoo稍慢一点,可能需要1-2周,这和其搜索技术有关系。怎么才能在一些PR高,更新快的网站做一些链接呢?其实很简单,很多网站都有论坛或允许评论,做个签名带上自己的网站地址,发几个帖子或评论就行了。但这种URL一定要是活动的,就是点击可以到达你得网站的。根据笔者的经验,Google在发现你的URL之后,当天就会对你的网站漫游,漫游后一到两天,在Google搜索你的网址,就会发现你的网站已被列入了。首次列入的将只是你的首页,这一点Google和MSN一样。 

接下来再谈谈前面提过的获得尽量多的链接的原因。如果你只有一个链接,几天内被Google列入是没问题,但首次只是首页,要等到Google收录更多的页面还需要一定时间,可能1-3周。这是因为Google对一个新站的漫游周期会比较长。如果你有较多的链接在外面,当Google漫游那些网站时,发现你的网址就会再次过来Crawl你的网站,越多Google Crawl的越频繁,这时就会深度漫游你的网站,收录更多的页面。这就会大大缩短Google的收录时间,使Google在较短的时间内收录更多的页面。 

在对一个新的网站进行收录时,笔者的经验是,Google反应最快,收录最快,MSN 次之,Yahoo最慢。Google几天内列入后,如果链接多的话,过不了几天就会再次收录,在加上你的网站天天更新,内容更新平凡,内部URL结构合理,要不了一个月,就会深度漫游,全部收录你的网页。MSN的列入速度和Google差不多,也是很快的。但一般只是收录首页,到再次收录更多页面时,可能需要2周-3周左右。这期间你到MSN查看你得网站的话,会看到总是一个首页在那里。1-2个月后,MSN对你的网站就可完全收录了。Yahoo的反映是最慢,无论收录首页还是深度Crawl都是最慢的,首次需要1-2周,到完全收录可能需要2-3月。 

WordPress Adsense 管理插件:Adsense Manager

2008年1月2日 没有评论

名称:
Adsense Manager

插件页面:
http://www.mutube.com/projects/wordpress/adsense-manager/

描述:
Adsense Manager 是一个用来帮助管理 blog 上 Adsense 广告的 WordPress 插件。

特征:
Adsense Manager 能够改为在插件中提供所有的广告的选项,如颜色,大小,布局等等,并能够在你的 blog 上立竿见影。
默认的设置可以通过点击一个按钮来应用整个站点广告的改变(如颜色模式)。

实现:
一旦你激活该插件,你所需去做的是输入你的 Google Adsense ID 和创建单一的广告模块,完成之后,你可以通过使用 WordPress Widgets(激活的 blog 上面),内嵌的代码到你的文章中(标准编辑框中有个自动插入广告的工具)或者添加 Adsense 函数调用到模板代码中来在你的网站上放置广告。

未来计划:

  • 扩展 Google Adsense 产品支持,包括推荐单元等等
  • 能够支持其他广告系统(如 Yahoo!)


评论:

在开始我的评论之前,我先澄清我没有用过这个插件并且以后可能也决不会用。主要的原因是我喜欢在我的模板文件中尽可能的硬编码一切,这样可以减少使用插件的数量。

但是为了这个系列的文章,我决定测试下这个插件,并通过我的所见写出我的感觉。

首先,这个插件的安装是极其简单并且你能够从管理界面管理你的广告。

当我评论这个插件,第一个给我留下深刻印象的是插件的作者写了非常详细的说明页面。通过它,你能得到关于使用这个插件的所有一切。

你需要首先去设置一个默认的广告模块。这个默认的广告模块用在你没有特别指定一个广告模块的地方。它同样可以作为一种默认设置,一旦你没有为你创建 的广告模块特别指定颜色。我的建议是使用默认的广告模块为你所有的广告模块设置所有的颜色,只有当你需要的时候,为新的模块指定颜色。

在你创建默认模块之后,你可以创建多个广告模块。每个广告模块都可以独立的被调用。

你可以使用多种方法插入 adsense 广告。第一,它完全支持 widget,所以如果你的主题支持 sidebar widgets,你可以在 sidebar 中插入广告。它同样支持 K2 模块,如果你正在运行 K2 或者基于 K2 的主题,你同样可以很容易插入广告。

广告同样可以通过输入简单注释标签在你的文章中插入。如果你有一篇比较长的文章并想在文章中部显示广告,这是建议你采用的方法。

最后一种方法是通过模板标签,你可以调用不同的广告模块,并且将他们插入到模板中。

总之,这是一个非常不错管理你所有广告的插件。到前面位置,他还不支持链接模块,所以你可能需要手工输入代码。另外,如果能够支持 Google 推荐按钮将会是非常不错的。