看看主要微博的robots.txt

twitter

#Google Search Engine Robot
User-agent: Googlebot
# Crawl-delay: 10 -- Googlebot ignores crawl-delay ftl
Allow: /*?*_escaped_fragment_
Disallow: /*?
Disallow: /*/with_friends#Yahoo! Search Engine Robot
User-Agent: Slurp
Crawl-delay: 1
Disallow: /*?
Disallow: /*/with_friends

#Microsoft Search Engine Robot
User-Agent: msnbot
Disallow: /*?
Disallow: /*/with_friends

# Every bot that might possibly read and respect this file.
User-agent: *
Disallow: /*?
Disallow: /*/with_friends
Disallow: /oauth
Disallow: /1/oauth

weibo.com

User-agent: *
Allow: /

t.qq.com

User-agent: *
Disallow: /k/
Disallow: /search/
Disallow: /invite/
Disallow: /asyn/
Disallow: /req/
Disallow: /labs/

Sitemap: http://t.qq.com/vip_index_sitemap.xml
Sitemap: http://t.qq.com/vip_messages_sitemap.xml

t.sohu.com

User-agent: Baiduspider
Disallow:

User-agent: Sogou
Allow: /

User-agent: *
Disallow: /

t.163.com
这个没有,直接转到首页

Advertisements

SourceForge被攻击了

SourceForge上有个项目。前天听人说FTP登不上了,今天自己试,确实。开始以为是城,试了V,不管用。然后想起来看邮箱,果然有信,SourceForge发的,说被攻击了。一些服务暂时被关闭。
这是一个丧心病狂的时代。
SourceForge官方博客原文:Sourceforge.net attack

“果然灵”这个名字是怎么来的?

2010年十月一日,果然灵站长想弄个域名,希望找个短点的,又不想多花钱。
国别域名后缀只有两位,而且可能还剩一些比较好的短域名,但是经常被删。
果然灵的站长不想去弄世界各地的假身份,所以只考虑三位通用后缀的域名。
到了这个年头,三位以下纯字母或纯数字的.com.net.org域名早都被抢完了。
能够直接平价注册的通用域名最短的就是三位字母数字混合的“三杂”域名。
为了好记,域名的字串最好有点意义,或者有某些特征,比如重复或者对称。
所以果然灵站长列出了各种三位的自己认为有趣易记的组合,然后挨个查询。
最后发现”gr0.org”还没被注册过。(有人抢了”gr0.com”,但是把.org忘了)
这个域名比较有趣,除了把字母“o”换成数字“0”以外,基本是轴对称的。
当时果然灵站长搜索到的其他几个可用域名都不如这个顺眼,所以就用它了。
拿下域名以后,是起中文名字。中文站当然以拼音的组合为准,大家容易记。
列出了“gr”开头的各种汉语拼音组合,其中“果然”这个词听着还算顺耳。
数字0就按谐音对应到“灵”字。“果然灵”就是拼音缩写和谐音凑出来的。

果然灵-gr0.org

果然灵网站: gr0.org
研究软件、学习和赚钱
建了一个开源项目,具体做什么仍在研究中
果然灵原创图书正在制作中…
更多内容请看 gr0.org