Cat in Chinese: 2007.10

2007年10月30日星期二

固定订户与临时订户

从我对FeedBurner订户信息的跟踪看来，我觉得订户可以分为两类，一类是固定订户，一类是临时订户。

使用web reader订阅的，或者使用专用的client reader订阅的，属于固定订户，这些订户数量通常很少减少。另外email订阅的也能算这一类。原因是，用户一旦订阅了，就没什么理由去退订，除非你信息爆炸，flooding到用户受不了了，用户就会退订。反而你发布的频率不高倒的话，用户不一定能察觉到，他们可能已经忘记自己订阅此feed了。总而言之，固定订户的数量是几乎不会减少的，你只要能吸引用户成为固定订户，那么那个数字就是solid的，那就是你的一项real estate（不动产）。

至于另一类用户，则正好相反，它们使用浏览器自带订阅功能，或者是Outlook 2007等非专用client reader。这些订阅量绝对不是solid的，随着用户改变他们的软件使用习惯，订阅也就自然而然的被“取消”了。然而因为这些用户在一段时期内还算是活跃的，因此FeedBurner还是会把他们算上，但你在真正估计自己的feed价值时，应该把这层表面的泡沫给去掉。

最后，因为我的feed订阅数不算大，希望有相当订阅数的作者出来讲讲事实是否如此，例如aw或者猫影。

在 C# 中 ("x" == "X") 何时成立？

这个问题初看起来很奇怪，C#就是C#啊，一门严谨的语言，并且字符串是区分大小写的，无论是在什么情况下都有("x" != "X")，这才叫做一致性嘛。事实上，这在以前一直都是成立的，直到.NET Framework 3.5引入了Linq to Sql，这种一致性就被破坏掉了，变成依赖于环境配置了。

想象一下我们对一个Linq to Sql的DataObject编写一个Linq查询，并且where子句包括("x" == "X")，那么该子句会返回true还是false呢？事实上，该查询虽然是一个用C#编写的lamda表达式，然而并不编译为MSIL。Linq to Sql里面的Linq是直接编译为SQL语句的，因此("x" == "X")会直接变成SQL里面的("x" = "X")。那么这就为true了？也不对，因为大小写是否敏感是基于数据库配置的，在当前的应用程序连接上特定的数据库之前，这个问题的答案都是不确定的。

那么我们可否选择使用String.Compare()来强制设置是否大小写敏感？这在Linq to Object中没问题，在Linq to Sql中就不行了，因为String.Compare()无法编译为SQL语句。因此，在Linq to Sql中，大小写是否敏感是一个依赖于环境配置的，这就提高了编码过程中由于疏忽而造成问题的概率。

为什么这样说呢？在以前，我们的C#代码和SQL代码是分开书写的，写C#的时候就很明确大小写敏感，写SQL的时候就很明确是数据库相关的。然而现在部分的SQL逻辑改为用C#来编写了，问题就出现了，特别是当你的代码中还混杂有Linq to Object的查询时，编写代码与阅读代码的过程中你一看到Linq就先要去想这段lamda表达式最终会被编译为哪种语言，MSIL还是SQL。如果你不进行这个区分，或者开小差把Linq to Sql的代码当作Linq to Object了，这就可能导致你编写了错误的代码，或者阅读上造成了错误的理解。

总体而言，虽然Linq to Sql为开发（特别是RAD）带来了巨大的便捷性，然而这种C#与SQL混合编写并且都使用C#语法的功能将会是一种先天的不足，它所带来的代码维护成本可能随着项目体积逐步增大而慢慢体现出来。至于将SQL混入C#所造成的分层模糊现象，我将在以后的文章中讨论，敬请关注：

Cat in Chinese (feed)
Cat in dotNET (feed)

Recruiting Events: Tencent (Part 1)

所有Recruiting Events系列文章由Cat Chen记录并发表于http://Chinese.CatChen.biz，目的不是公布招聘有关的题目或技巧，仅用于个人知识归纳以及经验总结，如需转载请保留出处。

我去参加了Tencent的技术笔试，发现无论你报什么技术职位，最后都考一样的内容，可能先根据基础能力筛选一下吧。因为题目受NDA保护，那就不说细节了，只能说学习好操作系统（特别是UNIX）、计算机网络、数据库、算法与数据结构这几门课程是非常有必要的。你需要对课本里那些死记硬背的知识有所掌握，例如各种排序算法的实质。我通常就只记得几种常用的排序算法，那些哪方面都没有明显优势的排序算法就忘记了，事实表明这些东西最好定期复习一下。另外你还必须对课程内容的实际应用有所了解，例如SSH是OSI模型中第几层的加密，UNIX中的pipe如何创建，等等。

Tencent的笔试中那些程序填空题，原来的程序显然不是高质量的、通过编译的代码，感觉就是手写一段代码然后去掉几句让你填空。首先是有陷阱，例如：
for (#expression; #expression; #expression);
if (#expression) #blank
else #blank;
看到这样的缩进，不要以为if...else...语句在循环之内，因为for后面已经有分号了，这样缩进写法分明是为了给你视觉错觉的。另外还有一题算法主函数没有return的，然而main()就调用该函数并打印返回值，这显然是代码没经实际测试就投入试题了。

反正考这样的题目，我的命中率又不行了。其实我很怀疑这些企业到底招什么人，是不是招一个Web的前端或后端开发人员，平时写写JavaScript或者PHP什么的，紧急时候要求你能够马上抽调去写C++或者做UNIX维护。

2007年10月28日星期日

S.T.A.L.K.E.R

最近沉迷于《S.T.A.L.K.E.R - 切尔诺贝利的阴影》这个游戏，名字上那几个字母是Scavengers, Trespassers, Adventurers, Loners, Killers, Explorers and Robbers的缩写。从游戏类型上来划分的话，这是个FPS，不过因为和NPC的可交互性很强，也可以当一个RPG（反正Fallout3也换成第一人称视觉了），至于其背景设定也有点点恐怖游戏的成份。

其实我以前对恐怖游戏没什么兴趣的，因为玩起来不爽，整体而言是游戏玩你的心理感觉，而不是你玩它。开修改器当然可以爽一会儿，但如果那是个单纯的恐怖游戏的话，这样子玩一会儿又很没意思了。不过我现在对非纯粹的恐怖游戏有些感觉了，其实就是让你在一定的心理压力下完成同样的竞争性任务，本质还是和游戏安排好的规则竞争。例如Manhunt吧，它刚刚发布的时候我觉得这么压抑一个游戏没什么好玩，不就是杀人嘛，还不能群殴，要想办法一个一个引诱出来杀，这实在太无聊了。不过自从浪费了不少时间在Hitman2与Hitman4中尝试各种古怪组合玩法后，我也开始向hardcore级玩家靠拢了，开始追求那些“有难度”的玩法。

这其实很符合The Game里面所说的，人类这种奇怪的动物，只要给他们一个有等级划分的游戏，并且告诉他们你花越多的时间在上面，你就能进入越高的等级，他们就会花时间在上面争取高等级。有很多玩家都是从悠闲型开始的，但一旦他们中了这个法则，就开始慢慢转入hardcore玩家的行列了。

另外值得一提的是S.T.A.L.K.E.R那个名为A-Life的全局AI系统。根据官方的介绍，由于A-Life的存在，游戏不会再像以前那些基于脚本的RPG那样，仅当玩家做了某事才会触发某个变化，而更像是Simcity那样即使你什么也不做后台的AI模拟过程仍然会继续发生，这包括军团之间的互相攻击以及地区的重新划分，还有异种的成批迁移，或者是袭击军团。游戏里面有1000个个性各异的NPC，由于整个大背景是在AI控制下模拟的，因此你碰到这些NPC的过程会是相对随机的。然而我还没第一次完成游戏然后开始第二次，因此我并不确认这个随机性以及模拟真实度有多大，不过从平时的游戏过程中看来，确实NPC门都是好像真有自己的目的而行动的，并非就永远存在于游戏中的特定位置等待你的到来并交给你一个任务。

这种全局的开放性交互从来都是游戏设计师的梦想，没有人喜欢在一个脚本制订好的游戏里玩两次，因此一部分设计师希望通过MMORPG达成梦想，而另外一部分继续在单机游戏的AI上钻研。MMORPG是完全开放的，但可控程度也不高，游戏规则只能先影响玩家群体，再间接影响到对单个玩家的直接游戏体验，而单机游戏的AI是可以直接控制的，游戏体验是可以通过调整AI而直接调整的。将来到底哪一个能够带来更好的游戏体验，暂时还很难说，不过至少我还是倾向于选择单机游戏。

2007年10月27日星期六

副业

什么是副业？在这里我们探讨两种副业。

第一种，也就是现在所谓的Web前端开发，也就是编写符合语义的XHTML，加上具备浏览器兼容性的CSS，然后还有负责AJAX通讯以及DOM操作的JavaScript。在以前是没有前端开发这个说法的，因为这就是副业活，负责前端开发的，其主业通常是服务器端开发，又或者是图像设计，然后就兼职写写上述三种代码。正因如此，前端开发相关的这三种技术一直发展缓慢，因为人人都当它是副业，没必要也没时间去深究。例如JavaScript，其实它很早就支持我们现在所使用的Prototype中的各种功能，为什么当初就没有人去开发Prototype呢？首要问题就是没人觉得有必要去挖掘这些技术，就算有少数人挖掘到那个深度了，共享出来的知识其他人也不会去吸收——谁会了为副业而研读一大堆相关资料呢？因此，直到最近AJAX的热门，才导致了更多的人把前端开发当作主业来看待，也才突然有了那么多相关的技术讨论与书籍出版。

第二种，是中国学生所谓的研究与探索能力。有人说，中国学生的动手能力并不比美国学生差，其实这估计是基于双方都尽自己能力去做的前提下得到的机轮。不比别人差，并不代表着有同等的动机以及动力去做。就如前面说JavaScript是副业的例子，中国学生的真正缺失在于把动手研究与探索当作副业，是在应付考试这一主业得以游刃自如应付后才考虑的事情，同时并不会投入大量的精力关注有关的信息以及细节。

深入的就不探讨了，不过仅仅做一个小提示——你是否有留意到你生活中的某一样副业其实是极具潜力的，如果你不是很讨厌做那件事情的话，不妨考虑一下更换工作主题的时候将它提升上来作为主业，或许因为竞争对手少反而更容易成功。

2007年10月21日星期日

China MVP Open Day

在两日三天的海南三亚MVP峰会之后，终于回到了广州。MVP峰会的最大好处就是能见到来自各地的MVP，并且是面对面地交流，这真的比隔着一个Windows Live Messenger要好很多。另外三亚虽然不算是个一流享受的地方，不过看起来也还算很美。

我和另外两位广东的MVP，也就是彭斌和黎波，都是在18号飞往三亚的，因为飞机1135起飞，所以我们约定了到了三亚进酒店之后再吃午餐。到了酒店之后，发现原来北京的MVP也到了，并且已经在餐厅吃饭了，就加入他们了。吃晚饭休息了一会儿，我们就到游泳池泡水兼聊天，我基本上就是跟着彭斌周围去认识别的MVP，不知不觉就在水里泡了n个钟。

晚餐前我跟着彭斌去找葛涵涛，发觉他们房间里的Windows Mobile设备还真多啊。之后俞晖也来了，拿着一个iPhone，我终于有机会亲眼看看iPhone那个屏幕了，并且体验了一下操作起来的手感，更加下决心要买个iPod touch。晚餐还是跟着北京的MVP，这次是去酒店外面的大排档吃海鲜，发现北京的MVP真是团结，总是一起行动。晚餐的海鲜感觉一般般啦，反正我不觉得哪一样做得特别鲜味的。晚餐过程中比较享受的是黎波的歌声，当然还包括现场高涨的fans情绪，哈哈。另外俞晖的iPhone在葛涵涛带领的Windows Mobile MVP群体攻击下，成为了“不具备企业应用能力”的反面例子。

晚餐回来后，还是泡水，哈哈……然后是跟彭斌、俞晖一起聊天，说到了博客园的发展，然后又说到了博客园最近上线的digg功能，另外还有一些各地.NET俱乐部发展的事情。我觉得这样的面对面聊天比在网上打字要轻松多了，虽然在线也可以音频会议，但要比划什么还是不如面对面的方便。我们聊天聊到一点多才睡，第二天要起来参加颁奖啊，睡眠不足啊……

19号早上是集体会议，包括Karen-Anne Young（APAC与EMEA地区Group Manager）的keynote，以及随后一些受NDA保护的内容，那些就不方便说了。在keynote之后，Karen亲自为我们每一位参加峰会的MVP颁奖，并且合影留念。19号下午是分组会议，Dev、IW和IT分开，我当然是去听Dev那场啦，内容包括Silverlight、Linq以及Windows Embedded。

晚餐是在游泳池边举行的自助餐，算是个小party吧，其中包括Karen的dancing哦！然后是问答环节，考察大家对微软与会员工的熟悉程度。接下来各位员工还各自出来自我介绍了一下，顺便还介绍了一下他们当前负责的社区项目。晚餐之后还是聊天时间，这次我和彭斌找到了陈荣、陈黎夫，变成了ASP.NET MVP小聚了，可惜就缺了赵劼。回到房间后，已经十一点多了，王兴明过来吹水，又吹到了一点半。在这种聚会上面，你是不会愿意浪费时间在睡觉上的，因为有那么多有技术又能说的人在你身边，你总是想不停的找人聊天。

20号早上是沙滩活动，首先80多人一起在海滩上排一个MVP字样，让摄影师帮我们拍照，然后是小组比赛。之后有人踢足球，有人打排球，我就跟着彭斌去拣贝壳。拣贝壳这事情还挺考耐心与敏捷的，海水一冲上来你就要盯住有没有值得你捡的东西，有的话就要马上按住，否则水一退就又冲走了。顺着沙滩走过去，发现有不少外国人，哎……这里看来成美元区了，人家都在这里花美元，物价那么高，花人民币就感觉心痛。

下午我们一群MVP自发组织去吴支洲岛，逛了一个圈回来，其实也没什么特别的吧，就是不停的拍照拍照。这个自发组织啊，当然就不如微软出钱会务公司安排好那么体贴，有时候安排挺混乱的，有些人想这样又有些人想那样，团队管理问题啊……大多数MVP在工作中还真烦这个问题呢。从岛上回来后，我们直接进市区，吃了一顿麦当劳，买了一点特产，就打的去机场的。领票之后，我还傻傻的问11号门在哪里进，对方告诉我先进安检，我才想起这不是白云机场，不管你进几号门，都是一个安检通道。原本2115的飞机，延迟到2235，结果回到家已经凌晨了。

整次旅行的照片我会陆续挑选一些好看的发到facebook上面去，有兴趣的可以去看看哦。大家如果觉得有话题在三亚没讨论完的，可以在Messenger上继续讨论。

2007年10月15日星期一

Recruiting Events: Xunlei (Part 2)

前端工程师在广州的笔试复试只剩下4个人，我不明白为什么4个人都还要再笔试，如果前端技术的基础算是考察了，那么应该可以面试考一下设计思路以及综合能力，难道还要再笔试一次考更深入的技术吗？如果是那样的话，我觉得没有谁能做出来，因为即使第一次笔试那5道题，我问了猫影和aw，他们也无法在不查询外部资料的情况下做出来（不过aw应该对JavaScript和ActionScript互调用那题很有体会，所以那题的答案应该找他讨论）。

发卷的时候，考官对我们这4个人说了一句“今天考一考基础”，然后看到试卷类别上写着C++，我就不知道说什么好了。C++我会读也会写，只不过基于我个人对C++语言本质的不太喜欢，所以也就不会think in C++，因此写出来的代码显然很不像C++ native speaker，并且会带上其他各种语言的一些accent。看看试卷，50道单选，20道填空，1道编程，有人要考基础我就跟他拼基础吧，只能这样了。

开头有几道选择题挺开放的，当也可能是纯粹考你最基础的基础。例如问题是以下哪个你看起来更顺眼，有一组答案中有两个分别是：
#define your_name "xunlei"
#define YOURNAME "xunlei"
这算是考什么呢？生硬的考他认为正确的命名规则呢，还是仅仅想了解你个人的编码风格呢？后面开始有一些题目考你对C++各种不一定人人用得着的功能，例如以下两个是否有性能差别：
#include<iostream>
#include "iostream.h"
这个……简直就犹如当年算法竞赛能够在初赛考你Pascal里面哪一个编译控制指令能改变堆栈大小一样，结果就是只有两类人能够做得出来：超级熟练的使用者，或者死记硬背的应试者。

填空题的话，也是有点像竞赛的笔试题，例如叫你看程序写运行结果，又或者补充程序代码中的空缺。ACM都直接上机考啦，C++还以这样的形式考察，不要说招前端工程师，就算真的是招C++开发人员，考察结果与实际能力只见也会有较大的误差吧。

最后的编程题，要求写一个字定义的strcpy函数，签名如下：
int strcpy(char* dest, char* source, int count)
其中count控制最大的复制字节数，返回值为实际复制了的字节数。题目不算难，就照我自己的思路写咯。后来Jeffrey Zhao才告诉我，这不正是strncpy吗？可惜strncpy的返回值不同，所以还是不能直接调用。

我还是100分钟左右就做晚了，然后又花了20分钟慢慢检查了一遍，修改了一些选项，其实改来改去都是不确认哪个是对的。之后等了一个晚上都没有面试通知，就知道出事了……

回过头来分析一下，到底什么人比较容易通过这样的两轮笔试呢？要熟记正则表达式，知道document.cookie存储格式，知道C++编译器的控制选项，这些都要求是超级熟练的使用者，或者死记硬背的应试者。我想没有任何企业想要后者，那么只能说迅雷想招前者，看重的是你是否是一个熟练的IT民工（来自于猫影词汇），是否上任后能马上投入工作。但如果这真的就是迅雷的招聘风格的话，我只能说和它招聘网站上宣传的相差太远的。网站上的宣传，让它看起来好像一家小百度那样，拥有大企业应该有福利，至少达到百度那个级别（当然宣传往往是比真是要夸张一些的，我说的百度级别是真实级别），同时又作为新兴企业拥有无限前景——这主要是指股票那事儿。然而事实上，可能它仅仅是有一家很中国式的小企业，就是作为整个大的世界工厂里的一个小工厂，依赖自身的光环招一些有理想的工人进去，然后……谁知道将来发生什么事情呢，这可是说不定的。

2007年10月13日星期六

Recruiting Events: Xunlei (Part 1)

第一次参加企业招聘笔试，竟然是迅雷……嗯……其实也没什么好“竟然”的，应该“竟然”的是“第一次”，完全没经验的情况下就跑去一所“陌生”的学校和一群陌生的人考试，而且课室里大部分人还不是和我考一样的题目。

我仅仅应聘一个职位，就是前端开发工程师，因此找到对应的课室就坐下来。之前幸运的碰到一位同班同学，他说简历投了三个职位，分别有短信通知他到三个不同的课室笔试，不知道他后来怎么办了。前端开发工程师的题目就5道大题，统一的答题纸上钩选应聘职位的竟然没有“前端开发”一栏，faint死了……

第1题考正则表达式，一个小题要求匹配字符串中首尾的空格，另一个小题要求匹配仅包含数字、字母、下划线的6到20位的字符串。我不熟悉正则表达式，所有东西都仅仅有个概念但记不住，想了很久也没写什么，最后决定凭直接写。第一题想不到空格是斜杠什么，空白字符好像是blank吧，于是写了个(\b)*.*?(\b)*上去，其实空白字符是space，应该是(\s)*.*?(\s)*，汗……中间那个.*?是非贪婪匹配，否则把末尾的空白自己也吃掉了，我只记得非贪来匹配好像是*后面加一个?，然后就写上去了。第二题我同样不知道[A-Za-z0-9_]其实就是\w，于是就写了[A-Za-z0-9_]{6,20}。

第2题要求写一个String类的扩展函数，要求按老ASCII码单字节/汉字双字节模式，计算一个字符串的字节长度。这个……我又载晕掉了，JavaScript中的String能够好像传统语言的char[]那样使用索引号获取单个字符，但是JavaScript没有带表单个字符的数据类型，获取到的还是字符串，两个字符串之间能够用大于号小于号比较的吗？在JavaScript中我还真的没这样用过呢，不过某些高级语言支持字符串的大小比较，结果相当于按字典排序后两个字符串的顺序比较，估计JavaScript也支持，所以我就按照那样子写了。答案如下：
String.prototype.byteLenght = function() {
var count = 0;
for (var i = 0; i < this.length; i++) {
    if (this[i] <= "\u00ff") { /*"\u00ff"是单字节ASCII码中最大的一个*/
      count = count + 1;
    } else {
      count = count + 2;
    }
}
return count;
}
在做完整份题目后，我又无无聊聊在代码后再加了一段注释，大意是：在JavaScript中实现这样的计算完全没有实际用途。首先，因为JavaScript是完全基于unicode的，按ASCII方式计算字节长度没有意义。其次，如果这时用于计算屏幕显示宽度的，其实也不准确，在非等宽字体中"w"和"i"的宽度差了几倍，显示宽度不能用这样的方法计算。

第3题是要求列举所知道的JavaScript与Flash中的ActionScript互调用方法，还要求提供代码说明。我仅仅在过去有过一点点了解，就是Flash的ActiveX对象对外暴露两个方法，分别用于传入和传出一个字符串，而这两个方法对应调用内部的ActionScript函数，因此ActionScript的处理应该写在这两个函数之中。当时就这样写上去了，并且说明我不记得具体的函数名称，给我查资料或者上网Google的话就会知道。我不知道阅卷那个人看到我每题都一堆回答以外的评论会怎么想，哈哈……后来查了一下，我印象中的那个函数其实是远古的fscommand，而Adobe现在建议大家使用ExternalInterface。

第4题要求列举cookie，并且包括过期时间。同样是不懂，记忆中只有document.cookie一样东西，从来没调用过，仅仅阅读过一次别人的调用代码，按照什么格式把相关属性保存在String我也不清楚，就知道第一个是键值对，至于过期日期……真的不知道了。既然连按照什么格式读取都不知道，所以这题我干脆就什么都没写，本来想着不会编写代码也能写写我所知道的，后来决定跳过。其实知道格式就很简单了，格式可以参考quirksmode上讲述cookie的文章。

第5题是开放式的，要说自己擅长的前端开发方向。我用了一版纸回答前面的3个问题，又用了一版纸完成了第5题的吹水，哈哈……说了擅长XHTML + CSS + JavaScript，讲了一下过往项目，最后不忘插上一句“更多项目信息请浏览CatChen.biz”。

两个小时的笔试时间，我一百分钟做完，没有一道题是完全懂并且有把握的，因为我是习惯有什么不懂就去搜索的人，从来不背，而考到的点都是我平常很少用的。考完半天后就收到笔试复试通知了，接着第二天去复试。

2007年10月10日星期三

不要动态修改 DOM 里面的 id 属性

我不知道是否有什么标准规定不允许修改id属性，或者不建议修改id属性，总之IE对此支持不佳。在IE当中，修改id属性对将来的DOM操作没什么不符合标准的影响，你仍然可以通过document.getElementById()找到该元素，然后在CSS支持上就有问题了，id修改后并不会自动去重新匹配CSS规则，因此id修改后不会体现出应有的样式。

因此，进行DOM编程时应该避免修改id属性，如果需要动态改变匹配的CSS规则，就改变class属性吧。我碰到这个问题时也就是尝试通过修改id属性修改唯一匹配某个CSS过滤器的元素，结果发现修改后在IE中完全没有修改，之后改为用class属性实现同样的目的。

2007年10月9日星期二

.NET Framework 开放源代码

一些.NET Framework的源代码开放了，基于MS-RL许可，并提供调试整合到VS2008当中了。从旁观者的角度来说，这是Microsoft迈向开放与社区化合作的一大步，很多人也把这当作历史性事件，然而对于一般的开发者而言呢？这事情到底有多大影响力呢？我认为对于开发者来说，不同角色的开发者遭受的影响是不同的，并且整体影响是导致分工继续细化。

.NET最内层的本质是什么？Microsoft曾经非常引以为豪的COM，.NET只是这种思想一路实践并且进化而来的结果。.NET最开始设计为满足RAD的需求，以便吸引使用其他语言、框架的程序员转移过来，然而开放源代码后RAD的程序员仍然是RAD的，这对他们几乎没有任何影响。想象你是一个习惯于拖放一切的ASP.NET开发者，基本上不想写任何业务逻辑之外的代码，数据访问层用Typed DataSet或者Linq to Sql搞定，界面用现成的Control和Extender，Microsoft这次提供的源代码对你有什么意义吗？因为你不需要自己编写Control或者Extender，自然你不会花时间去了解有关的模式，也无须查看内置控件的代码。如果你调用内置控件出问题了，在Google以及调试内置控件之间，你显然会选择前者。因此，对于习惯于RAD的程序员来说，开放源代码这件事是没有任何直接影响的。

然而，有些间接影响是不能忽略的。前面提到了使用Google搜索问题的解决方案，然而Google自身并不懂得解决问题，答案其实来自与其他已经把问题解决了的程序员，因此这些源代码如果确实帮助了其他类型的程序员解决了问题，那么也就间接帮助了RAD程序员。

那么还有哪些类型的程序员呢？例如做稍微底层一些工作的，编写Control、Extender、HttpHandler、HttpModule等可复用组件以便为自己或别人提供方便的。编写可复用组件最糟糕的地方就在于它是可复用的——你永远不知道别人会将它以什么样的方式用在什么样的环境，因此按照一定的模式开发这些组件以便保证兼容性就很有必要，而模式本身最好就参考自.NET Framework内置的同类组件，除非你想更大范围地研究.NET Framework并重新发明轮子。因此研究与模仿内置组件的行为是组件开发者的必修课，而从ScottGu文章（Releasing the Source Code for the .NET Framework Libraries）中的截图看来，内置组件丰富的注释将有助于程序员更轻松地理解其原本的设计方式，从而更轻松地在自己的组件中模仿内置组件的行为。事实上，有很多内置组件是设计为对另外一些内置组件特别照顾的，这类型的耦合在Reflector中阅读代码时是最难以理解的，如果阅读有注释的代码相信会轻松不少。

最后，开放源代码可能将会导致对.NET Framework进行纯粹思想或理论作研究的人数增加。事实上，无论.NET Framework多么倾向于实用型，如果Microsoft需要获取来自社区的创新思想，还是必须吸引一群思想家的，否则大多数的社区创新都只是应用与应用方法，Microsoft还是独揽.NET Framework前进方向的控制权。这种中央集权有它高效的地方，特别是发展初期，Microsoft能够根据自己的实力战略性地安排新特性的研发顺序。然而Microsoft也曾经因此吃亏，例如ASP.NET 2.0没能引入AJAX支持，直到最后才急忙补上一个Callback特性，并承诺日后开发完整的AJAX库。因此，倾听来自社区的观点很重要，而要求社区有观点就必须先提供素材给他们讨论，开放源代码将能够激发社区对.NET Framework的研究热情并且提供更多能够作为反馈信息的新观点。

因此，就.NET Framework开放源代码这样一件事情而言，对于不同的开发者其影响的大小是不同的。同时我们也能预期Microsoft本身肯定也是最大的受惠者之一，否则以其智慧绝对不会做这样一个决策。

2007年10月6日星期六

Is following spamming?

一般来说，信息发布总有主动的发送方和主动的接收方，如果spammer是主动发送方，你可以积极拒绝；然而如果spammer是被动发送方，那么你可能就不容易留意到了。

从最普通的email spamming开始说吧，这完全是spammer主动发送给你的，因此你可以用过滤器过滤掉，或者看到标题就直接不看了。然后发展到论坛上的spamming，明明论坛是公共场所，大家都是平等的，但有些人就发一些spam上去，因此论坛上的信息对你来说不再是平等的，有些你一看到就会绕开。之后还有blog spamming，blog是你的，而spammer本应是被动的接受方，结果他却成了被动的发送方，每次你有新文章他就上来跟一个spam，因为你的文章是主导，所以spam变得不是那么不显眼。最后我要说的，就是别人在Twitter上follow你算不算一种spamming。

我昨天突然收到一个following通知，follower的名字是我不认识的，所以我就去看看那个人自己发什么信息，然后发现那个用户根本就没什么自己直接发布的信息，都是那种直接将自己blog的feed转发到Twitter并附上TinyURL的。然后我就想，他是不是再spamming我呢？至少如果他是spammer，那么这种做法是成功的。例如你写一个blog，你想让别人订阅你的feed吧，推广可不是容易做的事情。然而你把feed发布到Twitter，然后follow一堆陌生人，首先这些陌生人绝大部分都会因为好奇而看看你的Twitter，那也就相当于看了你的标题列表了，如果你的blog主题对他们有吸引了，这就成功吸引他们订阅了。就算不是这样，很多人也会出于“你认识我然后我又认识一下你吧”这一心态而在Twitter上follow你，那其实也就是订阅了你的feed，这样你也算成功了。

最后，我想说的还是一个观点，Internet是不需要直接实事实名制的，在用户使用Internet的过程中会逐渐发展出一套适用于Internet的信任与安全机制，也就是说每个人都粗略懂得在Internet上什么人能够信任什么事情是安全的。另外提供一篇相关阅读：使用实名SNS网站（校内、Facebook）请注意安全。

2007年10月3日星期三

Leeching and Seeding

最近用TorrentLeech下载了一些东西，感觉比在TLF下载BTTEAM发布的还要爽，然而却只敢选择性的下载一些想要快速下载的东西，不敢说看到什么就立即想下。

在TLF BT，几乎所有下载都是seeders明显小于peers，也就是说包括BTTEAM的发布者在内，只有少数几个人在seeding，其他多数人都是exchanging的，也就是说既download也upload，这也就是我们理解中P2P network的样子。然而大多数下载者都是下载完就关闭BT的了，完全不关心自己的上传下载比率(ratio)，因为也没有理由去关心，反正总有人在那里seeding的，等seeders自然减少到零了一个torrent就逐渐过期失效了。

然而在TorrentLeech就不一样，除非是刚刚发布的torrent，或者非常冷门的torrent，其他基本上是seeders大于leechers。seeder大家都能理解，就是初始上传或者下载完了完全上传不下载的人。那么leecher是指什么呢？leecher是指完全下载的人，在leeching的过程中没有任何的义务，你可以什么都不干就享受高速下载。基于seeders大于leechers的事实，leeching的速度非常高，有很多个seeds抢着给你送数据。然而面对如此高速的leeching，却不是想下载什么就随便下载的，因为你必须很清楚之后才需要付出的代价。

正如TLF的新手指南所说，在国外是没有免费午餐的，你要下载就必须要有付出，就算你本身不参与任何协助0day发布的工作，至少你要在P2P network里面上传，上传下载比率为1.0是基本的要求。例如TorrentLeech，新注册用户的前4G下载是暂不计算ratio的，下载超过4G之后系统就会开始检测你的ratio是否达到最低要求的0.4，达不到的话就出warning。别以为warning好像口头警告那样随便，warning相当于黄牌，下一步就是ban出局，你想重新获取邀请注册TorrentLeech就很难了，并且邀请你的人可能也要负责部分责任。如果你的ratio在0.4到1.0之间，TorrentLeech的下载等候与下载并发控制机制会激励你尽量提高自己的ratio，最开始任何新增下载你都必须等48小时才能开始下载，并且同一时间你只能下载一个torrent的内容，然而随着你的ratio和总上传字节数提升，最终可以达到无需等待以及无限并发下载。

可能这也就是中国和美国之间差异的一种体现。在中国你可以不贡献，你名义上是exchange，但实际上就是真的在leech，并且不用遭受任何惩罚，于是所有人都在想尽办法的拼命抢夺稀有资源。在美国的话，你可以对政府有信心，你可以相信你需要的资源是补给充足的，没必要以各种恶劣手法去获取，然而你必须承担相应的责任，逃避义务的后果是非常严重的。而且由于公平对待也就不存在杀鸡儆猴的做法，你不能说因为你不是违章中比较突出的那个就抱有侥幸心理。

最后，补充一些纯技术上的解释。习惯使用公开型torrent tracker站点的人，可能不理解TorrentLeech是如何统计ratio，P2P嘛，我和别人交换了多少数据你怎么知道，我下载时你又如何得知我是哪个用户。TorrentLeech的做法是在torrent文件里面嵌入你的帐号指纹，之后你的客户端一旦联系tracker它就知道你是哪个用户了，从而控制你的等待时间以及并发下载。同时所有torrent都是禁止DHT等用户间直接数据交换的，所有数据流由tracker引导，这就可以正确统计数据了。你强行要开DHT的话，通过DHT上传的流量不计算入总数，而且如果其他人没有开DHT的话你就没有DHT下载优势。

订阅：博文 (Atom)