2005年7月28日星期四

向导性搜索

所谓向导性搜索,就是在搜索过程中不断给用户Suggestion以及提供更多的有界输入(选项、范围)或者无界输入(文字)以不断所在范围。例如我们最常见的就是搜索结果通常会伴随着几个相关关键字,搜索引擎应该加上建议的操作让用户加上某个相关字或排除某个相关字,这样比起高级用户自己看相关字然后自己排除掉一部分(往往是排除,但你搜索目标比较偏的时候)要显得更加用户友善。

当然,我期望的向导不仅仅是这样。这里要提到我以前提出过的OO结构关字键理论,也就是对于任何一个关键字,它都有一个或者多个"基类"和非常非常多的"派生类",至于这里"派生"的关系和变成上的is_a关系是完全一致的。例如在你搜索StarWar的时候,首先搜索引擎会尝试识别基类然后提供给你作为选择,例如让你选择Movie还是Novel,然后你选择了Movie。这时候结果还是太多,于是搜索引擎提供主要的派生类,例如那么多集StarWar的名称,然后你再做选择。

不过我也很担心向导会存在一个陷阱,就是它的没完没了,最后可能陷入一个让用户觉得我提供了那么多信息让你进行过滤和重排,结果在搜索结果第一页还是没有我要的信息。这里我仅仅说是搜索结果第一页没有需要信息而不说没有结果,因为这个问题我也考虑过,所以在我认为的向导选择中,过滤的只是占少数,更多的是重排,然和向导中输入信息相关的浮上来无关的沉下去。

原来Google的PageRank Zero惩罚也是有终结的!

以前我一直想摆脱bbs.hsfz.net这个已经种了PageRank Zero惩罚的域名(我无非是在CooCooWakka留多了三个链接而已),不过今天突然发现它的PageRank竟然有5那么高哦(被惩罚之前是3)!哈哈,好开心啊,这样就可以把这个域名继续发展下去了。

今天去Windows Update的时候发现要正版验证了

以前就的那个正版验证控件是很容易通过的,VLK版也没问题。现在它要你装个新的,然后就通不过了,以后就只能通过Automatic Update来更新而不能够通过Web来更新,真是麻烦。希望快点有人有办法解决这个。(MS还不至于敢说不允许盗版用户更新,因为那样的话一旦发生新的病毒风波Windows就更惨了。)

2005年7月27日星期三

Blogger不懂超时,但坚持不懈……

原来给足够的时间Blogger.com它帮你上传完整个Blog还是没有问题的,它虽然不懂得什么超时自动重试,但在每到达它那个超长的超时限制之前它会坚持不懈的帮你上传,呵呵……

ASP.NET 是如何让 aspx 完全编译的呢?

我以前对这个问题一直持怀疑态度,因为.NET Framework里面就有很多TemplateControl处理类和方法挂上了Parse(或Parser)的字样,不过也有挂上Compile字样的。最近我确实测试了一次它是否完全编译:

我做了一个简单的纯asp页面:

<html>
<head>
<title>Now!</title>
</head>
<body>
<div><%=DateTime.Now%></div>
</body>
</html>

然后查看它的.dll,发现它自动生成了一个Page派生类,IRequiresSessionState也自动加上了,比普通的Page类多了一些双下划线开头的东西,例如两个双下划线开头的函数:
private void __BuildControlTree(Control __ctrl)
{
__ctrl.SetRenderMethodDelegate(new RenderMethod(this.__Render__control1));
}

private void __Render__control1(HtmlTextWriter __output, Control parameterContainer)
{
__output.Write("\r\n\r\n\r\n\r\n\r\n ");
__output.Write(DateTime.Now);
__output.Write("\r\n");
}

看来编译器会把html直接放到write的部分,中的逻辑再另外处理,例如Response.Write等效于等效于直接输出。至于它是怎么生成的,我还要研究研究才知道。另外这个功能不一定完全由CodeDom提供,可能CodeDom仅仅提供编译部分。Page类理论上是通过Parse来获取aspx里面的内容,然后把它们作为控件或者纯粹write出来的html添加到自己的内部,然而这时候得到的是一个对象的实例,不是一个类。假如由我设计ASP.NET,我会考虑是否存在可能性把一个实例转化为该类的派生类,或许ASP.NET真的是这样做的。

假如要把一个实例转化为一个类,这在Java或者.NET看来都并不难。例如在.NET里面,只需要把一个实例所包含的数据全部变为初始化数据放在类的初始化代码里面就行了,至于相关信息就放到meta-data里面,这个非常容易。如果.NET真的内置实现这种功能的东西,就一定要挖掘它出来。这意味着一种把逻辑缓存到dll的可能性,它拥有比缓存到内存更长久的保存性,同时因为它再次调用时无需再次编译所以这种缓存方式的效率也是绝对一流的。

2005年7月26日星期二

Community Server 进驻 hsfz.net

已经部署好了Community Server了,暂时部署在w3.hsfz.net。因为Benny将很多我不用的站点在ISA那里封了,所以要访问必须从校内访问(其实大家都是有办法访问校内网站的吧)。

看起来这个东西很不错(在使用上),集合了Blog、论坛、图片集,而且都有本来非常有名的组件。它强调的Collaboration(协作),所以不像很多过去的同类型产品一样都是鼓励大家多注册、多发表、多回复,而是引入了比较多的Restrict(限制),例如新注册用户默认状态是在管制下的(也就是发帖要通过审核贴子才显示,我已经更改为“50贴通过审核后自动脱离管制”),Blog也不是人人都自动有一个的而是只有管理员能开Blog并指定Owner的(这非常类似现在很多IT专项Blog,必须写申请给管理员证明你是该专项爱好者才能获取Blog)。至于图片集,我还没有测试过,好像允许匿名上传。

这个东西看起来对于“大学城网上通”的一期工程或许也有些用,它有论坛也有Blog和图片集。论坛适合于普通交流,Blog则是给通过审核的专栏作家发表的地方,图片集可以用来保存上传的图片。不过这样做也有一定的风险,因为不知道做扩展和数据迁移是否容易,如果我们的二期工程需要做大规模扩展或者开发一个全新的服务系统那就不一定容易了。

另外Community Server的分层设计上也很好。它不至于走Sharepoint那种纯dll设计(我承认,做纯dll设计的话开发和调试都比较辛苦,每次都要手动重新编译,需要改动UI也是很难的),它保留了aspx(其实Sharepoint也保留了,不过是存放在数据库里面,它自己有ISAPI Filter负责虚拟路径到数据库内文件的影射),然后把UI部分留在aspx/ascx里面。然而aspx/ascx并没有任何的详细代码,只有WebControl的引用,所有WebControl都封装在dll里,至于事务逻辑就都在背后了,很符合分层要求哦。

今天把Google AdSense装上了

在Blogger.com的控制面板见到大大个注册AdSense的标记,于是过去注册玩下,反正就算没钱也没所谓,我的Blog都是.NET有关的东西,出现的应该多数是.NET WinForm/WebForm控件广告(这是观测其它网站所得的),如果我见到好的控件我就会跑去看看,看看有没有什么优秀的地方值得我学习,或者干脆找找有没有“免费下载”,哈哈!

现在AdSense出来的还都是公益广告,可能Google还没有对我的网站做内容索引吧,那迟一点再回来看广告吧(很奇怪为什么是英文公益广告,难道我设置有问题)。

终于又成功发布Blog了

昨天晚上网络速度超慢,不知道干什么,发布时总是上传了一两个文件就停在那里了(Blogger.com的bot不懂得超时重试之类的东西)。今天下午尝试重新发布,估计网速没问题就没问题了吧,结果Blogger.com一直显示0%而我的ftp监视根本没显示有人登录!

这个问题我弄了一个多小时都解决不了(SFTP又总是不行,不知道为什么),于是跑去睡觉了。睡觉起来,怀疑是不是blogger.com会缓存一些有问题的目标ftp然后就根本不肯连上去,于是就断线重连。还是不行,那么难道是缓存域名?我把ftp由maxcellftp.3322.org改为maxcellblog.3322.org(暂时这两个域名IP一致而且我的ftp都接受),终于可以了。真不知道是Blogger.com太聪明懂得封ftp域名了还是它缓存一个ftp域名的IP太久了。

2005年7月25日星期一

改版改版~

现在总算弄到自己的ftp了,也就能够稳定维护这个blog了,而且还有hello+picasa这样轻松的发布信息和图片的组合,真的很爽。

现在我决定把这里改版了,改为我主要的blog,而wallop则主要是继续和别人message来来往往(我觉得wallop就是这点好,是一个能够自动适应投递宽度的mail-list)。以后我会把我在其它mail-list发表的东东(机密除外)也发表一份过来这里,让更多的人能够看到我的东西:)

2005年7月22日星期五

Windows Vista!

The next version of Windows, until now referred to by its code name Longhorn, finally has an official name: Windows Vista. 1个小时之前的新闻,刚刚碰巧进入news.google.com的美国版看到的。Vista是个好名字,强调View的意思,而且是Beautiful的,并且也是长远的或者广阔的View,并且这和Longhorn花费那么多功夫在Vision上也非常相配,不知道这个词是否能够迅速飙升为常用词(现在搜索vista还是一些都不相关的信息)。

2005年7月15日星期五

2005年7月14日星期四

ExileBoy

Exile,我希望用黑色加适当的高光作为主色调,好像Wind­ows Server Family那样(见过Windows 2003的安装界面吗?就是Windows XP的变成黑色为主调,但保留高光),同时用活跃的成色作为突出­色调。我也比较喜欢"葡萄式"广告里面那个成色的小人,所以决定­捏一个差不多的做为Exile的公仔,然后就叫做Exile Boy。

其实我一直很想画四格漫画,不过又没什么机会。我喜欢很久很久以­前Windows 95/98配的那个Microsoft Chat自动生成漫画的功能,因为仅仅Windows NT 4能够在IIS上加载Chat Server,所以应该很多人都没用过Microsoft Chat。我解释一下他的漫画功能吧,输入时还是像那个年代的普­通聊天室一样输入文字,或则选择一些文字描述的动作。如果是文字­形式查看,那就和普通Web聊天室没什么不同。如果选择漫画版式­,然后你从8个主角中选一个代表你,那么现时的将是4格漫画。大­概每两三条对话就集中到一格吧,这一格中出现了说话的角色,然后­头上有说话的冒泡,如果你选择了动作,那就是对应动作,不选择动­作的话也有些各种各样的小动作吧,反正那个年代的程序已经懂得避­免出现张张差不多的图片已经算不错的了。

我现在就是想试一下用.NET所谓的GDI+,做一个Exile­Boy的漫画制作工具:
1.这个工具能够轻松制作不同高难度动作的ExileBoy,我­希望好像3D软件那样我确定ExileBoy的关节点的位置,然­后软件就能够做出它的外形,当然ExileBoy仅仅是2D外形­。
2.这个工具内置若干绘图模块,而且不是简单的把某一个东西贴出­来,而是能够由创作者定义一些东西而工具本身又随机创作一些东西­,反正就是要有一定的随机性。
3.这个工具要支持插件。
还有很多其它的想法,例如要支持图层,而ExileBoy要能够­跨图层存在等(这要视觉效果才更好),不过要慢慢做。看看吧..­....我要先完成现在Quickling为主的Web项目,才­有时间来做这个,要慢慢等咯。不过之后我会把ExileBoy加­到Web上面去:)

2005年7月2日星期六

Tag with Map

能够好像flickr那样使用Tag,但Tag上去的不仅仅可以­是一个关键字,而可以是一个范围,或许是Map上的一个范围,那­样会怎样?想象一个支持Tag的Google Maps,呵呵......

最近喜欢模糊运算,所以有点拒绝不是0就是1的东西。如果你有时­间去看看模糊运算的有关法则,你就会发现它是我们现在学习的离散­数学运算的广义定义。例如x AND y就是max{x, y},那么对于0.5 AND 0.8来说结果就是0.8了。所以对于Tag,我也不喜欢它Ta­g死一样东西,而是最好说明一样东西对这个Tag的属于程度,取­值范围是[0,1]。

而Tag with Map就肯定会是这样--不可能有两个Tag准确的放到同一个L­at/Long(经度/纬度)上,那么一个Tag就应该是附设一­个范围。或者是若干个Tag就连成一个二维的曲线,至于曲线的高­度则由插值决定......嗯......看起来好像很复杂,我­只是觉得一个好的算法会运算得很好,让人在模糊集合中很快地找到­他要找的东西,并且是排好序的。(模糊集合的意思是,一个元素不­一定100%属于或者不属于这个集合,而可能是0.6属于这个集­合。)

2005年7月1日星期五

2 Ways Thinking In Ajax

至今来看,ajax的模式有两种,就是Google模式和.NE­T模式。

Google模式就是服务器仅仅接收xml和返回xml,其他一­切工作都是客户端做。开发的重点在于客户端,然后xmlhttp­仅仅用于发送和接收数据,服务器端则是仅处理数据的逻辑,如果把­xmlhttp看作"透明代理"的话,那么这个设计就是属于客户­端设计了。

.NET模式则刚刚好相反,虽然.NET说是把WebForm当­作WinForm开发,但它不是透明掉服务器端而是透明掉客户端­,为什么这样说呢?在你不需要JS的时候,你也可以当它是透明掉­服务器端,当你需要JS的时候,你就会觉得它是透明掉客户端了-­-它没有考虑过你要大量运用JS的情况。

Google模式看上去很容易实现,但当你实际操作的时候你就会­发现debug的痛苦程度!我甚至用js封装过专门的ajax库­了,这个库包括自动创建一个layer浮在最顶动态更新调试信息­(或者说是trace),但还是觉得非常痛苦!

.NET模式的痛处则在于JS--用到ajax怎么可能不是大量­JS,而这是.NET要避免的问题--.NET希望页面内的所有­元素都不是全局存在而是局部存在的,这样的设计才是正交的,如果­所有的逻辑都是拥有全局影响的权利,那么.NET建立的一切稳定­基础都会被打破,然而JS正是这样做着。.NET成功把HTTP­和HTML都对象化了,这依赖于以前ASP就有的Request­/Response模型和XHTML DOM模型。然而JS它无法对象化,除非我们能够创造一个JS CodeDOM。

现在Ajax的未来落在了Avalon的身上,Avalon本身­就是允许开发者用XAML描述界面并且用.NET描述逻辑,这对­于习惯XHTML+JS的Web开发者来说是件好事。然后它也做­到了客户端和服务器端语言的统一,而且是统一的CodeDOM。­而且MS可以采取一种很好的做法来让.NET开发者适应,就是开­发的时候服务器端代码和客户端代码还是混边,还是当作没有B/S­之分,然后把你希望在客户端执行的函数前面加一个例如[Clie­ntScript]标记那么该段代码就会在客户端运行,那时不是­很美妙的事情?而且这也符合MS的SmartClient战略哦­!