Posts RSS Comments RSS 19 文章 and 17 评论 till now

Archive for the 'Tech' Category

Google Wave与Windows7

昨天经历了2件事。一是收到了Google Wave的邀请,二是参加了成都Windows7社区发布活动。

Google Wave官方定义为一种实时交流和写作的工具。思路很好。以前用Email和别人交流,我发出一封信不能确定对方是否马上能看到邮件,缺乏实时性,而IM某些方面弥补了实时性,但是要从众多的IM聊天记录中搜索到关注的信息也不容易。Google Wave兼具这些优点,等使用一段时间Google Wave再来分享感受。另一方面,Google自家的GTalk停止更新好久了,可能就是因为Google觉得GTalk足够简洁易用并且投入精力到Wave的开发中了。

Windows7已于22号全球发布,早在9月中旬同核心的Server2008R2对学生开放的时候我就用上了。这次Windows7的广告词是:Your PC, simplified.(电脑,就这么简单)相比之前的Windows更加易用好用,新特性更能提升工作效率。而社区发布会2位MVP主要介绍了win7兼容性开发和针对全新的任务栏特性的开发。很幸运,抽到了一个小礼品。

工具不应该使人们把太多时间花费在工具的使用上,而应该提高人们的工作效率,尽可能减少人们使用工具的时间,简化人与人之间的沟通方式和成本,降低信息获取的成本。Google和Microsoft的这2个重量级产品都在这方面做了努力。

P.S.社区发布会最后大家合影留念,MM拍了几张后说体现不出欢乐祥和的气氛,让大家面带笑容再来几张。于是MM问大家:银行里什么最多?大家依然无语,还保持这严谨的pose。最后MM也放弃继续拍照了。又懒又木的偶……

合影

健康用电脑之WorkRave

天天面对电脑的,难免长时间端坐在电脑前,眼睛一直盯着显示器。天天如此的话,要是还缺乏锻炼,那健康程度真的是每况愈下。诸如鼠标手、肩膀脖子酸痛、泪流满面之类的现象大家一定都有过体会。向大家推荐一款小软件WorkRave,它可以定时提醒电脑使用者暂停工作、休息,同时可设定每天使用电脑最长时限。同时WorkRave还能记录每天鼠标运动距离和键盘敲击次数。在休息的时候,除了WorkRave的窗口外,其余地方是锁定输入的。当然,在休息的过程中,可以随时选择跳过此次休息或是延后一段时间。其提供的保健体操配合了文字和动画说明,个人觉得挺有效的。关键还是在于坚持锻炼,不能因为忙而每次选择跳过。

下载地址

P.S.在给Boss做Presentation时记得要关掉WorkRave哦~

workrave1

workrave2

workrave3

Expression Studio3的安装界面UI Bug

从去年装Expression Blend3 beta版到最近装Expression Studio 3正式版,安装上都出现了UI bug,如图。测试版出现bug就不说了,但难道微软放出正式版也没有经过完善的测试么?联想到Windows 7 7600.16384也存在UI bug

Blend3的安装界面,当进行到选择路径的时候,上一步,下一步,取消按钮被挤到安装界面下了,但键盘焦点还是放在下一步上的,猛击回车键可以进入下一步。

expression-blend-3

Expression Studio 3的安装界面,无法选择路径……

expression-studio3

侧眼看绿坝

在稻城的时候看到新闻,得知工信部要求国内出厂的计算机全面预装绿坝-花季护航软件,可以过滤色情内容、暴力内容以及翻落在我阳台盆栽的榕树叶上,叶子颤动,枝丫摇晃,但还是支撑不住这重量。风从东面吹来,雨水砸在窗口上的铁罩,紧凑又墙软件,用来保护未成年人的上网安全。其他的先不看,单单是色情内容过滤,这不就是情买卖。不过他身后的空玻璃水壶把握了最后的呈现机会,反射出光线吸引我,我加了七元钱换下它。此刻房子里的光线较差,色内容识别吗?实验室的师兄也做过类似的研究,让我们来看看绿坝怎么实现的。

从 XFImage.xml可观察到,绿霸使用了OpenCV的haar分类器进行人脸检测。绿霸附带的cximage.dll、CImage.dll、 xcore.dll和Xcv.dll也来自OpenCV的库文件。都反映出绿霸主要使用了OpenCV来进行图像方面的处理。不过就像一般国产软件的做法,绿霸大概也无视了OpenCV的BSD许可证。

OpenCV是Intel资助开发的开源计算机视觉(computer vision)库,包含了许多计算机视觉和图像视频处理领域的算法。绿坝没有在自己的文档中和版权声明中包含BSD协议就算了。我们还是来关注色情内容识别上。

色情图像检测已经发展好多年了,在研究之初,大家最容易想到的方法就是通过肤色来检测(人脸检测也是)。但这种方法有个明显的弊端,怎样区分类肤色在一张图片中所占比例的问题(一张风景照中可能就包含大量的类肤色区域,总不能把自己辛辛苦苦拍得风景照也屏蔽了吧,甚至火焰的颜色和肤色还有点像||若图片中的人脸比例过大,一张脸何来色情?)以及黑人(黑人也色情?不要拍砖给我)白人肤色的问题。于是,检测人脸检测并引入其他图像特征(如纹理等)成为后来常用的方法。

绿坝所使用的方法是:图像检测进程从待检图像队列中获取图像数据,先归一化图像尺寸(在图像变换过程中,不同尺寸的图像体现的边界细节有所不同,因此需要调整到合适的尺寸,同时将大图像调小也可以提高处理速度。),然后分离肤色区域和非肤色区域,在对肤色区域关系进行分析后去除干扰,提取区域的特征送入已训练SVM(support vector machine即支持向量机)分类器得到判决结果。当图像被检为色情图像后再送入人脸检测器,若人脸不是主要部分便确定为色情图像。这套算法的主要问题是,色情图像的识别严重依赖于肤色和肤色形状;而最后使用人脸检测加权判定也只是手工打补丁避免出现大幅人脸识别为色情图像问题的办法,且经验权值可靠性缺乏验证。

由此可以看出此图像识别依然以颜色分割为基础,即使算法再好也无法达到很好的人工智能识别效果。因为这种以颜色为基础的检测,基本检测单位是一个个的像素点,从2维上看2维,缺乏高度的抽象,即使通过模式识别的方法进行训练识别,从本质上还有别于人的识别方式,因此最终的识别结果也就不乐观。

关于色情站点,我们的墙早就保护了我们,而现在互联网上所看到的不健康图片来源于许多门户网站等频道中打擦边球的栏目。同时还听说绿坝会直接关闭浏览器或文字编辑软件,那假如孩子在写程序的时候突然某大型网站弹出个大量肤色的广告,程序的IDE被强制关闭,孩子辛苦写的程序岂不白写了……宜疏不宜堵,且堵也要用个有点技术含量的软件吧。这张政府单子有4000万,看来CV方向还是很有钱途的。

硬盘数据恢复

这次的经历真是有惊无险。

话说4号得到许可可以使用曾经新校区6401实验室的那种电脑后,我就把我的硬盘和电源和新电脑的硬盘电源互换,快1点的时候终于把系统和驱动搞定了。第二天早晨硬盘间拷贝文件的时候系统突然提示发现新硬件,我一看就晕了,那不正是其中一块硬盘?再点那个硬盘的分区则提示该分区未被格式化……这块硬盘可是我大学以来一直使用的硬盘,里面存的全是各种文档和资料!平时备份只是备份到不同分区,没想到现在整个硬盘却出问题了。

重启了一次问题依旧,那个硬盘的所有分区依然无法访问。进DOS用PartitionMagic或修复分区的工具试了试,反而把主硬盘的分区表也搞坏了。现在的问题是:系统盘分区表错误,无法进入系统;资料盘估计MBR之类的出了问题。只尝试了pq(总是提示有错误,修复了错误依旧),scanfix(修复分区表的工具,无效),Disk Genius(一进软件按提示修复错误还是无效)。没办法,怕再修下去别把数据搞掉了,只能拿到修电脑的地方看看。

店家的伙计接上资料盘开机后,硬盘狂叫不止,自检无法通过。伙计直接说硬盘坏了,没希望了(忒打击人了),而进入PE系统后能认出系统盘,里面的文件还是在的。

回实验室后,剩下的就只有把系统盘的数据导出,然后删除所有分区重新分区就OK了。再接上资料盘还是不正常地叫。看来资料盘的数据真没了,相当于我快5年的积累没了,相当于我从今年才开始使用电脑T_T。此情此景,不能欲哭无泪万念俱灰!心态还是要调整好。

咨询了Shawn后,在进入XP后在接上IDE资料盘的电源线,冒险试试看能不能读取。奇迹的是,硬盘不叫了,设备管理器里也能正常认出。此时的情况是:硬盘能被认出,但是分区信息没了,只有一个raw格式的分区,于是用EasyRecovery尝试恢复盘上的数据,但是用Raw扫描后建立可恢复的文件列表却花了我2个小时还没建立好。无奈之下,想起Disk Genius能重建分区表(之前只是按照提示操作,没有看到菜单中的这个功能 囧)。选择交互方式重建分区表,分区表被正确地找回来了!接下来就easy了,EasyRecovery就能把硬盘上的数据恢复出来了。

reconstruct DPT

到现在为止,往资料盘写数据的速度还是有些偏慢,暂时先不用它了吧。之前XX向boss说我电脑坏了,没想到第二天就应验了,无愧先知的称号啊,而我今年的RP依然不济。

教训:

  1. 经过几年的使用后,硬盘的可靠性开始降低。若有多个硬盘的话,尽量把重要数据备份在不同的位置,如网络上(云存储,我用M$的live mesh),不同的硬盘上。
  2. 分区表出问题后,可以尝试Disk Genius,国人写的短小精干的软件但功能绝对不逊色。PartitionMagic还是不如它。若分区表是正常的,可以进PE系统看看能不能查看分区内容,不行的话可以用EasyRecovery恢复。

LiZheng曾经在个人信息管理整合方案(上)里写到

你的数据,重要的数据,应当备份到哪里比较安全?

回答脑子的,不错,不过我比较笨,记不住那么多。

回答U盘的,赶快去买彩票吧。

回答硬盘的,相信你不久会遇到一次人生重大波折。

回答服务器的,我想告诉你,万一你的网管比较不负责任怎么办。

个人认为,Gmail是个不错的选择。Gmail提供了7273 MB空间(到我写作的这一刻),虽然不够放几百GB的照片,但是放写重要的文档(比如爱人曾经给我发过的全部短信,我都有保留。怎么保留,请见第8部分)还是足够的,这些文档极度极度重要,但是很小,几兆而已。

没有绝对可靠的地方,唯有多备份,有条件的组个RAID1(RAID也可能出问题)。希望大家的数据都能平平安安。附一张出问题后,系统辨认的我的数据盘,哈哈,现在市面上最大的硬盘才不过2T。

2.5T Hard disk

安装office 2007 sp2中遇到

今天office2007 sp2补丁发布了,马上下载安装。安装进度走到三分之一的地方卡住了,然后弹出来一个对话框曰:此程序包的安装失败。(忘了截图了)

网上貌似还没有人遇到这样的问题,有人建议安装出错了就卸载office重装。可是我重装完依然出现这个问题。然后又一次尝试安装sp2补丁包卡在那个进度的时候我取消了补丁的安装,打算以后用Windows的自动更新来更新。诡异的是,过了一会儿一个sp2安装成功的窗口弹了出来……再看word的版本号确实更新了。

Google Chrome 2.0之用户脚本

今早发现Google Chrome2.0的测试版放出,这距离1.0正式版的发行才几天啊……除了bug修复,升级等例行公事外,明确提及了支持用户脚本(类似火狐中的Greasemonkey),参考官方的说明,用法如下,Cnbeta上的可能用法不对。

  • 在Chrome的快捷方式后面加上“--enable-user-scripts“字样,不包含引号。例如我的是这样的:\chrome.exe" --enable-user-scripts
  • 创建一个目录用于存放用户脚本。若chrome的版本<= 2.0.156.1,脚本应该被放在此目录:C:\scripts若chrome的版本 > 2.0.156.1,脚本应该放在chrome用户目录下的User Scripts下。单击chrome的快捷方式单击寻找目标,打开此文件夹建立新文件夹即可。
  • 将*.user.js文件拷入脚本文件夹中。
  • 脚本将被自动载入,刷新页面就可以看到效果了^^