• Tag: 这里是我的标签集合!

BOINC

10月 3rd, 2007

在宿舍算BOINC的日子暂时结束,发一张曲线图。

Myheritage人脸检测

08月 6th, 2007

同学那里发现这个网站Myheritage啊,可以将自己的照片上传,系统自动判断和明星的相似度。对于结果笑笑就可以了,但我上传了2张,其中一张正常的半身像,准确地识别了我的脸部并进行了相似度判断,结果我就不说了……另一张相片是侧着照的,网站第一次没检测出来,但它将照片转正后就检测出来了。大家有兴趣可以去看看^^

更搞笑的是我把人脸数据库中的一些图片放进去,检测率很不错,哈哈~而且考虑到了刘海的影响,能了解它的算法就好了~!
rec

YUV格式

08月 6th, 2007

研究了一晚上YUV分量,但还是不能对摄像头采集进来的YUV分量进行很好的控制,导致输出的Y分量不是只有屏幕的一半,就是Y分量的一半和Y分量的一半的一半重叠在屏幕的下半半(晕吧,呵呵)……明天再来吧,我已经晕了,DSP已经有点烫了……

Yuv420

YUV420

Cleared XML 142 with 75.5%

07月 5th, 2007

今天通过了IBM XML Certification,75.5% PASS IBM Test 142: XML 1.1 and Related Technologies,考试过程可谓一波三折。从最初通知的7月1号考,延迟到7月5号考,今天下午一点我提前赶到,得知得要等DB2考完才能考 XML,最终快4点时开始了考试。

虽然Pass了,但在XML方面还很欠缺实践经验,今后要多多弥补。

下面总结一下快速通过该考试的捷径(参考别人的考经):

1.学习www.w3cschools.com上关于XML等知识的Tutorials,最快获得感性认识.

2.阅读IBM网站上关于142考试5个部门的教程.

3.去JavaRanch浏览别人的考试经验,做几套相关的Mock Exam.

4.保持平常心参加考试

当然,以上方法目的只是通过考试本身,如果想真正掌握考试要求的技能,推荐几本书:XML in a Nutshell,professional XML等等,实践亦很重要。

几个考点如下:

1. Understand under what circumstances SAX and DOM is used. Develop some test sample code.
2. Understand under what circumstances DTD and schema is used. Develop some test sample code.
3. Remember XPATH axis and XLST.
4. Understand under what circumstances CSS and XLS-FO is used.
5. Concept is first.

Material I used:
1.XML and Related Technologies certification prep (IBM developerswork)
2.XML certification success (IBM developerswork)
3.XML in nutshell

Test 142: XML 1.1 and Related Technologies

06月 8th, 2007

这是IBM XML 认证考试的Objectives,距考试的时间也不多了,加油!
The test consists of five sections containing a total of approximately 49 multiple-choice questions. The percentages after each section title reflect the approximate distribution of the total question set across the sections.

Section 1 - Architecture (19%)

  1. Determine the implications of a given architecture on XML design considerations
  2. Select appropriate XML technologies for an architecture (XML Schema 1.0, XSLT 1.0, DOM2, SAX2, XPath 1.0, XQuery, Namespaces, DTDs)
  3. Design functional components and interconnections for an XML application architecture
  4. Assess performance trade-offs related to parsing, validation and transformation
  5. Address XML security using XML encryption and XML signature
  6. Implement Java classes through XML binding via Java Architecture for XML Binding (JAXB)

Section 2 - Information Modeling (22%)

  1. Analyze data, documents, and problem domains
  2. Represent structure in XML syntax (model data)
  3. Use Namespaces appropriately
  4. Define DTDs (declarations, reuse, external references)
  5. Define schemas using XML Schema (declaration, structure [elements vs attributes, best practices], data types
    data relationships, reuse, external references)
  6. Determine when to use DTD versus XML Schema (legacy systems, scoping, run-time modification, constraints)

Section 3 - XML Processing (22%)

  1. Analyze data integration points
  2. Use the SAX2 API to manipulate XML data
  3. Use the DOM2 API to manipulate XML data
  4. Address validation/conformance and exception handling issues related to XML Schema (e.g. data typing and pattern matching)
  5. Perform validation of XML documents
  6. Access data using XQuery

Section 4 - Transformations (29%)

  1. Define optimal rendering/transformation approach for each target (e.g. screens, print, pervasive)
  2. Transform XML using XSLT (e.g. CDATA block, recursive name template calls, named vs matched templates, dynamic attributes)
  3. Re-target XML for multiple formats
  4. Use CSS to render XML or XHTML
  5. Consider data rendering issues after designing data models
  6. Traverse an XML document using XPath
  7. Implement input screens using XForms
  8. Demonstrate the use of include, import, id, idref, and keys

Section 5 - Testing & Tuning (8%)

  1. Determine appropriateness of single versus multiple pass transformations, XSL extensions, XSLTC, XSL and Schema inclusions
  2. Optimize XML application execution (e.g. includes, import, id, idref, keys)
  3. Create instances for testing XML applications (e.g. based on data model, boundary cases)
  4. Refine design as necessary based on data model, data integration, data rendering, and data query issues

2007百度之星程序设计大赛初试题目

05月 26th, 2007

1.水果开会时段

每个百度工程师团队都有一笔还算丰裕的食品经费,足够每天购置多种水果。水果往往下午送达公司前台。前台的姐姐们只要看到同时出现五种或以上的水果,就称之为“水果开会”。

c1q1

 

从搜索引擎切词的语法角度,只要两种水果的名字中有一个字相同就属于同样的类别。例如“小雪梨”和“大雪梨”是同一种水果,而“核桃”和“水蜜桃”也被认为是同一种水果。尤其要指出的是,如果有三种水果x, y, z同时在前台出现,且x和y是同一种水果,y和z也是同一种水果的时候,x和z在此时也被认为是同一种水果(即使x和z并不包含相同的字)。现在前台的姐姐们想知道,今天是否有“水果开会”——五种或更多的水果同时在前台出现。

输入格式
输入的第一行只有一个整数n,表示购置水果的组数。接下来的n行表示水果的到达时间、取走时间(时间用1200到1900之间的正整数表示,保证取走时间大于到达时间)。剩下的字符串以空格分割每一种水果。如“1400 1600 雪梨水蜜桃”,表示下午两点到四点(包含两点和四点这两个时间点),雪梨和水蜜桃会在前台等待开会。每种水果名称由不超过十个汉字组成。

输出格式
输出仅一行,包含一个字符串Yes或No,分别表示今天水果开会与否。

输入样例1 例
3
1200 1400 雪梨 柠檬
1300 1400 西瓜 苹果
1400 1800 花生 水蜜桃

输出样例1 例
Yes

输入样例2 例
3
1200 1400 雪梨 柠檬
1400 1500 哦 大梨 呀
1500 1800 咦 大梨

输出样例2 例
No

样例解释
在样例1中,时刻1400有六种水果在前台;在样例2中,由于雪梨和大梨在任何时刻都是同一种水果,最多只有四种水果同时在前台。

评分规则

1. 程序将运行在一台Linux机器上(内存使用不作严格限制),在每一测试用例上运行不能超过1秒,否则该用例不得分;
2. 要求程序能按照输入样例的格式读取数据,按照输出样例的格式将运行结果输出到标准输出上。如果不能正确读入数据和输出数据,该题将不得分;
3. 该题共有10个测试数据集,每组数据均满足n<=10,每个时段最多有10个水果,一共不超过50个水果; 4. 该题目20分。

2.大话西游与数字游戏

“叉烧鸡翅膀,我呀最爱吃!……”

百度spider组的“黑龙潭之行”在烤着鸡翅,唱着星爷的经典时达到高潮。大家在篝火旁围成一圈,开始玩“数7”加强版游戏,规则如下:
规则1:遇7的倍数或含7的数时pass。
规则2:遇有包含相同数字的数时pass。注意相同数字不必相邻。例如121。

数错的惩罚很残酷——吞食烤全羊。为避免惩罚,百度工程师们需要你——史上最强程序员的帮助。百度工程师想知道:
req1 x:符合规则1的第x个数是什么?
req2 y:符合规则2的第y个数是什么?
req12 z:同时符合规则1、2的第z个数是什么?
query n:数n是规则1中的第几个数,是规则2中的第几个数?

输入格式
输入的每一行为一个查询,由一个查询词和一个无符号整型数组成。共有四种查询,查询词分别为req1、req2、req12、query(区分大小写)。

输出格式
前三种查询输出一个无符号整型的解。对于“query n”的查询,若n是规则中的数则输出相应的解,否则输出-1。

输入样例 例
req1 10
req2 10
req12 10
query 14

输出样例 例
11
10
12
-1 13

评分规则

1. 程序将运行在一台Linux机器上(内存使用不作严格限制),在每一测试用例上运行不能超过1秒,否则该用例不得分;
2. 要求程序能按照输入样例的格式读取数据,按照输出样例的格式将运行结果输出到标准输出上。如果不能正确读入数据和输出数据,该题将不得分;
3. 该题目共有10个测试数据集,其中数据1~5主要考查正确性,满足x,y,z,n<=1000;输入6~10主要考查时间效率,满足x<= 10,000,000,y<=1,000,000,z<=240,000,n<=20,000,000。数据1和6只包含req1,数据2和7只包含req2,数据3和8只包含req12,数据4和7只包含query,数据5和10包含全部四种查询。每组数据都恰好包含 100个查询。 4. 该题目20分。

3.繁忙的会议室预定问题

百度由最开始的7人团队迅速发展为几千人的大团队,而工程师们经常需要在一起进行“头脑风暴”,这样会议室就成了紧缺资源。为了有效利用资源,大家决定制定规则, 自动安排会议室的使用。

c1q3

为了公平起见,应按照申请时间从早到晚依次考虑,先到先得,且申请一旦被接受就不能取消。在处理每条请求时,只要当前请求可以和前面已接受的所有请求同时满足时就必须被接受(如有必要,可以调整给已接受申请安排的会议室和开会时间)。注意同一时间开的不同会议必须在不同的会议室,而同一个人不能同时参加两个会议。

输入格式
输入第一行为会议室总数n和请求总数m;第二行是n个整数,表示会议室能够容量的人数。以下m行每行是一个请求,按请求时间先后顺序排列(即应优先满足在输入中更早出现的请求)。
每个请求中第一个是整数,表示会议需要的时间长度(单位:小时);之后为与会人名单。人名由不超过四个汉字组成,用半角逗号分隔(每人名字固定且唯一,有重名的也在登记时区分开)。名单后的数字表示可以安排会议的时间,也以半角逗号分隔,如 10,11,14,15 表示第10, 11, 14, 15个小时可以开会(会议时间为9到19之间的正整数)。

输出格式
输出m行,依次表示每个请求是否被接受。1表示接受,0表示不接受。

输入样例: 例
2 4
20 2
3 张三,李四,王五 10,11,12,14,15
1 张三 12
4 王六,王七,王八,王九,王十 9,10,11,12,13,14,15
2 张三 14,15

输出样例: 例
1
0
0
1

样例解释
请求1可以满足,因此接受;在请求1接受的前提下请求2和请求3都无法满足,因此不接受。请求1和请求4可以同时满足(都在会议室1,前者用时间 10~12,后者用时间14~15)。需要特别注意的是:如果没有请求1,后三个请求可以同时满足。但是规则是先到先得,请求1只要可以满足就必须接受。

评分规则

1. 程序将运行在一台Linux机器上(内存使用不作严格限制),在每一测试用例上运行不能超过2秒,否则该用例不得分;
2. 要求程序能按照输入样例的格式读取数据,按照输出样例的格式将运行结果输出到标准输出上。如果不能正确读入数据和输出数据,该题将不得分;
3. 该题共有15个测试数据集,均满足n<=10,m<=10。每个会议最多有10人参加;
4. 该题目30分。

4.SQL中的SELECT语句

SQL中的SELECT语句用于从数据库中查询记录。某个工程项目数据库中有一个所有数据均为字符串的表,需要查询一些满足条件的记录数。本题考虑SELECT语句的简化形式,相关语句格式如下:

1. 计数语句,查询满足条件的记录条数。有两种格式:
格式1:SELECT COUNT(*) WHERE <条件>
格式2:SELECT COUNT(*)

2. 子集选择语句,选择满足条件的记录并组成一个集合。有两种格式
格式1:SELECT * WHERE <条件>
格式2:SELECT *

c1q4

Google Translate的错误

05月 4th, 2007

CnBeta上看到一条新闻说Google Translate翻译中文“物极必反”的结果是Taiwan independence……
[quote] 全文翻译的难度远远不同于只能查找翻译单个字词类的词典 – 那只是一个固定的数据库,把对应的字词储备好供人们调用即可。全文翻译需要通过服务器对海量的多语言数据进行对比学习 (例如通过研究一篇文章在联合国上被翻译成的 N 种文字),以找到不同语言之间的语法和文字对应规律,而大家多少都知道外国人说话的句子结构、语法、时态等等,跟咱中国人很不一样啊! 如果 “what did Enron do?” 被按照单词直译成 “什么做安然做?”, 我们中国加入全球市场这件事基本也就可以歇歇了。这种用程序通过对海量的多语言数据进行对比学习、以找到不同语言之间的对应规律的方式,学名叫做 machine learning,即机器学习或识别。 虽然目前 Google 的智能机器识别能力和全文翻译功能已经在全球被公认为质量最好,它大概平均也只能达到一个英文还不错(但词汇量可能巨大)的中国高中生的翻译水准。目前 Google 翻译可以处理得最好的应该是那些行文语法比较严谨标准的新闻和学术文章,把他们从英文翻译到中文,而比较准确地从中文翻译到英文似乎还有更长的路要走。 [/quote]
网友的回复大多比较偏激,不过这个翻译答案的确比较诡异,再试着翻译Taiwan independence疑问就是正确的。抑或Google Translate是基于Google的网页数据库,而在提到物极必反的网页里或许同时提到Taiwan independence,于是就把2者就联系起来?不论怎样,都会对谷歌产生一定的负面影响,联想到上月谷歌拼音词库的问题……
machine learning是Artificial Intelligence的一个方面,我和E.T都对AI有很强的兴趣,但AI的研究不是那么简单的,我们也正尝试着一些最基础的东西。