Monday, November 9, 2009

Cygwin

Cygwin下安装swig包:

下载:swig tar包

解压:
tar -xvzf # extract tarred, gzipped in current directory

* -x - extract files from an archive
* -v - verbosely list files processed
* -z - filter the archive through gzip
* -f - use archive file

安装:
5. SWIG on Cygwin
5.1 Installing SWIG
Go to www.swig.org/download.html and download swig-x.xx.x.tar.gz. Check INF5660 for required version.
Extract the archive, change to the directory and install by typing these commands:

$ ./configure
$ make
$ make install
5.2 Test SWIG
Test SWIG by typing $ swig -version (swig -help for options and help):

http://folk.uio.no/hpl/scripting/cygwin-install/winpy4cs.html#2


Cygwin Cheat-Sheet
http://www.voxforge.org/home/docs/cygwin-cheat-sheet

2.整合cygwin命令到Windows中
假设cygwin安装在d:/develop/cygwin,则将d:/develop/cygwin/bin添加到系统变量PATH中(最好加在 windows前面,这样的话,有些相同的命令的话,是先执行cygwin的命令,而不是windows命令,比如find),就可以直接在 cmd.exe下面执行tar czvf xxx.tgz ./基本上所有的命令都可以用了,包括ls,more,less,find,grep等。

Friday, April 10, 2009

[zz]An API for Google Image Search

http://www.codeproject.com/KB/IP/google_image_search_api.aspx#

[zz]靠写iPhone程序发财的三个故事

靠写iPhone程序发财的三个故事

Apple iPhone

苹果的软件商店已经有数万个程序,很多人也因此翻身发家,news.cnet.com就报道了三个这样的故事.
第一个:iShoot, 去年八月,SUN的工程师Ethan Nicholas 与老婆Nicole一度为钱伤脑筋,房贷快付不出来、小孩子的医疗费又不断累积,加上SUN又冻结了当年度员工分红,Nicholas不得不开始寻找新工 作,还开始委托出售自己的房子.但之后他突然想起曾读过一篇文章,有个家伙因为写了一个iPhone电玩应用叫Trism而赚了25万美元.“我那时想 说,只要有其中的一点收入,就够我撑过这段时期了.”他说.

现年30岁的Nicholas虽然有多年撰写程序经验,但却从没用过 iPhone的程序语言Objective-C,他自己上网找数据,了解苹果 iPhone软件开发工具的使用方式.由于他从小喜欢玩射击电玩,因此他决定朝这方面进行,他画了一些图画,又去图库网站购买了很便宜的图片与声音文件. 有六周时间,他每天早、中、晚都在工作,白天在SUN进行Java开发,下午作他的iPhone项目,傍晚则帮他老婆照顾两个小孩,有时还得一手不断在计 算机上敲键盘,另一只手则摇着最小的孩子的Gavin的摇篮让他入睡,或者抱着放在膝盖上的老大Spencer.

完工后,Nicholas送给苹果审核,也很快就通过,iShoot这套应用在10月19日正式出现在苹果应用商店上.他于是在线查看苹果的账户,看看卖 出几套应用,结果Nicholas的下巴差点掉了下来:头一天,每套4.99美元的iShoot让他实质赚进1000美元,他说,他跟老婆 Nicole几乎“真的跑到街上跳舞去了.”

第二天的销售额度为2000美元.第三天,金额掉到50美元,之后连续几周每天都是维持这样的金额.“这也算是不错的小钱,但我不断思考能否做得更好.”Nicholas表示.

今年一月,他又推出一个免费版本,但功能较少,希望藉此刺激付费版本的销售量,结果策略成功,iShoot Lite被下载次数超过200万次,许多人都升级为付费版本,且现在价格只需2.99美元.在最高峰的时候(1月11日),iShoot一天卖出1万 7000套,为Nicholas一天带来3万5000美元收入.

“当下我立刻想到我的老板,我打电话过去跟他说,我们得谈谈.”Nicholas表示,“我说我要辞职了.”

第一个iPhone是在2007年六月出现,但实际到了2008年七月,iPhone用户才开始可透过苹果的App Store(苹果应用商店)下载或购买软件.Nicholas靠着iShoot,五个月内赚进80万美元,但这或许不是常态.iPhone应用商店目前有 超过2万5000 款应用程序,许多人写的程序可能根本都不会被注意到.但这股旋风已经形成,即使成功得靠运气,许多人一窝蜂跑去上有关iPhone程序的课程与会议.比如 史丹佛大学去年秋季在大学部开了一堂课程叫“Science 193P: iPhone Application Programming”,结果50个名额引来150名学生报名.

这股iPhone开发旋风有人以硅谷当年的dot-com兴盛期相比, 创投合伙人Matt Murphy手下有一个1亿美元专门保留给iPhone应用的iFund创投资金,他表示,“大家发现,只要花几块钱在车库里做开发,你或许就是下一个 Facebook了.行动开发现在还算早期阶段而已,未来还会更热.”

第二个:iSteam

另一个成功例子是住在伦敦的希腊创业者Kostas Eleftheriou,他跟另外两个朋友花了七天写了一个iSteam程序,结果三个月内就创下10万美元收入,这个软件只是会让iPhone镜面如同 浴室镜子一般起雾.这只是个很简单的小把戏,若你用手指划过手机表面,iSteam会模拟雾面被划过的声音,十分逼真.若你把手机放侧边,还会产生水珠滴 下.“实在太逼真了”,Eleftheriou表示,“大家都想秀给朋友看.”

这套应用去年12月登上App Store,而现年25岁的Eleftheriou已经决定终止研究所学业,专职做iPhone开发.他跟另外两位朋友Vassilis Samolis 与 Bill Rappos(都是22岁)成立了一间公司GreatApps,另聘请了两名开发人员.

第三个:Trism

iSteam团队跟前述的Nicholas都是受Steve Demeter成功的激发,现年30岁的Demeter写了一个Trism应用,他在去年七月放入App Store,投两个月就赚了25万美元.他立即辞去Wells Fargo的软件工程师工作,自行成立了iPhone游戏开发公司Demiforce.Demeter表示,写这些程序花不了多少钱,但花大钱也不见得保 证会成功.

当然,这股风潮,其它手机与软件商也注意到了,上周Research in Motion便推出了BlackBerry的应用商店;Google最近也开始销售Android的应用;Nokia已经打算跟进;微软则会打造一个给 Windows Mobile手机使用的软件商店.

至于Nicholas呢?他已经带着家人去华盛顿度假,找了一个保母来看小孩,还创立了一家公司Naughty Bits Software,未来要继续开发iPhone应用(目前他是唯一员工).另外还有投资者与知名电玩公司找他要赞助未来的计划.

驱动之家编译

Tuesday, April 7, 2009

[转载]Dreamweaver正在死亡

我已经收到了很多关于我最近一期数码设计专栏的非常善意的电子邮件,但是我不得不承认,其中有一些让我感到些微不爽。


这些邮件是设计者们为了感谢我而发的,当他们从印刷物设计转移到网页设计的时候,我曾为他们指向了Dreamweaver的道路。他们已经对Dreamweaver心怀感激好多年了,它为他们的网页设计职业提供了最好的平台,感激是他们的心意。



但问题在于:Dreamwveaver正在走向死胡同……


公平地说,这不是Dreamweaver的错,也不是Adobe和它的开发团队的问题——最新的Dreamweaver CS4 是近几年最令人印象深刻的发行版本。此外,尽管 Microsoft Expression Web 看起来比 FrongPage 摆出了更具实质威胁的姿态,Dreamweaver依然是最棒的基于HTML/CSS网页的好用编辑器。


Dreamweaver和它的用户们真正的问题在于:网络的本性就是变化太快。各种动态生成的网络应用,从巨擘Amazon到普通的blog,它们都在提供多得多的功能——内嵌的评论,投票,Rss feeds,等等——比起基于静态HTML建立的最佳网站能够提供的。


这不是附加功能的问题,而是完全基础性的改变。从根本上来说,一个网站是内容为王的——发布内容并让它可以被找到——对于这两个核心任务,Dreamweaver 和其它静态HTML编辑器已经被证明有基础性的缺陷。


根 本原因在于旧模式不是可扩展的或者有活力的,网站核心管理员需要手工制作每个网站的每个页面,更糟的是,还要手动添加必要的导航帮助用户找到内容。未来唯 一可行的做法是内容贡献者都可以发布内容,不管他是站长还是访客,而最好的导航应该围绕着用户不断贡献的动态内容而被构建。


换言之,web2.0不是一个空口号,它和过去从根本上分道扬镳,而Dreamweaver站在了错误的一边。那么,这就是Dreamweaver和以Dreamweaver为生的传统网页设计师的末日吗?


最终会是。在不久的将来每个网站都将成为一个动态生成的网络应用,而今天所有基于多重静态网页建立的站点都将会被挤掉和替代。


好消息是,对于坦然接受这个事实的网页设计师而言,这个过程中其实蕴藏着一个巨大无比的机遇——想想克朗代克淘金热吧。


这 是可以做到的。就像Dreamweaver易化了平面设计师进入基于标记语言的HTML新世界的迁移一样,Joomla和Drupal这样的内容管理系统 易化了静态Web 1.0设计师转向基于php脚本的web2.0新世界的迁移过程。多关注它们一些,你将为你能够做到的东西感到惊奇,而且整个过程你不会碰到一行代码。


我不知道该如何极力推荐这一点。如果你是一个Dreamweaver使用者,不要为升级到最新版本和探究Adobe移植末端用户贡献到dreamweaver的无益尝试而感到烦恼,而是应该节省金钱并把时间投入到认真研究网页设计的真正未来:基于服务器的内容管理系统。


Dreamweaver 正在死亡,Drupal万岁。

前不久美国政府的一个官网使用了Drupal开源CMS系统。

【作者简介】

Tom Arsh,资深设计师,1987年自爱丁堡大学(Edinburgh University)毕业后即成立自己的公司Online Design,走上设计师之路。

Wednesday, April 1, 2009

转载:在导师论文心目中论文的标准

发信人: sihan (urrent Contents - Engineering, Computin), 信区: Doctor
标 题: 在导师论文心目中论文的标准
发信站: 日月光华 (2009年03月31日15:33:57 星期二), 站内信件



这是中科院动物研究所王德华老师在他的博客里写的,王老师写的非常好,非常详细,
读了以后很受用,所以原文转载过来,希望能有更多的人从中受益。以下是原文:



王德华



每年答辩季节都要评审学位论文,每年自己学生的论文也都反复修改。但无论怎么细心
,错误总还是有。遗憾依旧在,只是换新人。



那么什么样的学位论文才是好论文呢?实际上大家也很明白,心里也都清楚。网上每年
公布的国家优秀博士学位论文,科学院的优秀博士学位论文等,都是些典范(尽管也有
些被指出有一些缺点,总体看应该是没有大问题的)。有些海归回来的教授们的论文自
然也是优秀的。样板处处有。



作为交流吧,我还是想从一个导师的角度,针对我接触到的国内的学位论文情况,谈点
粗浅的看法,希望对我自己的学生和其他感兴趣的研究生有些益处。就以流水帐形式写
吧。



题目:学位论文题目要简明、确切,不罗唆,不冗长。评委或读者一看题目就知道你的
主要工作。有些同学是在博士期间做了几个不同的内容,这样题目就很难表达准确题意
。可以突出一点,但不要将不是很密切的几个内容都写在一个题目上。还有些论文是几
个不相干的内容,这样题目就更难定了(这种设计本来就先天不足)。不管怎样,一个
题目就是一个主题,只能有所舍取。如果都罗列上,实在是不伦不类。还有些论文是一
个大主题下的一点点工作,如果需要,可以以副标题的形式给出更多的信息。

特别提醒:注意论文题目可千万不要有错别字,尤其是在封面上。



摘要:简明扼要是主要的。摘要是一篇论文的浓缩和精华。内行的人看摘要就知道你的
主要发现和结论,外行的人也能了解你做了什么,得到了那些重要发现。因此,选题的
意义(理论和应用),用什么方法(尤其是先进设备和技术)做了哪些工作?获得了哪
些主要结果和结论?是摘要的主要内容,但不需要罗列很多。一篇学位论文不可能有很
多重大发现,但是一篇学位论文没有一点闪光的地方也是不可能的。因此要下功夫挖掘
自己结果的重要性和结论的重要性。

特别提醒:一篇论文切忌没有结论。



英文摘要:最基本的要求是要可读,没有语法错误 (readable and correct English),
如果语言地道那就最好了。一旦语法、拼写、时态、单复数、语态等等,出现多个不足
,一般读者就没有欲望再读下去了。



前言:有些学位论文有一个大前言。所谓大前言,就是相对每个章节而言,每个章节内
往往还有一个前言。前言要讲清楚研究背景,论文涉及到的研究内容的相关进展,主要
是学说、理论等方面的发展,国内外现在存在的争论,遗留的问题等等。然后要介绍所
研究的对象,相关的研究积累,已经有的主要发现,还没有解决的问题或者值得进一步
解决的问题。根据积累和国内外学科领域的发展,围绕感兴趣的科学问题,提出科学假
说(Hypothesis),根据科学假说,提出预测 (Prediction)等。这也就是研究的目的了
。选准了问题,目的就明确了。许多论文是没有问题,没有假说,只是说国内还没有相
关资料,因此我就做了。现在的科学(尤其是生物科学),多数是以假说驱动的研究(hy
pothesis-driven),达尔文时代的那种博物学(Natural history)式的研究还是很重要,
但是已经不是主流了。因此,如果你从事的不是野外考察研究,不是需要经过大量的考
察和积累后才能获得一些结论性的内容的研究的话,一定要注意当今这种“问题-假说
-预测-设计-实验-数据分析”的流程思维的培养。

在前言中,要注意告诉读者这项研究在科学上的重要意义在哪里,相关结果在科学发展
上会有哪些贡献。如果对国计民生有重大贡献是一定要说明的。

特别提醒:切忌前言写成堆积文献而没有介绍研究背景。研究意义和目的一定要明确突
出。所引用的图表一定要注明出处。



材料和方法;这部分是相对容易写的。用什么设备,什么技术,什么配方,测定哪些指
标等等。但是论文写作还是要有逻辑的,首先不要写成大学的实验报告,有些学生将使
用的化学试剂列一个表,注明公司和产品信息等。这没有必要,也不能这样写。应该是
将相关信息融在文字里面,如测定什么指标,用什么试剂,在什么设备上测定,这样就
将参数、试剂、仪器、方法等连起来了。再者,生物学实验是有内在逻辑性的(其他学
科不清楚),如生理学实验中,如果动物还没有处死,就不能先描述血液激素等的测定
方法、组织线粒体的测定方法等,还是要按照常规逻辑进行,如实验动物来自哪里?如
何饲养?饲养条件(温度、光照、食物成分、笼具规格… …),怎么进行实验处理?处
理时间?收集哪些参数和指标?什么时间收集?什么时间处死动物?器官组织如何处理
?… …这些信息都需要详细给出,不能简略,还有注意内在逻辑性。值得提醒的是,如
果不是自己创立的方法,所采用的方法和技术的描述一定要列出相关的参考文献。

生物学研究中当今特别关注数据统计。统计方法的描述要特别注意,不同的参数类型要
使用不同的分析方法,要说明具体的分析方法。如行为学数据不是正态分布的数据,有
些数据是同一批动物在不同时间取样(重复性测定数据),有些是季节采样(有不同动
物,也有相同动物通过标记进行季节采样),有些数据是百分比… …具体的数据采用什
么统计学方法是需要注意和描述清楚的。

材料方法部分与前言部分是密切相关的,前言中计划要验证的相关假说,需要什么样的
实验处理,测定哪些指标才能实现,这些信息就需要在材料和方法部分详细介绍。

特别提醒:材料和方法切忌简化、他人不能重复。每个方法如果不是独创,都要有来源




结果:这是论文最精华的部分,是多年辛苦劳动的成果。有些同学喜欢按照不同的章节
进行描述,这是可以的。每个章节可以独立成文,在每个章节内的前言就需要更加具体
化,科学问题也就更直接和具体。方法介绍也是更具体细致。

结果部分也要注意逻辑性,先说什么,后说什么,要层次清楚。基本要求是图表要美观
,用图表表示结果的目的就是要将研究结果表述得一幕了然,如增加还是减少,变化趋
势如何,相关关系等等。但要注意有些数据是不能用折线图的,只有连续的数据才能用
折线图。图的设计和美化过程很重要,字体、线段粗细等等,这些都是要花费很大功夫
的。统计学信息要详细给出来。

要时刻记住:结果是针对问题来的,结果是经过相应的实验设计,经相关处理后获得的
,收集数据的过程自然是要严格仔细,数据要确保真实可信,这才是好的结果。

特别提醒:切忌在结果部分只有图表,没有文字描述;或者在文章中有描述,但没有说
明数据在哪里(相关图表)。



讨论:这部分是在结果的基础上进行的升华。首先主要结果和结论要突出出来,然后分
析其合理性、重要性,有哪些证据支持,提高在那里,发展在那里。在学科领域内的贡
献是什么。同时一定要结合前言中提出的假说和预测。告诉读者,你的研究结果是支持
了所提出的假说,还是拒绝,还是中性。



每个结论性的内容,只要是引自文献,一定要给出出处。文献引用要阅读原文,尽量不
要转引,起码要看看原文的论文摘要。现在许多引用与论文中的内容不沾边,或者是错
误引用。同时正确理解原文也是很重要的,一旦理解错误,也是很大的问题。



在分析自己的结果的时候,在生物学中,还要注意掌握生物体的基本生物学特性,如分
布在那里?食性?是否冬眠?分类地位?生境情况,气候情况等等,不注意这些信息,
或者不了解这些信息,许多科学问题是理解不了的,也是解释不好的,即使有好的结果
也很难得出好结论。这些可能适合宏观生物学领域。



讨论部分要就事论事,忌讳堆砌文献,罗列一长串,不知所云。避免总是介绍国际上已
经获得了哪些结果,最后没有很好地将这些信息用于分析自己的结果、阐述自己的结论
上。



作为生物学研究,由于研究的哲学不同(生物有其特殊的生物哲学,著名科学家迈尔有
过详细阐述),因此一个生物学现象应该力求给出近因(Proximate cause)和远因(Ul
timate cause)。一个生物学现象,不从这两个方面进行阐述,会有很大的不足。生物
哲学这一点是与物理哲学等不同的,也就是说,一个生物学现象我们给出导致这种现象
的原因后(所谓的机理性研究,如分子生物学、基因组学研究等),还要解释为什么会
有这种现象(进化上的解释)。我们测定的是一个瞬时的生态学、生理学、生物化学或
者分子生物学指标,但是这个指标所反映可是无数个世代后的一个现象,这个无数个时
代的进化过程中到底发生了哪些事情?是需要我们分析的。



如果论文结果以多个章节进行展示,在每个章节中最好有个小结,总结本章的主要发现
和结论。有时也可以指出实验的不足或需要补充的内容。

特别提醒:讨论要有主次,切忌面面俱到、处处不深入、含含糊糊。



结语:建议全文有个结语部分(不见得都需要)。结语是全文的总结,再次提醒读者你
所研究所获得的主要结论,重要贡献,不足,以及建议可以进一步开展的相关内容。注
意的是,结语不要与摘要重复,不要与每个章节的小结重复。太多的重复是非常忌讳的




文献综述:文献综述是反映学生掌握文献的情况,对国内外发展所掌握的情况,对文献
的过滤和综合能力。

特别提醒:不要涉及面太广、太大。要围绕几个主题展开。论文的研究内容是以文献综
述为基础的。一定要注意引用:图表的出处,每个结论的出处。



参考文献:这部分往往容易出问题,主要是由于不细心导致的。首先,在论文内引用的
文献,在参考文献部分一定要列出来;反之,参考文献中列出的每篇文献,必须都是文
内引用的。前后一定要一致。参考文献的引用要精,不是越多越好。实际上许多学生是
根本没有阅读那些文献。既然没有阅读,列上干什么呢?你参考了吗?如果没有参考,
怎么放到了参考文献中去?关于细节问题,只要细心就不会有作者姓名错误、刊物名称
错误、动物名称错误、页码错误、大小写错误等等。我有个建议,参考文献中的中文文
献最好列在英文文献的前面,且最好是按照姓氏笔画排序。有些同学说按照拼音排序不
是一样吗?我的观点是我们的中国字,顺序是笔划,不是拼音。只是个人的爱好而已,
至少我学生的论文都是建议他们这样排序的。



致谢:这部分我们一定要强调和重视。我已经有篇博文说明了如何写论文的致谢部分。2
0多年的求学之路,拿到了学术界最高的学位,说不兴奋是假的。但是这部分一定是要真
情流露,要用心去写,尽量不要有遗漏,但也忌讳说过头的话。有些师生关系、同事关
系、同学关系等不是很融洽的,在这个时候,研究生要胸怀宽广一些,人家以前帮助过
你,你还是要致谢的。这毕竟是写在纸上的,如果由于狭隘的思维,对于帮助过你的一
些人故意不致谢,也许在以后的某一天,你想挽回,但已经没有这种可能了。因此还是
要学会宽容,要海纳百川,不要留下任何情意上的遗憾。特写要说明的是,研究生的学
习生活主要在研究组内,平时跟研究生管理部门接触不多,甚至有些同学也就是入学时
报个到,毕业时办个手续。但是,平时所有的研究生事务管理,研究生管理部门的老师
们是很辛苦的,从入学、录取,一直到毕业,他们都在默默忙碌着,毕业时刻,应该好
好谢谢他们。对于研究室的实验人员、仪器管理人员等等,都是需要记住他们的帮助,
给以谢意的。这方面就不多说了。

提醒:对于师兄师姐的感谢,如果他们还没有获得博士学位,可千万不要称他们为博士
,这样他们自己会很尴尬的。



个人简历:提醒一点,就是不要夸大自己的简历。发表的论文,要实事求是。已经完成
初稿的,或者已经投稿,或者已经返修,或者在印刷中等等,要实事求是列出来。连初
稿都没有完成的,如果只是一个意向性的题目,就没有必要罗列出来了。



总之,学位论文的数据一定要真实,结论一定要适中,不要有虚假成分,不要有夸大的
成分。好的成果,重要的发现,是不会被埋没的。当然一篇好的学位论文最重要的是学
术价值,形式表面的东西是为重要成果服务的。记住一篇博士论文要考虑和保证三点:


1.你的研究对所从事的领域有什么贡献?

2.这种贡献是否是重要的?

3.你的贡献是否是原创性的?



以上是随想,有很多不足。我也看过一些国外的研究生的学位论文,在格式上、结构上
等等都各不相同。因此什么样的学位论文是好的,没有一个统一的具体标准。但是实际
上,在现实中人们的心目中又确实有一个标准。



作为交流和参考,没有认真修改,不当指出,欢迎批评指正。



在这里我把王老师的博客地址也贴上来,没有通过王老师本人的同意,希望王老师知道
了不要介意,因为我着实觉得老师这里有很多好的东西值得我跟朋友们共同学习,我在
这里先谢谢老师了^_^。http://www.sciencenet.cn/blog/wangdh.htm

Thursday, March 12, 2009

[转载] 介绍几本数学书

original link:http://dahua.spaces.live.com/blog/cns!28AF4251DF30CA42!2496.entry#comment

前面几篇谈了一些对数学的粗浅看法。其实,如果对某门数学有兴趣,最好的方法就是走进那个世界去学习和体验。

这里说说几本我看过后觉得不错的数学教科书。

1. 线性代数 (Linear Algebra):

我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年级的时候就学习了这门课,后来到了香港后,又重新把线性代数读了一遍,所读的是

Introduction to Linear Algebra (3rd Ed.) by Gilbert Strang.

这本书是MIT的线性代数课使用的教材,也是被很多其它大学选用的经典教材。它的难度适中,讲解清晰,重要的是对许多核心的概念讨论得比较 透彻。我个人觉得,学习线性代数,最重要的不是去熟练矩阵运算和解方程的方法——这些在实际工作中MATLAB可以代劳,关键的是要深入理解几个基础而又 重要的概念:子空间(Subspace),正交(Orthogonality),特征值和特征向量(Eigenvalues and eigenvectors),和线性变换(Linear transform)。从我的角度看来,一本线代教科书的质量,就在于它能否给这些根本概念以足够的重视,能否把它们的联系讲清楚。Strang的这本书 在这方面是做得很好的。

而且,这本书有个得天独厚的优势。书的作者长期在MIT讲授线性代数课(18.06),课程的video在MIT的Open courseware网站上有提供。有时间的朋友可以一边看着名师授课的录像,一边对照课本学习或者复习。

http://ocw.mit.edu/OcwWeb/Mathematics/18-06Spring-2005/CourseHome/index.htm

2. 概率和统计 (Probability and Statistics):

概率论和统计的入门教科书很多,我目前也没有特别的推荐。我在这里想介绍的是一本关于多元统计的基础教科书:

Applied Multivariate Statistical Analysis (5th Ed.) by Richard A. Johnson and Dean W. Wichern

这本书是我在刚接触向量统计的时候用于学习的,我在香港时做研究的基础就是从此打下了。实验室的一些同学也借用这本书学习向量统计。这本书 没有特别追求数学上的深度,而是以通俗易懂的方式讲述主要的基本概念,读起来很舒服,内容也很实用。对于Linear regression, factor analysis, principal component analysis (PCA), and canonical component analysis (CCA)这些Learning中的基本方法也展开了初步的论述。

之后就可以进一步深入学习贝叶斯统计和Graphical models。一本理想的书是

Introduction to Graphical Models (draft version). by M. Jordan and C. Bishop.

我不知道这本书是不是已经出版了(不要和Learning in Graphical Models混淆,那是个论文集,不适合初学)。这本书从基本的贝叶斯统计模型出发一直深入到复杂的统计网络的估计和推断,深入浅 出,statistical learning的许多重要方面都在此书有清楚论述和详细讲解。MIT内部可以access,至于外面,好像也是有电子版的。

3. 分析 (Analysis):

我想大家基本都在大学就学过微积分或者数学分析,深度和广度则随各个学校而异了。这个领域是很多学科的基础,值得推荐的教科书莫过于

Principles of Mathematical Analysis, by Walter Rudin

有点老,但是绝对经典,深入透彻。缺点就是比较艰深——这是Rudin的书的一贯风格,适合于有一定基础后回头去看。

在分析这个方向,接下来就是泛函分析(Functional Analysis)。

Introductory Functional Analysis with Applications, by Erwin Kreyszig.

适合作为泛函的基础教材,容易切入而不失全面。我特别喜欢它对于谱论和算子理论的特别关注,这对于做learning的研究是特别重要的。 Rudin也有一本关于functional analysis的书,那本书在数学上可能更为深刻,但是不易于上手,所讲内容和learning的切合度不如此书。

在分析这个方向,还有一个重要的学科是测度理论(Measure theory),但是我看过的书里面目前还没有感觉有特别值得介绍的。

4. 拓扑 (Topology):

在我读过的基本拓扑书各有特色,但是综合而言,我最推崇:

Topology (2nd Ed.) by James Munkres

这本书是Munkres教授长期执教MIT拓扑课的心血所凝。对于一般拓扑学(General topology)有全面介绍,而对于代数拓扑(Algebraic topology)也有适度的探讨。此书不需要特别的数学知识就可以开始学习,由浅入深,从最基本的集合论概念(很多书不屑讲这个)到Nagata- Smirnov Theorem和Tychonoff theorem等较深的定理(很多书避开了这个)都覆盖了。讲述方式思想性很强,对于很多定理,除了给出证明过程和引导你思考其背后的原理脉络,很多令人 赞叹的亮点——我常读得忘却饥饿,不愿释手。很多习题很有水平。

5. 流形理论 (Manifold theory):

对于拓扑和分析有一定把握时,方可开始学习流形理论,否则所学只能流于浮浅。我所使用的书是

Introduction to Smooth Manifolds. by John M. Lee

虽然书名有introduction这个单词,但是实际上此书涉入很深,除了讲授了基本的manifold, tangent space, bundle, sub-manifold等,还探讨了诸如纲理论(Category theory),德拉姆上同调(De Rham cohomology)和积分流形等一些比较高级的专题。对于李群和李代数也有相当多的讨论。行文通俗而又不失严谨,不过对某些记号方式需要熟悉一下。

虽然李群论是建基于平滑流形的概念之上,不过,也可能从矩阵出发直接学习李群和李代数——这种方法对于急需使用李群论解决问题的朋友可能更加实用。而且,对于一个问题从不同角度看待也利于加深理解。下面一本书就是这个方向的典范:

Lie Groups, Lie Algebras, and Representations: An Elementary Introduction. by Brian C. Hall

此书从开始即从矩阵切入,从代数而非几何角度引入矩阵李群的概念。并通过定义运算的方式建立exponential mapping,并就此引入李代数。这种方式比起传统的通过“左不变向量场(Left-invariant vector field)“的方式定义李代数更容易为人所接受,也更容易揭示李代数的意义。最后,也有专门的论述把这种新的定义方式和传统方式联系起来。

————————————————————————————

无论是研究Vision, Learning还是其它别的学科,数学终究是根基所在。学好数学是做好研究的基石。学好数学的关键归根结底是自己的努力,但是选择一本好的书还是大有益 处的。不同的人有不同的知识背景,思维习惯和研究方向,因此书的选择也因人而异,只求适合自己,不必强求一致。上面的书仅仅是从我个人角度的出发介绍的, 我的阅读经历实在非常有限,很可能还有比它们更好的书(不妨也告知我一声,先说声谢谢了)。