【原文转贴】如何写论文:论文的起点

又到了写论文的季节。下面这篇文章不是我写的,而是我求学时代看到的文章,算起来也是好几年前了。这篇文章的作者,是时任台大资管系主任庄裕泽教
授,在看过研究所同学的论文proposal之后,有感而发对实验室同学写下的信。当年这封信只在实验室同学、学弟妹、好友间辗转流传,而现在这篇文章的
刊出,已经过老师的同意,用意是希望与更多朋友分享。〈文章最后改了一点字句,主要是实验室的相关细节资讯,删去与本文主旨无碍〉

◎ ◎ ◎ ◎ ◎
Dear all:

今年的proposal我用较高的标准来衡量,因此大部份的人都得再花一点时间修正。我的用意是与其等到四、五月你们写论文时再要求你们改进,不如
利用这个寒假好好督促你们把论文的前三章写得完整。我大致翻了所内今年提出的proposals,我们实验室的成员大部份只在平均附近(或者低些)。我想
如果再不严格督促你们,我们以后恐怕无法再以LAB成员自豪。

我大概跟你们提过如何写proposal,但可能不是很有系统。为了让你们能把proposal及论文写好。我花了一点时间整理自己的心得,供你们参考。

论文大致上有五、六章。第一章是Introduction,这一章通常只佔论文整体篇幅的十分之一,却是最关键的一章;它就像一个物品的包装一样,
即使结果再好,但包装差,也会让整篇论文顿时失色。在国际会议论文的审稿过程中,很多委员往往仅从Introduction中评断论文是否值得接受。
Introduction要如何写好是需要一些天份与努力的,基本上它就像在写作文一样,要有强而有力的开头,在前一、二段就能带领读者进入你要研究的领
域。接下来的几个段落,你必须替读者建立足够的background,让他们了解你论文的研究背景。Background建立好之后,你必须点出整个研究
的动机,这是最关键的地方,动机不足,无法显示你研究的重要性,变成无病呻吟,甚至连呻吟的声音都听不到,不晓得你到底要做什么。动机点出来之后,通常就
会说明你的研究成果及主要贡献,也就是论文的价值之所在。在Proposal阶段,这部分会以预期的方式来呈现。最后,你会花一段文字来说明整个论文的架
构,并做为第一章的总结。

除了动机要强之外,第一章一般比较容易犯的毛病是研究背景给的不充分,以及与研究动机没有连贯性,研究背景漫无边际的讨论,然后“天外飞来”你的研
究动机。切记一点,写研究论文逻辑一定要清晰,整个章节的构思逻辑是什么、为何这个句子要承接上个段句子、这个段落要承接上个段落等等,一定要清楚的思考
过。许多论文的败笔在于论文东一段、西一段,段落之间没有逻辑关联,让论文整体杂乱无章。如何避免这样的问题,如果你没有天份的话,只好靠后天的努力:对
于论文返覆的读取,不厌其烦的思考句子、段落之间是否有逻辑上的问题。我个人的经验是,我自己写过的文章,每读一次都有新的体会与修正。一篇论文写完之
后,我都会再从头到尾读一次,修改到我最近一次读过后没有新的修正为止。这样通常会经歷四、五回合以上。我最不喜欢见到的是学生论文写完之后,从头到尾连
一次都没看过就送给我,里面错误百出,甚至连基本的连结 (cross
reference)都错,好像要我帮他校稿一样。你们有些人也有这样的毛病,这样的毛病不改是做不好学问的。以后我看到这样的论文马上就退。我以前念书
的时候跟指导教授meeting讨论论文时总是战战兢兢,在给他看我的论文时我自己会来回看好多次,深怕犯一些明显的文法或逻辑错误,或他曾经指正过我的
错误,我也藉此训练出比较独立的研究能力。这里我感觉大多数的学生都比较缺乏独立的研究能力,有些则完全依赖指导教授替他修改论文,甚至觉得理所当然,这
是相当不正确的研究态度。

第二章是文献探讨。在写这章前一定要仔细思考你要探讨哪些相关文献,这些相关文献如何分门别类,然后在第二张开头以约一页的篇幅描述你要
survey的内容、范围与架构。当然,你得提供充分的理由说明为何你要做这样的组织分类。文献探讨要做的好是一门学问,它并不是把一些相关的文献看过,
然后对每个文献作摘要即可。把相关文献做一个有系统的分类,本身就是一种贡献。一般而言,每个研究领域都可以拉的很广,你在有限的空间内不可能全部涉猎,
因此,你得设定一适当的焦距,决定文献探讨的领域范围。

在你设定的范围内一定有许多文献要探讨,你得将这些文献分门别类,每一类别选定一个最具代表性的文献做这个类别的开端。接下来你得摘要这篇文献的主
要内容与贡献,并且用比较简单浅显的方式让读者了解关键的技术。一般而言,这篇代表性的文献后续多少有些follow-up继续改进前人的结果。这时你大
致不需要针对每个follow-up做仔细讨论,只要用一、二句话摘要出每个follow-up改进之处即可。把比较重要的follow-up说明之后,
你应该以一段话做为这个类别的结论。这一段话必须评论目前在这类别的研究成果大致为何,还有那些不足的地方,以及与你的研究有何关联(如你会採用那些既有
的技术,你的研究方法或成果与它们有何差异,你的研究对这个领域的贡献为何)。

很多人的文献探讨只摘要了别人的成果,却少了最后这一段,无法让人了解你的survey与你的研究议题有何关联,也不晓得你对前人的成果看法为何。
另外一个比较常见的问题就是survey不深入犀利,讲得都是很表面得东西,让人家觉得看你的survey对这领域一点帮助都没有。

对每个类别survey完之后你必须对这整个章节做一个结论。在这个总结里,你必须匯整出这个领域里目前的研究进展,还有那些不足的地方,并且从此支持你在第一章提到的研究动机,以承接下一章节。

第三章基本上是要描述你的研究议题与方法。你必须清楚的描述及定义你的问题。有些时候,问题与定义会牵涉到你的系统或演算法所植基于的model,
因此你也必须定义你用的系统model为何,有那些假设的前题。接下来就是说明你的研究方法,所须的定义与所用的核心技术。接下来就是提出你对问题的解决
方案,并分析讨论它的优劣。在proposal的阶段基本上不必具体的提出解决方法,只要讨论你大致将採行的措施即可。但即使如此,在proposal的
阶段这一章也不能马虎的做表面的探讨。一定要具一定的深度,才可以让committee
的成员相信你对于你的研究议题有足够的了解。这一章写深入,你未来修改甚至更换研究题目的机率就低。

第四章通常是对于你在第三章提出的问题解决方案做一实证,如系统模拟,比较你的方法效能为何、与既有的方法有何差异。

第五章就是对论文做一结论,在这里你必须重覆你整个研究的动机,再叙述你的成果,然后说明你的研究价值与贡献。每项研究总有不尽完美之处,你的大概也不例外。因此,接下来你就要讨论你的研究成果或系统还有那些可以改进之处,据此引出未来研究方向。

第四、五章在proposal阶段是不必要有的。另外,根据研究议题的差异与研究成果的大小,有些论文(特别是博士论文)在讨论其研究成果时会分成两个以上的章节来说明,因此论文总体而言会有五章以上。

论文最后必须附上参考文献。这是大多数人最容易忽略的地方。因此,研究态度严不严谨也很容易从这个地方看出。我已经告诉过你们参考文献要如何编排,
应该会有那些栏位。你们要确实且详尽的去建立每笔参考文献。另外,参考文献的数目应该要适中。硕士论文我认为应该在30笔到40笔之间。博士论文可能多达
四、五十笔以上。但也不要过度夸大,把许多不相干的都放进来。当然,这些数目都不是绝对的,它会随研究领域和议题有所差异。

我再花点时间跟大家谈谈怎样做好survey的工作。(我用了约一天的时间整理这些东西,我的中打不好,昨晚打字打到清晨4点,只打了2/3,所以请你好好的看完!)

Survey是做好论文的第一步,也是关键的一步。Survey的目的大家都知道,就是要对研究的议题有个深入且广泛的了解,这样才知道目前在这领
域里研究的进展已经到什么地步,state of the
art是什么,有那些的子题及技术已经被探讨,从而也可以知道那些还可以开发,那些技术可以被你的研究议题拿来应用。Survey
做的不好,最致命的打击就是在你对你的研究议题一头埋入,花了许多心血,好不容易熬出一些成果之后,突然才发现别人早已经发表同样或类似的成果。

怎样才能把survey做的深入且广泛呢?我的方法是你要知道在这领域里主要的国际会议是什么,然后把这些会议近几年来(至少三年)所发表过的论文
的title及abstract浏览一次,找出跟研究议题比较相关的论文(注意:是「议题」,不是「领域」)。这样初步找出来的论文大概从十来篇到二、三
十篇,甚至也可能更多。接着,你得把这些论文的Introduction看一遍,对它们做个初步的浏览,然后把这些论文依它们与你的研究议题的相关性做个
大致的排序。接下来就是依序把这些论文仔细的研读,每篇论文的重点是什么,关键的技术又是什么,都得弄得很清楚。我的经验是:因为刚开始对研究议题较不熟
悉,前面几篇念起来通常较吃力。可是随着研读的论文愈多,你就会发现愈来愈轻松。

在这个阶段,你每篇研读的论文大概都是够水准的论文(因为他们是发表在主要的国际会议)。在研读这些论文的时候,你得看它们探讨那些相关的文献,这
些文献你大致都得知道,并且就其中与你研究议题最相关的论文,你也得找出来仔细的研读,并且重覆这样子的工作一直追溯下去。你不用担心这样做会无止无境,
因为当你从最近的一篇论文开始往前追朔,大概不超过三、四代,你就会发现不必再追朔,因为再往前追朔,你会发现它们要么与你的研究议题愈来愈远,要么就是
你研究领域的基本知识。如果是你研究领域应具备的基本知识,而你还不了解,那你应该回头再修一些课把基础打好,不该这么早就进入你想研究的议题上。

根据这个经验法则,你会发现你在survey的阶段只要把握一个原则:把与研究议题相关的最近几篇论文拿出来,看看这些论文所引用的文献有没有你不
知道的,如果没有,那么比这些论文早的文献你大概都没遗漏了。如果有,就把它们找出来仔细的研读。随着你研读的论文愈多,你的功力就愈增加。当你发现拿到
一篇新论文时只要看完它的Introduction之后,你就知道这篇论文的重点及猜出它用的主要技术之后,你的功力已经提昇到可以进入研究议题的阶段
了。在这个阶段,如果论文的研读够深入及广泛,你往往也可以发现新的研究议题。

你的survey还不能在这里停止,因为你的触角可能尚未含盖所有关于研究议题的文献。你目前只有survey与研究议题相关的主要国际会议(以及
会议论文所引用到的相关文献),这些会议通常不超三到五个。目前的国际会议相当多,而且有些会议的研讨议题又广,因此有可能两个会议的主轴不一样,但却含
盖类似的子题。举例来说,假设你要研究的是peer-to-peer系统上的资讯搜寻,你大概会找专门探讨peer-to-peer系统的国际会议。这个
目前大概有二、三个。可是你知道那里还有呢?我告诉你至少还有二、三十个可能:专门讨论分散式系统里的国际会议(这至少有五到十个,其中first
tier的约三、四个,其余为second
tier),讨论平行运算的国际会议(这至少也有五个),讨论网路与通讯系统的国际会议(这至少十个以上),讨论资料库与资讯检索的国际会议(这至少也有
五个),相信了吧!而且还有好多新的workshop你从未听过的。

你一定会问:一、我怎么知道有那些可能相关的国际会议;二、我怎么有办法消化完这些会议的论文?

第一个问题得从你第一阶段的论文研读着手。在研读这些论文的时候,你得注意它们发表在那里,从而知道有那些可能相关的国际会议。

第二个问题:如何消化与你的研究议题可能相关的国际会议内的论文?你把与研究议题相关的最近几篇论文找出来,看它们是在那一年发表的。如果你研究的
是热门议题,你找到的应该是去年或今年的论文;如果你的议题冷门,那最近一篇论文有可能是好几年前的事。不过不管是冷是热,你都只需把相关的国际会议最近
一、二年的会议议程拿来看看,有没有与你的研究议题相关的论文发表,有的话把论文找出来仔细研读一下这篇论文有什么突破,另外,也注意一下这篇论文引用的
参考文献有没有你尚未读过的,没有的话表示你前阶段的survey做的很仔细,有的话你就得把这些遗漏的论文找出来研读,并且用前面提到的方法再去追朔这
篇论文三、四代以内的参考文献,以及论文出处,找出是否还有其他的相关国际会议,并且一样得把这些会议近一、二年的议程拿来看看是否有相关的论文发表。这
些过程一定会收敛的,而当你发现没有新的论文被你找出来之后,你的survey工作大概已经做的差不多了,可以准备收工全心投入研究议题上。通常而言,你
在第二阶段找到的论文不会太多,大多数的论文在survey的第一阶段都会看到。收工之前,为防万一,你再到Google、Siteseer及几个主要的
digital
library,如IEEE,ACM,Springer等去search一下,确定没有漏网之鱼。如果你survey的深入,你应当知道要下那些关键字去
查询。这个步骤也可以确保如果你研究的是冷门议题,在你看到的最近一篇的论文,到近一、二年的国际会议这期间,有没有其他的论文你没有注意到的(因为你最
后一阶段的survey工作只注意相关会议最近一、二年的议程,而你看到最近的论文可能是好几年前的东西)。

在这里我好像都没提到期刊论文。一般而言,期刊论文通常比较完整,但刊登的结果往往是二、三年前的东西。就资讯科技而言,二、三年内的研究进展可能
很大,因此比较新的结果通常先发表在国际会议上,发表之后,经过几回合的修正才会投稿到期刊。所以你survey的论文比较新的东西很少会在期刊上发现。
但反之,比较久的成果,有可能已整理发表于期刊上。如果是如此,那你在研读这个成果时,最好是找已发表于期刊上的论文研读,这样会得到比较完整清楚的资
讯。

整个survey的阶段会看完几篇论文?这当然看你的研究议题而定。但三十篇以上是跑不掉的。如果加上你只浏览Introduction 的部分,那可能在五、六十篇以上。
最后,我要你们做一件事情:

在一星期之内,把survey的工作按照我上面讲的步骤重做一次。星期六之前,请你整理一个清单摘录下列资讯,并email给我 (记住:做完整之后再email给我;我不要片段片段的接收你们的资讯):

1. 与你研究议题相关的国际会议及期刊有哪些。

2. 你找到哪些论文,论文格式请整理成bib档格式(记住:我要的是bib档格式,且要非常完整正确。如何做到,可以问实验室学长。我也会请他整理一份心得告诉大家。)

3.
在你找到的论文里,请用另一份表格整理下列资讯:请就这些论文依其与你研究议题的相关性分成三类:密切相关、相关、略为相关。同时请标记哪些是你已经仔细
的研读过的,哪些是你只浏览Introduction ,但有把握住整篇论文的重点。若有尚未看完的论文,也请标记。

4. 请把你列出来的所有论文电子档以下列方式命名:

年代-会议或期刊缩写(若不知,请以第一作者的Last Name代之)-Title的摘要。

例如:2003-SIGCOMM-Peer-to-Peer Information Retrieval Using Self-Organizing Semanticverlay Networks.pdf

然后请你上传这些档案到ftp,你的个人目录底下的paper 子目录内。我会就你整理的清单去判断你的survey是否足够,再来决定你的proposal及论文应该还要做哪些工作。

Joung

◎ ◎ ◎ ◎ ◎

FROM http://mmdays.com/2008/12/29/start_of_thesis/

相关资讯:庄裕泽教授

超越考试:学习如何处理信息

 {摘自褪墨}

我平时读不少书,常常浏览一些博客
也上一些课程。这些让我了解足够多的新信息,用来改善我的工作,然而我却发现自己没有机会去记住所有的这些信息。有些时候,我甚至觉得所有那些信息消费如
同垃圾一样无用,因为,人类的大脑本来就不是为记住这些大量琐碎的细节并依此行为而设计的。不仅仅出于浪费时间的原因,我在大学里所学习的课程也已经足以
让我对于“遗忘”本身心生厌恶。

由此,我认为努力尝试对学到的东西加以处理
并且将之应用于现实生活之中,是一件值得的事情。我还在学校学习的时候,在学习新知过程中用到的技巧,在现实生活中却往往不怎么管用。那是由于,大量的学
习方法的目的都在于应对考试,或者,仅仅适用于课堂,在那里面,你会得到非常清晰的指示去应用哪些具体的知识点。而我们真正需要的是对问题更加实用可行的
解决方法。

  • 创造任务

阅读
时候,我会时常思考,我将如何把此刻新学到的知识应用于现实。我需要的是,我能做的具体的事情,去实践我所收获的一个新信息。我可能会为此做各种事情:例
如,若我正在看一篇博客文章,关于改善网站的十个技巧,我会直接把这十项技巧一一列入我的任务列表。但是如果我在读一本马克·吐温的自传,我会边读边不时
写下一些想法或类似的具体的文字,用于写博客或其他文章——最终它们会被我用在于指定日期前按时截稿的文章里。

我对任务的看法是比较冷酷的。我努力避免去设定不能让自己有所获益的任务。即使这样,我仍会使用一个任务列表,用于记下那些并非很有用的想法或工作。我把它当作我的“雨天”列表:当我没有任何别的事情做的时候,我就从这个列表上拉下来一个任务去完成。

 

  • 传递信息

出于某些信息的特殊性,有些人会将之秘而不宣,比方说藏宝图、重要的书册、等等——这些都是不得不承认的情况。然而,有了因特网,上述情形已经被大
大的打破了。诸如 Digg 和 del.icio.us
这样的网站,他们的存在即是基于我们把自己看到的酷的东西告诉给朋友的渴望。更好的是,我发现当我了解到了一样东西,把它告诉给需要它的人,就算自己很快
忘记了,也会感到利用到了这一信息的价值。我认为,把含有用信息的链接或者一份文件的拷贝传递给别人,是件很有意义的事情。

  • 整理笔记

即便你平时很注意及时清理不需要保存的资料,一些记录仍然有可能被积攒下来。一些人除了保留笔记,不需要再对它们做额外的事情——在需要做某些方面的研究时,他们能够直接利用到这些积累。然而,另一些人,则确实需要一些方法,去组织整理笔记,以便需要的时候更容易的找到它们。

我了解到,很多人都激烈的反对处理超出他们必须处理的范围的信息,但是我确实发现,将我的笔记归档是一个非常好的机会,用来回顾信息,查看是否能从中找到新的可以用于实践的条目,或者可以传递给别人的信息。

  • 准备遗忘

对于必然会遗忘掉一些信息,如果你没有任何心理准备,那么你很可能会陷入极度受挫的沮丧之中。事实上,有很多事情是应该遗忘的。“遗忘”,这里指的
是,你没有必要刻意去记住。然而你可能会记住很多这一类的信息——这也是人类大脑十分有趣的一点。但是若其中的某些被忘记了,也不会真的影响到你。

  1. 你不常用到的事实:我在了解了关于洪都拉斯的一串概况,包括这个国家的国土面积之后,想到了这一点。尽管十分对不住我读过的关于洪都拉斯的文章,但我的确不需要知道那些信息。我知道的是,当我需要知道这个国家的某些情况时,可以很容易的查到。
  2. 你已经记录下来的事情:对于很快要做的任务,虽然不必故意遗忘,但一旦落在了纸面上(或者用于同等目的的电子工具),也没有必要刻意的去记住它们。
  3. 雇佣他人为你记的事情细节:我们中的一些人很幸运的拥有秘书或行政助理(而另一些人的工作则是为别人做秘书)。假设你有一个能干的助理,你完全可以把琐细的事情交由他们来处理。这也是你雇佣他们的原因之一。

请注意,我没有提出应该遗忘与你当前做的项目无关的事情。这是因为,我坚信跨学科的知识是寻找突破性进展的真正线索,无论面前的任务是关于作家遇到的障碍,还是设计一座新房。

  • 准备记住

除了我关于遗忘的建议,有很多资料是你需要记住的。你也许马上要去做一次演讲,或者到某个部门去面试。更不幸的,你甚至也许要写一篇学期论文。与其顶着压力紧张的背下细节,我建议你使用一个简单的工具:回顾

我会把要做的事项所需的材料暂时置于一旁,待到事情临近,该要准备的时候,我所做的,是回顾这些信息。若是要做演讲,我不会提前几周就准备,因为到
时候准备好的内容很可能已经记不住了。我理想的提前准备期差不多是提前一周——这令我有足够的时间做适当次数的练习和回顾,但又不是太长,以至于冒险遗忘
掉重要的材料。

15个在线资源来扩充你的英语词汇

对于咱中国人来说,暂且不谈什么为什么要学外文的话题,如果你要是真正的用到,那么,这恐怕就让你揪心了,其实学习英语好处的大道理不用我来讲大家都明白,下面我来为大家推荐一些国外的英语站点,如果经常浏览,对于你的英语听说读写都有很大的帮助!

 第一大类: 在线词典和词库

Reference.com–是我非常喜欢的一个网站,对于中文来讲,词源对于理解和记忆单词是非常重要的,英文也不例外,Reference提供一个很好的词源解说,地道的英文对英文的解释.

The Free Dictionary –准备好了没有?确实,这里面的东西会让你吃惊和敬畏,为什么天下有如此好的免费午餐呢?它把英语的学习层次和方式各个展现,当然,页面也是模块形式,想学什么就填加什么!

Visual Thesaurus—可视化词库,不错吧,当你输入一个词汇的时候,它可以帮你找到相关的单词来帮助你记忆和识别,背景的图片也可以提供给你下载,如果你对这个单词的发音不那么确定,有了它,你还会犹豫什么呢?

 

iciba.com–国内比较不错的翻译站点,不用多说,本人经常使用!

Definr —跟爱词霸差不多,就是翻译全用英文.

第二大类:语法

 BBC Learning English—相信大家并不陌生,坚持每天去看看哦!

第三大类: 门户站点

除了刚才谈到的 BBC Learning English以外.

Wordie.Org—现在web交互网站大量充斥,但在国内还未见到较出名的单词学习类网站.Wordie.Org就是一个不错的选择,如果你去过豆瓣,你就会了解其中的奥妙了.

第四大类:  一天一词

Word A Day —每天一词,很出名的一个站点,如果每天持之以恒,相信你的单词发音,词源以及使用都相当棒!

第四大类: 听

其实,英语的学习是少不了听的,我最喜欢听,听也是接受的最好的方式,但是,谁会为你每天提供听写的材料,而且非常地道的呢? Grammar’s Girl Podcast,赶快去下的听听!

第五大类:  电子书

Project Gutenberg–是不是想看看电子书籍了,不错,这里有超过20,000的电子书籍供你下载,全英文的哦!

第六大类:  娱乐

Jumble–一个非常好玩的英文学习游戏站点,游戏娱乐互不误!

BingoBinge –胡乱的涂鸦,呵呵,不错!

第七类: 博客

看中国人写的BLOG学外文不错,但是你要是去地道的国外BLOG教你学英文,外交的钱就不用花了!Daily Writing Tips, The Grammar Vandal, Triangle Grammar Guide.

FROM www.waacoo.com

MissRice(米老师) – 猜单词捐大米

 

主要在MissRice网站里面
每答对一题 单词的中文意思 他就帮你送10粒米到需要的地区
答对一题送10粒,答对10题送100粒 哈哈哈 我捐了1200粒了
不顾哦上去玩了 单词有些也不是很容易答对 好几题 我都是用猜的 😛

你不妨也去玩玩看咯 ~ 真是佛心来的阿~
[ 链接 http://www.missrice.com ]