時(shí)間:2022-09-10 19:58:05
序論:在您撰寫科技論文科技論文時(shí),參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
Title Author(s) Affiliation(s) and address(es) Abstract Keywords Introduction Experimental Results and discussion(Results, Discussion) Conclusion(Summary; Concluding remarks) Appendix Acknowledgement References
二. 不同項(xiàng)目的基本要求
1. Title
科學(xué)技術(shù)是第一生產(chǎn)力,科學(xué)技術(shù)的創(chuàng)新離不開科技論文。通常人們將科技會(huì)議論文和科技期刊論文統(tǒng)稱為科技論文??萍颊撐陌磳懽髡Z言的不同可分為中文科技論文和外文科技論文。外文科技論文以英文科技論文為主。英文科技論文比中文科技論文的數(shù)量多。眾多的科研成果以英文科技論文形式發(fā)表,因此很有必要提高英文科技論文的閱讀水平。
科技論文與科普文章不同??破瘴恼率菍懡o公眾看的,它具有一定的文學(xué)性和藝術(shù)性??萍颊撐氖菍懡o同行專家看的,它具有很強(qiáng)的邏輯性。科技論文的邏輯性在文字上表現(xiàn)為句子之間的銜接十分緊密,因此掌握句子之間的各種銜接方法有助于提高英文科技論文的閱讀水平。
1 語法銜接
語法銜接包括省略、替代、照應(yīng)和連接等多種方法,這些方法有助于增強(qiáng)英文科技論文的邏輯性和連貫性。
(1) Computers exist in a wide range of sizes and power. (2) The smallest are embedded within the circuitry of appliances, such as televisions and wrist watches.
句(2)中The smallest后面省略了在上文句(1)中已經(jīng)出現(xiàn)的computers。采用省略的銜接方法避免了在句(2)中重復(fù)出現(xiàn)computers,突出了句(2)中的新信息“The smallest”,使得句子之間更加緊湊。
(3) Laptop computers and PCs are typically used in businesses and at home to communicate on computer networks, for word processing, to track finances, and to play games.
(4) They have large amounts of internal memory to store hundreds of programs and documents.
(5) In 1975, Gates and Paul Allen collaborated on the first version of the BASIC programming language.
(6) This led to the formation of Microsoft in Albuquerque, New Mexico, in the same year.
句(4)用人稱代詞They指上文句(3)中的Laptop computers and PCs,用人稱代詞起到照應(yīng)的作用。句(6)用指示代詞This指前面In 1975, Gates and Paul Allen collaborated on the first version of the BASIC programming language整個(gè)句子所表達(dá)的意思,用指示代詞起到照應(yīng)的作用。這種照應(yīng)的銜接方法使得科技論文更加簡(jiǎn)潔,表達(dá)的意思更加清晰。
(7) A laser used with the erbium-doped fiber can then be triggered without first having to convert weakened light pulses into electrical signals.
(8) As a result, with no intervening optical / electronic conversions to slow down transmissions, fibers can carry more information in the form of higher speed signals.
句(8)中的As a result表示句(7) 與句(8)之間是一種因果關(guān)系。還有一些過渡性的詞語可以表示轉(zhuǎn)折、時(shí)間、條件和因果等邏輯關(guān)系。掌握起銜接作用的過渡性詞語,有助于把握科技論文的內(nèi)在邏輯。
2詞匯銜接
為了進(jìn)一步增強(qiáng)英文科技論文的邏輯性和連貫性。英文科技論文除了應(yīng)用語法銜接的方法,還大量使用詞匯銜接的方法。詞匯銜接包括重復(fù)、同義、反義、上下義等多種方法。
(9) The secret to perfect timing is to make an extra satellite measurement.
(10) If three perfect measurements can locate a point in 3-dimensional space, then four imperfect measurements can do the same thing.
句(9)中出現(xiàn)了measurement(單數(shù)形式),句(10)中又重復(fù)出現(xiàn)了measurements(復(fù)數(shù)形式),這種詞匯重復(fù)方法不但使得兩個(gè)句子更加緊密,而且突出了論文要表達(dá)的重要信息(measurement)。
(11) If everything were perfect (i.e. if our receiver’s clocks were perfect) then all of our satellite ranges would intersect at a single point (which is our position).
(12) But with imperfect clocks, a fourth measurement, done as a cross-check, will NOT intersect with the first three.
(13) Funding such an immense project would cost more than $230 billion over several decades.
(14) To make this investment economically feasible, phone companies want new laws that would let them supply programming as well as carry it for other companies.
(15) Some cable-TV companies, broadcasters, (下轉(zhuǎn)第79頁(yè))(上接第74頁(yè))and publishers strongly oppose the entry of such powerful competitors.
(11)中的perfect與句(12)中的imperfect是一對(duì)反義詞,利用反義詞銜接兩個(gè)句子,起到了強(qiáng)烈的對(duì)比作用。句(13)中的Funding與句(14)中的investment是一對(duì)同義詞,利用同義詞銜接兩個(gè)句子,不但可以避免用詞過于單調(diào),還可以起到了強(qiáng)化同義詞所表達(dá)意思的作用。句(14)與句(15)利用上下義詞銜接兩個(gè)句子,句(14)中的companies是個(gè)上義詞,它抽象地指公司,句(15)中的cable-TV companies, broadcasters和 publishers是下義詞,它們具體指有線電視公司、廣播公司和出版商。
熟練掌握各種銜接方法,有助于把握科技論文的內(nèi)在邏輯性,并快速準(zhǔn)確地獲取英文科技論文所包含的信息,達(dá)到提高英文科技論文閱讀水平的目的。
英文科技論文致謝范文【1】
Acknowledgements:
Thecompletionofthethesisisattributedtomanypeople'ssupportandencouragement.
Firstandforemost,Iwanttoextendmyheartfeltgratitudetomysupervisor,ProfessorCaoDaogen,whosepatientguidance,valuablesuggestionsandconstantencouragementmakemesuccessfullycompletethisthesis.Hisconscientiousacademicspiritandmodest,open-mindedpersonalityinspiremebothinacademicstudyanddailylife.Hegivesmemuchhelpandadviceduringthewholeprocessofmywriting,whichhasmademyaccomplishmentspossible.
Also,Iwouldliketoexpressmysinceregratitudetoalltheprofessorswhohavetaughtmeinthisuniversity.Theirinstructionshavehelpedbroadenmyhorizonandtheirenlighteningteachinghasprovidedmewithasolidfoundationtoaccomplishthispaperandwillalwaysbeofgreatvalueformyfuturecareerandacademicresearch.
Mythanksalsogototheauthorswhosebooksandarticleshavegivenmeinspirationinthewritingofthispaper.
Lastbutnotleast,Iwouldliketoexpressmyspecialthankstomyparents,whosecareandsupportmotivatemetomoveonandmakemewanttobeabetterperson.
英文科技論文致謝范文【2】
Acknowledgements:
IwouldliketodedicatemypapertoallthosewhohaveofferedmetremendousassistanceduringthethreeyearsinZhejiangUniversityofFinanceandEconomics.
Firstofall,myheartiestthanksflowtomysupervisor,ProfessorCaoDaogen,forhishelpfulguidance,valuablesuggestionsandconstantencouragementbothinmystudyandinmylife.Hisprofoundinsightandaccuratenessaboutmypapertaughtmesomuchthattheyareengravedonmyheart.Heprovidedmewithbeneficialhelpandofferedmepreciouscommentsduringthewholeprocessofmywriting,withoutwhichthepaperwouldnotbewhatitisnow.
Also,Iwouldliketoexpressmysinceregratitudetoalltheprofessorswhohavetaughtmeinthisuniversitythatgreatlybroadenedmyhorizonandenrichedmyknowledgeinmystudy.Theirinspirationalandconscientiousteachinghaveprovidedmewithafirmbasisforthecomposingofthispaperandwillalwaysbeofgreatvaluetomyfutureacademicresearch.
Mythanksalsogotothescholarswhosemonographsandacademicpapershaveenlightenedmeinthewritingofthispaper.
Finally,Iwouldliketoextendmydeepgratefulnesstomyfamilyandfriends,especiallymythreeroommates,ChenLinghua,GongShaandHuangJin,whoseencouragementandsupporthavemademyaccomplishmentspossible.
英文科技論文致謝范文【3】
Acknowledgements:
Thisthesiswouldhavebeenafarmorepallidthingwithoutthegenerosityandsupportfrommanymembers.
Firstofall,IwouldliketoacknowledgewithgratitudetomysupervisorinChinaForeignAffairsUniversity,ProfessorLvHui,forherpatience,encouragementandcarefulguidance.Withouthersupportiveadviceandinstruction,Iwouldnothavefinishedthisthesis.
IamalsogreatlyindebttoallmyteachersintheEnglishDepartmentofChinaForeignAffairsUniversity,ProfessorGuoLiqiu,ProfessorCuiChangqing,ProfessorShiYi,ProfessorSunJisheng,ProfessorSongAiqun,andProfessorHeQunforeverythingIhaveleantfromthemduringtheperiodintheuniversity.AnditisalsoapleasuretoacknowledgeoneofmyteachersinXinxiangUniversity(HenanProvince),ProfessorDongAihua,forhersupportonmyrecommendationletter.
Iwouldliketothankmyfriends,LiWei,forcollectingusefulinformationforme.Thanks,too,tomynewly-acquaintedfriendinAuckland-Julia,forguidingmetotheresourcesofreferences.AndadditionalgratefulnodstothestaffofAucklandCityCentralLibraryforhelpingmeaccessquicklytoallreferenceresources.
Sincerelythankstomydearestparents,fortheirgenerouslove,supportandunderstandingtowardsmystudyandcareerforsomanyyears.
Finally,mylong-sufferinghusbanddeservesthanksforhispatience.Hethinksittakestoomuchtimeformetoaccomplishmythesis,especiallywithababy.
英文科技論文致謝范文【4】
Acknowledgements:
Duringthepreparationofthemaster'sthesis,Ihavereceivedalotofinvaluablehelpsfrommanypeople.Theircommentsandadvicescontributetotheaccomplishmentofthethesis.
Firstofall,theprofoundgratitudeshouldgotomysupervisorProfessorCaoDaogen.Hehasgivenmegreatinstructionsandencouragementsthroughouttheprocessofselectingtheresearchtopic,writingthethesis,improvingtheoutlineandtheargumentation,andcorrectingthegrammaticalerrors.Hisinsightfulcommentsoneverydraft,whichprovidemewithmanyenlighteningideas,haveinspiredmetoagreatextent.Thethesiscouldnotbefinishedwithouthispatientguidance.
Secondly,Iwanttoexpressmyheartfeltthankstoalltheteacherswhohavehelpedandtaughtmeinthisuniversity.IamparticularlygratefultoProfessorShaoBinandProfessorZhangLing.Theirlinguisticscourseshavebroadenedmyhorizonandarousedmyinterestinlinguistics.
1 題目:
題目是論文內(nèi)容的高度概括,它準(zhǔn)確、簡(jiǎn)練和清晰地反映論文的研究范圍和深度,以便于讀者宣讀,同時(shí)也便于文獻(xiàn)檢索和追蹤。題目中應(yīng)包括文章的主要關(guān)鍵詞。正如The interplay between economic and political development,意為“經(jīng)濟(jì)發(fā)展和政治發(fā)展的相互影響”,可以看出題目中包含了文章講述的主要關(guān)鍵詞“民主”“經(jīng)濟(jì)”和“相互影響”。題名像一條標(biāo)簽,切忌用較長(zhǎng)的主、謂、賓語結(jié)構(gòu)的完整語句逐點(diǎn)描述論文的內(nèi)容,以保證達(dá)到“簡(jiǎn)潔”的要求;而“恰當(dāng)”的要求應(yīng)反映在用詞的中肯、醒目、好讀好記上。題名應(yīng)簡(jiǎn)短,不應(yīng)很長(zhǎng),一般不宜超過20個(gè)漢字。
2署名:
論文的署名,標(biāo)明作者享有著作權(quán),獲得相應(yīng)的榮譽(yù)和權(quán)益,而且也表示文責(zé)字符,即作者有義務(wù)對(duì)所發(fā)表的研究成果的科學(xué)性和真實(shí)性負(fù)責(zé),同時(shí)為日后成為文獻(xiàn)資料,便于檢索、查閱提供必要的一句。作者署名的一個(gè)基本原則就是突出創(chuàng)造性工作,尊重客觀事實(shí)、實(shí)事求是。作者的數(shù)目不宜過多,通常署名的作者不宜超過六人。第一作者應(yīng)對(duì)論出主要的貢獻(xiàn),并為主要責(zé)任者。
3 文摘:
文摘應(yīng)包括目的、方法、結(jié)果、結(jié)論。一般的科技論文都應(yīng)盡量寫成報(bào)道性文摘,而對(duì)綜述性、資料性或評(píng)論性的文章可寫成指示性或報(bào)道、指示性文摘。編寫時(shí)要客觀、如實(shí)地反映一次文獻(xiàn);要著重反映文稿中的新觀點(diǎn);不要重復(fù)本學(xué)科領(lǐng)域已成常識(shí)的內(nèi)容;不要簡(jiǎn)單地重復(fù)題名中已有的信息;書寫要合乎語法,盡量同文稿的文體保持一致;結(jié)構(gòu)要嚴(yán)謹(jǐn),表達(dá)要簡(jiǎn)明,語義要確切;要用第三人稱的寫法。摘要字?jǐn)?shù)一般在300字左右。
4關(guān)鍵詞:
為了便于讀者從浩如煙海的書刊中尋找文獻(xiàn),特別是適應(yīng)計(jì)算機(jī)自動(dòng)檢索的需要,應(yīng)在文摘后給出3-8個(gè)關(guān)鍵詞。選能反映文獻(xiàn)特征內(nèi)容,通用性比較強(qiáng)的關(guān)鍵詞。如果讀者選用某個(gè)通用詞來檢索,將會(huì)把數(shù)據(jù)庫(kù)中包含蓋茨與的各學(xué)科文獻(xiàn)都?xì)w總到一起,很難從中找出所需要的信息,素衣通用詞不適合用做關(guān)鍵詞。
5 引言:
引言(前言、序言、概述)經(jīng)常作為科技論文的開端,它簡(jiǎn)明介紹科技論文的背景、相關(guān)領(lǐng)域的前人研究歷史與現(xiàn)狀(有時(shí)亦稱這部分為文獻(xiàn)綜述),以及著者的意圖與分析依據(jù),包括科技論文的追求目標(biāo)、研究范圍和理論、技術(shù)方案的選取等。引言應(yīng)言簡(jiǎn)意賅,不要等同于文摘,或成為文摘的注釋。
6 正文:正文應(yīng)充分闡明科技論文的觀點(diǎn)、原理、方法及具體達(dá)到預(yù)期目標(biāo)的整個(gè)過程,并且突出一個(gè)“新”字,以反映科技論文具有的首創(chuàng)性。根據(jù)需要,論文可以分層深人,逐層剖析,按層設(shè)分層標(biāo)題。例文中作者在正文部分提出了Theoretical Notions, Effects of democracy on economic growth, Framework for the determination of democracy, Regression results for democracy, Long_run forecasts of democracy五個(gè)部分,分別進(jìn)行了理論分析、民主對(duì)經(jīng)濟(jì)增長(zhǎng)的影響、民主的回歸結(jié)果和民主的長(zhǎng)期預(yù)測(cè)五部分。科技論文寫作不要求文字華麗,但要求思路清晰,合乎邏輯,用語簡(jiǎn)潔準(zhǔn)確、明快流暢;內(nèi)容務(wù)求客觀、科學(xué)、完備,要盡量讓事實(shí)和數(shù)據(jù)說話;凡用簡(jiǎn)要的文字能夠說清楚的,應(yīng)用文字陳述,用文字不容易說明白或說起來比較繁瑣的,應(yīng)由表或圖來陳述。例如文中提供了大量的數(shù)據(jù)、圖表和公式來詳細(xì)說明文章的論證過程:
7 結(jié)論:
結(jié)論是整篇文章的最后總結(jié)。主要是回答“研究出什么”(What)。它應(yīng)該完整、準(zhǔn)確、簡(jiǎn)潔地指出:一是由研究對(duì)象進(jìn)行考察或?qū)嶒?yàn)得到的結(jié)果所揭示的原理及其普遍性;二是研究中有無發(fā)現(xiàn)例外或本論文尚難以解釋和解決的問題;三是與先前已經(jīng)發(fā)表過的(包括他人或著者自己)研究工作的異同;四是本論文在理論上與實(shí)用上的意義與價(jià)值;五是對(duì)進(jìn)一步深人研究本課題的建議。
關(guān)鍵詞:科技;數(shù)據(jù)
中圖分類號(hào):G232 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 08-0000-02
一、引言
目前在大學(xué)中,專業(yè)英語課程開設(shè)已經(jīng)相對(duì)普遍,但課程設(shè)置一般將專業(yè)詞匯,語法,專業(yè)文獻(xiàn)閱讀與寫作并重,這樣英文科技論文寫作只有大約四分之一的課時(shí)或者更少,相對(duì)得到較少的重視,單獨(dú)開設(shè)英文科技論文寫作的院校更是寥寥無幾。然而在本科高年級(jí)及研究生的學(xué)習(xí)過程中,科技論文的寫作方法對(duì)畢業(yè)論文及期刊顯得尤為重要,下面就科技論文寫作的教學(xué)內(nèi)容,方法和意義談一點(diǎn)自己的看法。
二、科技論文寫作的教學(xué)內(nèi)容
英文的科技論文寫作是以科技詞匯,語法,熟練閱讀方法為基礎(chǔ)的,屬于專業(yè)英語課程中高級(jí)的內(nèi)容,所以學(xué)習(xí)科技論文寫作,必須是在整個(gè)英語能力提高的基礎(chǔ)上進(jìn)行的。在科技論文寫作的專項(xiàng)內(nèi)容之前,基本的英語能力應(yīng)該首先打扎實(shí)。
(一)科技論文寫作的概要
科技論文寫作是科研工作者的必修課,科學(xué)研究工作中,溝通主要是靠科技論文,所以科研人員學(xué)術(shù)水平的衡量標(biāo)準(zhǔn)在很大程度上是他論文的發(fā)表情況??萍颊撐牟荒懿坏玫街匾暎萍颊撐牟幌衿渌恼碌膶懽?,不需要過多修飾,只需要嚴(yán)謹(jǐn)和清晰,要簡(jiǎn)潔無累述。
從古時(shí)起,人類便通過各種文字符號(hào)作為溝通的主要手段,這便成為科學(xué)與文明的主要傳載者,也是科技論文發(fā)展的前身。當(dāng)今,科技論文寫作即是以規(guī)范的形式,通過規(guī)范的審核及流程,正規(guī)發(fā)表在期刊上的過程。所謂正規(guī)發(fā)表即是,有可以被評(píng)估的原始資料,可以被重復(fù)的實(shí)驗(yàn)過程,可以被評(píng)估的推導(dǎo)過程。
科技論文的目的是溝通,所以科技論文必須是讓讀者可以清晰的感知到要表達(dá)的內(nèi)容,所以無論從表達(dá)方法還是組織方式上,都必須是標(biāo)準(zhǔn)清晰的。
(二)科技論文各項(xiàng)內(nèi)容的寫作要點(diǎn)
科技論文寫作應(yīng)該分為:標(biāo)題,摘要,引言,正文,結(jié)論,討論和參考文獻(xiàn)幾大部分。
科技論文的標(biāo)題位于第一行正中,不用加標(biāo)點(diǎn),常用動(dòng)名詞的短語代替完整的句子。如有要加副標(biāo)題,用冒號(hào)隔開。作者的姓名和地址寫在標(biāo)題的正下方,中國(guó)人的姓名和地名均按照漢語排序用漢語拼寫書寫即可。
摘要是全文的高度概括,使讀者可以通過它迅速了解全文。摘要一般要包括論文的主要論點(diǎn),要說明論文的資料來源或者研究方法和過程,要陳述研究的結(jié)論以及意義。摘要所用時(shí)態(tài)為一般現(xiàn)在時(shí)或者一般過去時(shí),在陳述一般規(guī)律和給予的建議時(shí)用一般現(xiàn)在時(shí),在陳述過去所做的研究和實(shí)驗(yàn)時(shí),用一般過去時(shí)(這在整個(gè)論文寫作中都是時(shí)態(tài)使用的原則)。
引言是引出研究?jī)?nèi)容的陳述。引言一般從本論文論點(diǎn)的研究歷史開始敘述,講述本文所屬學(xué)術(shù)領(lǐng)域的研究背景,研究的近況,從而引出本研究分支和本論文的研究點(diǎn)。引言的內(nèi)容由廣泛到具體,逐步引導(dǎo),讓讀者不必再參考相關(guān)文獻(xiàn)就可了解本文的研究?jī)?nèi)容的來龍去脈。
引言之后就是正文,正文要詳細(xì)的寫出本文研究?jī)?nèi)容所使用的原始數(shù)據(jù),原始資料以及研究的方法。正文要充分詳細(xì)的給出所有使用的原始資料及數(shù)據(jù),正規(guī)實(shí)驗(yàn)過程和研究方法的敘述,要可以使得讀者通過你的描述還原推導(dǎo)過程,重復(fù)實(shí)驗(yàn)。正文要足夠詳細(xì)和具體,是整個(gè)論文篇幅最大的部分。
結(jié)論是整個(gè)文章的核心部分。結(jié)論必須是由正文所給出的原始資料和數(shù)據(jù),用正文所描述的研究方法進(jìn)行推導(dǎo)和實(shí)驗(yàn)引出的。所以結(jié)論部分應(yīng)該包括兩個(gè)部分,第一要描述得出此結(jié)論的直接推導(dǎo)方法或者最終的成熟的實(shí)驗(yàn)方法,第二要將得出結(jié)論用到的所有數(shù)據(jù)表達(dá)清楚,如果使用的數(shù)據(jù)不多,可以直接列舉在文章中,如果需要大量數(shù)據(jù),則需要使用圖表的方法進(jìn)行表達(dá)。
結(jié)論之后應(yīng)該是討論部分,討論部分應(yīng)該包括以下幾個(gè)因素:
第一,從你的原始數(shù)據(jù)資料和推導(dǎo)方法中,仔細(xì)分析它們和結(jié)論之間的關(guān)系。
第二,指出所有疑點(diǎn)。包括缺失的數(shù)據(jù)以及不確定的方法等。
第三,指出所有不一致的地方。
第四,指出你研究方法的缺點(diǎn)和不足。
第五,給出以上四點(diǎn)的一個(gè)總結(jié)。
文章的最后部分是參考資料。參考資料的寫法應(yīng)該包括標(biāo)號(hào),引自的文獻(xiàn),作者,出版或者發(fā)表日期等,具體格式一般如下,但是也要根據(jù)期刊的要求有所調(diào)整。如:
[1] Geem Z.W., Kim J.H., Loganathan G.V.. A new heuristic optimization algorithm: harmony search. Simulation, 2001,76(2): 60-68.
(三)科技論文中的圖表表示方法
科技論文中的圖表分為,表格,圖和照片。表格主要用于表示大量精確的數(shù)據(jù),不是所有數(shù)據(jù)都要以表格的形式表述出來,如果數(shù)據(jù)量較少,或者可以用文字表達(dá)清楚的,都可以寫在文章中。圖是圖形化的表格,圖和表格一樣,都是用于表達(dá)數(shù)據(jù)的,但是圖能更加直觀的顯示出數(shù)據(jù)的變化,如果所表達(dá)的數(shù)據(jù)變化可以提供較好的效果,就可以選擇用圖來表達(dá),如果僅僅是大量數(shù)據(jù),選擇表格比較合適。照片是真實(shí)的實(shí)驗(yàn)現(xiàn)象或者原始資料的呈現(xiàn),能給予有力的證據(jù)。但是選擇照片要注意,要選用同類型中最典型的,最能反映效果的,還要注意印刷出來照片的效果是不是滿意。
無論圖,表格還是照片,都需要有標(biāo)號(hào)和名稱,還必須在正文中對(duì)此加以一定的解釋。
(四)科技論文的發(fā)表事宜
科技論文只有在發(fā)表之后才能算是真正完成,所以科技論文在按照以上內(nèi)容撰寫完成之后很重要的一步就是發(fā)表。在國(guó)際雜志上不僅僅代表了作者的較高水平,更能促進(jìn)學(xué)術(shù)的交流和研究工作的發(fā)展。國(guó)際專業(yè)性刊物主要分為期刊(Journal),學(xué)報(bào)(Actta),公報(bào)(Bulletin),快報(bào)(Rapid Communications),評(píng)論性刊物(Review),論文集(Proceedings)等。
在投稿之前,要選擇合適的刊物,如果選錯(cuò)刊物,可能會(huì)影響的層次甚至被拒稿。選擇刊物時(shí),要反復(fù)了解刊物的相關(guān)信息,包括刊物的名稱,種類,刊物的性質(zhì),水平,出版周期,通訊地址等等。只有充分了解了相關(guān)領(lǐng)域的刊物,才能正確投稿。獲取刊物信息的渠道有很多,可以通過專門提供各個(gè)刊物簡(jiǎn)明信息的相關(guān)書籍進(jìn)行查閱,也可以直接通過刊物本身獲得,在互聯(lián)網(wǎng)發(fā)展甚是普及的今天,在網(wǎng)上查詢也是很好的方法。
選定刊物之后,就可以投寄論文,在收到刊物的收稿涵后,經(jīng)過相關(guān)專家及編輯人員審稿之后,就可以確定是否可以發(fā)表。但是,通常還要根據(jù)每個(gè)刊物的具體要求進(jìn)行修改才能正式發(fā)表。在投稿過程中,投稿信也十分重要,一封禮貌得體的投稿信可以幫助你的,所以在投稿信中,一定要注意英文信件的格式和禮貌用語。
三、英文科技論文寫作的教學(xué)方法
以上所述是英文科技論文各個(gè)部分相關(guān)內(nèi)容的撰寫以及注意事項(xiàng),其實(shí)科技論文是進(jìn)行學(xué)術(shù)交流的主要方式,在信息越發(fā)國(guó)際化的當(dāng)今,科技論文的各部分內(nèi)容也相對(duì)規(guī)范和標(biāo)準(zhǔn)了,所以,以上內(nèi)容對(duì)于用中文或其它語言撰寫的科技論文,也有很大的借鑒意義。對(duì)于學(xué)生來講,除了要了解以上內(nèi)容外,要想撰寫出專業(yè)高水平的英文科技論文,還需要一些其他的相關(guān)學(xué)習(xí),以下是教學(xué)過程中的一點(diǎn)體會(huì)和方法,希望對(duì)于相關(guān)教師有幫助。
(一)化整為零教學(xué)
如果想針對(duì)性的對(duì)英文科技論文寫作進(jìn)行教學(xué),比較有效果的方法即把科技論文的各個(gè)部分拆開分別進(jìn)行教學(xué)并且練習(xí)。比如,在摘要部分的教學(xué),可以先講解摘要的內(nèi)容,摘要的長(zhǎng)度,摘要的分類,然后講解摘要的時(shí)態(tài),總結(jié)各種表達(dá)常用的相關(guān)句式。然后通過讓學(xué)生閱讀優(yōu)秀摘要來加深印象,最后,讓學(xué)生自己撰寫一定數(shù)量的摘要進(jìn)行鞏固。如果對(duì)于科技論文的各項(xiàng)內(nèi)容都扎實(shí)的掌握,學(xué)生的科技論文寫作會(huì)更加標(biāo)準(zhǔn),進(jìn)步也會(huì)更快。
(二)用寫作集成英語能力
很多學(xué)生科技論文的寫作內(nèi)容和寫作技巧都了解,但是仍然無法寫出滿意的文章,有很大的一個(gè)原因是英文基礎(chǔ)不夠扎實(shí),其實(shí)英文科技論文的寫作離不開英語的學(xué)習(xí),英語表達(dá)能力好的同學(xué)對(duì)于科技論文的寫作掌握起來更得心應(yīng)手,所以在整個(gè)寫作過程中,在各個(gè)部分的教學(xué)過程中,也應(yīng)該適當(dāng)練習(xí)和提高學(xué)生的英語專業(yè)詞匯,語法,長(zhǎng)句的閱讀能力等,只有這樣,才能讓學(xué)生掌握的更快,達(dá)到更好的教學(xué)效果。
(三)強(qiáng)調(diào)學(xué)生對(duì)寫作的重視
因?yàn)榭萍颊撐膶懽鞔蟛糠质抢砉た茖W(xué)生,所以對(duì)于寫作往往比較欠缺,甚至有的同學(xué)不夠重視。這使得學(xué)生對(duì)于此門課程學(xué)習(xí)的積極性不夠,從而影響了知識(shí)的掌握。所以在課堂中,教師要首先以身作則,說明科技論文寫作和其他種類寫作不同。首先,寫作目的不同:文學(xué)性寫作的目的是感染讀者,陶冶情操,而科技論文寫作是用于學(xué)術(shù)交流,是科學(xué)研究的重要組成部分;其次,寫作方法不同。文學(xué)寫作屬于藝術(shù)創(chuàng)作,需要作者的文學(xué)天賦及修養(yǎng),而科技論文只需要準(zhǔn)確,清晰,簡(jiǎn)潔的表達(dá)出相關(guān)研究的內(nèi)容即可,文章的組織和內(nèi)容都是規(guī)范化的,無需任何修飾。
四、科技論文寫作學(xué)習(xí)的意義
科技論文寫作無關(guān)生死,但是卻比生死更重要——這句話充分表達(dá)了科技論文寫作對(duì)于科學(xué)研究者的重要性。古代哲人說過這樣的諺語:無人見到的森林里飄落的樹葉,它是否真的落下?這句話形象的描述出那些只會(huì)埋頭做研究,而不注重撰寫研究成果的科學(xué)家,他們的很多研究成果都悄無聲息的被埋沒了。而我們的高校學(xué)生,是以后科學(xué)研究的后備軍,我們有責(zé)任讓他們?cè)诳茖W(xué)研究起步階段就充分了解到科技論文的重要性,更有責(zé)任讓他們掌握專業(yè)的科技論文寫作方法和技巧,而不僅僅根據(jù)以前所學(xué)的“作文”的寫法來撰寫專業(yè)論文,或者僅僅模仿自己的老師來撰寫。
參考文獻(xiàn):
隨著科學(xué)研究日益全球化,很多研究機(jī)構(gòu)都將英文科技的質(zhì)量和數(shù)量作為科研水平的重要評(píng)價(jià)指標(biāo)。眾多高校也將提高英文學(xué)術(shù)論文寫作能力作為研究生英語教學(xué)的一項(xiàng)重要內(nèi)容。但是,科技論文教學(xué)課程尚無法完全滿足研究生科研階段的需求,學(xué)生在科技論文撰寫過程中依然存在很多困難。
研究生科技論文寫作課堂教學(xué)與自主探究學(xué)習(xí)的結(jié)合是提高學(xué)生科技論文寫作水平的有效途徑[1]。針對(duì)高校英文科技論文寫作教學(xué)現(xiàn)狀和學(xué)生在論文寫作中的切實(shí)需求,提出將在線免費(fèi)網(wǎng)絡(luò)語料庫(kù)資源作為學(xué)生科技論文寫作的輔助資源,提高學(xué)生在英文科技論文方面自主學(xué)習(xí)、主動(dòng)探究的能力,積極探索提高英文論文寫作水平的新模式。
2 英文科技論文特點(diǎn)分析
不同于口語、小說、純文學(xué)類文體的文章,學(xué)術(shù)類文章的語言準(zhǔn)確精煉,流暢易懂。其特點(diǎn)可以歸納為以下幾點(diǎn)。
專業(yè)性特點(diǎn),科技論文中包含很多專業(yè)詞匯和與專業(yè)相關(guān)的表達(dá)。例如植物學(xué)方面論文中出現(xiàn)的諸如“self-compatible”(自花授粉)、“biennial”(兩年生植物)、“rosette stage”(蓮座期)等專業(yè)性很強(qiáng)的詞匯。
在詞匯層面,當(dāng)代英語科技論文用詞力求簡(jiǎn)潔、規(guī)范、準(zhǔn)確。例如:“aim”和“objective”是一組近義詞,但是二者在語義上有差別,“objective”的用法是“目標(biāo)”,在描述“研究目的”時(shí),使用“aim”比“objective”更準(zhǔn)確;表達(dá)數(shù)字“大約”時(shí),使用proximity較about更規(guī)范[2];表達(dá)原因時(shí),更傾向使用“because”而非“in view of the fact that”,因?yàn)檫@樣使文章表達(dá)更簡(jiǎn)潔。
在語法層面,當(dāng)代英語科技論文在詞法、時(shí)態(tài)、語態(tài)、標(biāo)點(diǎn)符號(hào)等方面嚴(yán)格遵循約定俗成的語法規(guī)則,嚴(yán)謹(jǐn)規(guī)范。例如,在論文的材料和方法(materials and methods)部分和結(jié)果部分(result),描述材料準(zhǔn)備、實(shí)驗(yàn)過程及實(shí)驗(yàn)結(jié)果時(shí),通常使用第三人稱的被動(dòng)語態(tài),將動(dòng)作執(zhí)行者放在次要位置或忽略不寫,目的是突出實(shí)驗(yàn)器材、步驟等客觀的東西而非作者本人。另外,由于實(shí)驗(yàn)操作以及數(shù)據(jù)分析等工作是論文撰寫之前的工作,所以這些章節(jié)的表達(dá)中多使用過去時(shí)態(tài)。
在句法層面,英語科技論文也存在獨(dú)特的特征,如大量使用名詞化結(jié)構(gòu)、分詞短語、介詞短語,而不習(xí)慣使用太多定語從句、狀語從句[3]。
在篇章層面,科技論文要求條理清楚,邏輯嚴(yán)密,所以,科技論文非常注重轉(zhuǎn)折詞和連接詞的使用。如similarly、furthermore等表示平行或遞進(jìn)關(guān)系;thus、due to等詞表示因果關(guān)系。
時(shí)效性特點(diǎn),英語科技論文通常能迅速反映出科技界最新學(xué)術(shù)動(dòng)態(tài)與研究成果,在時(shí)效性方面往往走在學(xué)術(shù)專著、教材等其他英語科技文體的前面,有很強(qiáng)的時(shí)代感。
3 網(wǎng)絡(luò)語料庫(kù)應(yīng)用到科技論文寫作中的可行性
網(wǎng)絡(luò)語料庫(kù)可以突破時(shí)間和空間的限制,強(qiáng)調(diào)寫作過程與結(jié)果相結(jié)合,可以幫助學(xué)生解決在科技論文學(xué)習(xí)、撰寫以及修改過程中遇到的語言問題,提高自主學(xué)習(xí)能力。其可行性主要表現(xiàn)在以下幾個(gè)方面。
1)免費(fèi)使用在線語料庫(kù)。語料庫(kù)的建庫(kù)模式正在從一般語料庫(kù)向?qū)iT用途或?qū)W科專業(yè)語料庫(kù)發(fā)展[4]。但是國(guó)內(nèi)專門的科技英語語料庫(kù)只有上海交通大學(xué)的科技英語語料庫(kù)(JDEST),大部分高校學(xué)生都不具備使用權(quán)限。幸而,互聯(lián)網(wǎng)有不少在線語料庫(kù)如BNC(英國(guó)國(guó)家語料庫(kù))、COCA(美國(guó)當(dāng)代英語語料庫(kù))等可以通過申請(qǐng)注冊(cè)后免費(fèi)使用。
2)根據(jù)學(xué)科分類的學(xué)術(shù)期刊子語料庫(kù)。不同學(xué)科領(lǐng)域?qū)W(xué)術(shù)論文寫作要求有所不同,這種差異在文章結(jié)構(gòu)、內(nèi)容和語言運(yùn)用方面都有所體現(xiàn)。這就要求學(xué)生根據(jù)自己的專業(yè)特點(diǎn),發(fā)現(xiàn)各自學(xué)科領(lǐng)域論文寫作的規(guī)范,包括核心內(nèi)容要素及語言特點(diǎn)[1]。上文提到的免費(fèi)在線語料庫(kù)可以根據(jù)文章內(nèi)容區(qū)分出不同專業(yè)的學(xué)術(shù)論文子庫(kù)。以美國(guó)當(dāng)代英語語料庫(kù)COCA為例,它涵蓋了美國(guó)同一時(shí)期的口語、小說、流行雜志、報(bào)紙和學(xué)術(shù)期刊五大類型的語料,并且這五個(gè)類型方面呈均勻平衡分布[5]。使用者可以在全庫(kù)中查找,也可以將查詢范圍限定為特定類型(如學(xué)術(shù)期刊)。在學(xué)術(shù)期刊語料庫(kù)下,又細(xì)分出9個(gè)子語料庫(kù),包括Education、Geog/SocSci、History、Humanities、Law/Polsci、Medicine、Misc、Phil/Rel、Sci/Tech,這就為不同研究方向的學(xué)生查找語料提供了方便。
3)語料庫(kù)可應(yīng)用于學(xué)生日常的科技論文學(xué)習(xí)、撰寫以及修改。語料庫(kù)具有的同近義詞搜索、詞頻統(tǒng)計(jì)、相關(guān)度排列、詞性限定、詞性列表、上下文限定等一系列功能,可以在詞匯、句法模式、時(shí)態(tài)、語態(tài)、寫作規(guī)范、語篇邏輯等方面對(duì)學(xué)生的日常學(xué)習(xí)給予幫助。
另外,學(xué)生可以對(duì)查找的語料進(jìn)行年代的限定,這有助于學(xué)生緊跟時(shí)展,學(xué)習(xí)科技界最新學(xué)術(shù)動(dòng)態(tài)與研究成果。更重要的是,語料庫(kù)可以呈現(xiàn)包括本例句出現(xiàn)的年代、出版的信息、文章標(biāo)題、作者信息和語料庫(kù)分類等詳細(xì)內(nèi)容。因此,語料庫(kù)還可以為學(xué)生在相關(guān)論文查找和搜索方面提供便利。
4 網(wǎng)絡(luò)語料庫(kù)在英文科技論文寫作中的應(yīng)用
基于英文科技論文的語言和結(jié)構(gòu)特點(diǎn),本文以美國(guó)當(dāng)代語料庫(kù)(COCA)為例,從4個(gè)方面展示網(wǎng)絡(luò)語料庫(kù)在科技論文寫作中的應(yīng)用。
通過語料庫(kù)發(fā)現(xiàn)與專業(yè)相關(guān)的搭配框架及表達(dá)模式 Marco發(fā)現(xiàn)某些普通詞匯對(duì)該專業(yè)語篇的搭配框架特別有選擇性,并且會(huì)拓展為專業(yè)性短語單位,還有一些半專業(yè)詞匯則通過這些搭配框架呈現(xiàn)出專業(yè)詞匯的使用模式,并且與該類語篇的具體話步或篇章功能直接掛鉤[6]。學(xué)生在語料庫(kù)中輸入關(guān)鍵詞,可以發(fā)現(xiàn)與專業(yè)相關(guān)的搭配框架及表達(dá)模式。例如,以動(dòng)物作為實(shí)驗(yàn)對(duì)象的醫(yī)學(xué)專業(yè)的文章,在論文的實(shí)驗(yàn)材料和方法部分,通常需要交代“本實(shí)驗(yàn)遵守了動(dòng)物協(xié)會(huì)的相關(guān)規(guī)定(institutional animal care)”等內(nèi)容,這些表達(dá)通常有固定的表達(dá)模式。如果在查詢框(WORD(S))中輸入“institutional animal care”,選定SECTIONS中的“ACADEMIC”,并選擇按照頻率排序,搜索結(jié)果如圖1所示,通過上下文功能即可找到相關(guān)表達(dá)模式作為參照。如圖1中所示:
1)Approvals from the Institutional Review Board and...were obtained.
2)This study was approved by the Institutional Animal Care and use committee.
通過詞頻統(tǒng)計(jì)排序查找符合科技論文風(fēng)格的表達(dá) 同義詞之間除了有定性差異外,在使用頻率以及不同語域詞頻分布上都有較明顯的差異,這種差異可以幫助判斷應(yīng)優(yōu)先考慮哪個(gè)詞[7]。以“cause”和“give rise to”為例,這兩個(gè)詞在COCA語料庫(kù)各文體中的頻率及每百萬詞次的宏觀分布情況分別如圖2-a和圖2-b所示。
根據(jù)上圖所示的結(jié)果不難發(fā)現(xiàn),在學(xué)術(shù)領(lǐng)域的文章中,“cause”出現(xiàn)12 962次,每百萬詞次的分布為142.34;而“give rise to”的出現(xiàn)次數(shù)僅為450次,每百萬詞次的分布為4.94。由此看見,在一般寫作中,考慮到用詞的多樣性和復(fù)雜性,學(xué)生可能會(huì)更傾向于使用give rise to,但是在科技論文寫作中,“cause”為更合適的選擇。
通過相關(guān)性分析和積累最相關(guān)搭配 語料庫(kù)語言學(xué)中搭配的概念不只是固定詞組,設(shè)計(jì)的搭配是一組開放的詞匯總和,而這些詞匯總和也不是任意的,是受語義制約的,它們之間是“互相期待”的[8]。以“effect”一詞為例,在查詢框(WORD(S))中輸入′effect.[n*]′,在(COLLOCATES)中輸入′*′,選定SECTIONS中的′ACADEMIC′,與其搭配的高頻詞匯列表如圖3所示。
由此看見,在科技論文中,“significant”是與“effect”搭配頻率最高的詞匯,接下來,還可查看兩個(gè)詞匯搭配的例句,搜索結(jié)果如圖4所示。
由以上的例句可以分析得出,“significant”多作為“effect”的定語使用,形如“significant effect”。
由此可見,學(xué)生可以通過語料庫(kù)尋找科技論文專業(yè)詞匯的固定搭配,積累高頻寫作詞匯。
通過語料庫(kù)進(jìn)行驗(yàn)證和修訂 在論文寫作過程中,學(xué)生可以通過語料庫(kù)確認(rèn)語言使用是否得當(dāng),從而幫助學(xué)生強(qiáng)化正確的語言假設(shè),錯(cuò)誤的語言假設(shè),發(fā)現(xiàn)符合科技論文慣有表達(dá),寫出地道的學(xué)術(shù)文章。比如在使用問卷調(diào)查進(jìn)行統(tǒng)計(jì)分析時(shí),要表達(dá)“回收率”(a response rate of)時(shí)無法確定前面的介詞,有的誤以為是“in a response rate of”或者“with a response rate of”。這時(shí)可以在查詢框(WORD(S))中輸入′a response rate of′,在(COLLOCATES)中輸入′[i*]′,選定SECTIONS中的′ACADEMIC′,檢索其前置介詞的搭配情況,如圖5所示。
結(jié)果顯示,“in a response rate of”和“with a response rate of”并不是慣用表達(dá),而應(yīng)該是“for a response rate of”。由此可見,通過使用語料庫(kù),可以幫助學(xué)生在寫作過程中進(jìn)行自我檢查,避免語法錯(cuò)誤的發(fā)生,提高論文的準(zhǔn)確性和專業(yè)性,寫出符合規(guī)范的科技論文。
5 結(jié)語
網(wǎng)絡(luò)語料庫(kù)應(yīng)用于科技論文寫作可以幫助學(xué)生接觸更多的真實(shí)語料,查找更為精確的用法,歸納更多的專業(yè)詞匯和表達(dá)模式。它的使用不僅激發(fā)了學(xué)生的寫作興趣,同時(shí)也培養(yǎng)了學(xué)生的自主學(xué)習(xí)能力。雖然理論和實(shí)踐都表明語料庫(kù)在科技論文寫作中起到促進(jìn)作用,但是它并不能取代科技論文寫作課,而應(yīng)該將其視為協(xié)助學(xué)好這一課程的工具。筆者確信,隨著語料庫(kù)的發(fā)展和更新,它將在英文科技論文學(xué)習(xí)和撰寫方面發(fā)揮更大的作用。
參考文獻(xiàn)
[1]孫藍(lán),陳紀(jì)梁.研究生英語科技論文寫作探究式學(xué)習(xí)體系的思考與構(gòu)建[J].中國(guó)外語,2009(7):66-71.
[2]賀萍.英文科技論文撰寫中的幾個(gè)用詞問題[J].中國(guó)科技期刊研究,2006(3):321-323.
[3]汪家樹.當(dāng)代英語科技論文的文體特點(diǎn)及其表現(xiàn)形式[J].同濟(jì)大學(xué)學(xué)報(bào):人文社會(huì)科學(xué)版,1999(3):15-19.
[4]何安平.語料庫(kù)的“教學(xué)加工”發(fā)展綜述[J].中國(guó)外語,
2010(7):47-51.
[5]汪興富,Davies M,劉國(guó)輝.美國(guó)當(dāng)代英語語料庫(kù)(COCA):英語教學(xué)與研究的良好平臺(tái)[J].外語電化教學(xué),
2008(5):72-82.
[6]Marcro M. Collocational frameworks in medical research papers: A genre-based study[J].English for Specific Purpose,2000(19):63-86.
[7]潘璠,馮躍進(jìn).基于語料庫(kù)的同義詞差異性特征調(diào)查[J].山東外語教學(xué),2000(4):8-12.
[8]衛(wèi)乃興.詞語搭配的界定與研究體系[M].上海:上海交通大學(xué)出版社,2002:28.
[9]方玲,汪興富.美國(guó)當(dāng)代英語語料庫(kù)(COCA)的自主學(xué)習(xí)應(yīng)用[J].中國(guó)外語,2010(11):79-84.
關(guān)鍵詞:自然語言處理;特征提取;語法;語義;語用
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)16-31112-03
Feature Selection Research of the Chinese Technology Text based on Natural Language Processing
CHEN Pin
(Automation Department, Xiamen University,Xiamen 316005,China)
Abstract:With the development of China’s technology and economy, Chinese technology texts are full of the whole Net in the form of electronic text. So, Chinese technology text classification research has become a hot theme in the information domain. This paper set up a new feature selection model based on natural language processing. And based on this model, analyses in terms of syntax , semantics and pragmatics .
Key words:Natural Language Processing; Feature Selection; Syntax; Semantics; Pragmatics
1 引言
從50年代的機(jī)器翻譯和人工智能研究開始,自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)已有長(zhǎng)達(dá)半個(gè)多世紀(jì)的歷史。自然語言處理是研究如何讓計(jì)算機(jī)理解和生成人們?nèi)粘K褂玫恼Z言(如漢語,英語等)。目的在于建立起一種人與機(jī)器之間的密切而友好的關(guān)系,使之能進(jìn)行高度的信息傳遞與認(rèn)知活動(dòng)。[1]
本文基于自然語言處理理論及方法[1][2],以及中文科技論文文本其自身較強(qiáng)的領(lǐng)域特征,建立了文本特征提取模型,并從語法、語義和語用三個(gè)層面來分析處理,同時(shí)也用于解決自然語言中的多義、同義和相關(guān)性問題。
2 基于自然語言處理的特征提取模型
本文研究的對(duì)象是中文科技論文文本,很自然會(huì)遇到自然語言的各種問題。因此構(gòu)建一個(gè)優(yōu)秀的自然語言處理模型[3],是我們有效處理自然語言的關(guān)鍵所在,具有深刻的意義?;谧匀徽Z言處理的特征提取模型由詞匯層特征向量輸入、語法分析、語義分析、語用分析和概念層特征向量輸出等部分組成。模型結(jié)構(gòu)如圖1所示。
基于自然語言處理的特征提取模型過程如下:首先輸入詞匯層特征是已經(jīng)經(jīng)過預(yù)處理后的詞匯,包括詞性標(biāo)注、句子編號(hào)等等。然后對(duì)相同句子編號(hào)的詞匯采用分而治之的方法進(jìn)行語法分析,即組塊分析。再是利用已經(jīng)經(jīng)過處理的語料庫(kù)中的詞匯建立領(lǐng)域概念樹,并基于領(lǐng)域概念樹進(jìn)行概念語義分析。最后是語用分析,利用詞間相似度和關(guān)聯(lián)度進(jìn)行語境分析。整個(gè)模型中,隨著語法層面到語義層面再到語用層面,語言的處理程度逐步趨于細(xì)化,其精度也隨之提高。
圖1 基于自然語言處理的特征提取模型
3 語法分析
語法分析雖然經(jīng)過幾十年的研究和發(fā)展,但仍然是一個(gè)瓶頸問題。因此目前通常采用“分而治之”的原則,來降低完全句法分析的難度,進(jìn)行部分的句法分析,我們也稱之為組塊分析。因此,本文結(jié)合Abney組塊描述體系[4],定義漢語語法基本成分為各組塊形式。并在此基礎(chǔ)上提出了一種基于詞性判斷規(guī)則的組塊分析策略,用于解決中文科技論文文本分類過程中的自然語言問題。
其中,組塊標(biāo)記集如表1所示。
表1 組塊標(biāo)記集
詞性標(biāo)記集如表2所示。
表2 詞性標(biāo)記集
在本論文中,我們分析組塊的方法主要是采用基于詞性判斷規(guī)則的組塊分析策略(Chunk Analysis base on Part of speech Rule,簡(jiǎn)稱CABPos):
設(shè)組塊標(biāo)記(Chunk Sign)記為CS;詞性標(biāo)記(Pos Sign)記為PS;->表示前后標(biāo)記符,如s->p表示主語組塊在謂語組塊前;每一個(gè)進(jìn)行語法分析的句子(即詞串),記為Seni=ti1ti2…tim,其中seni為第i個(gè)句子,tij為第i個(gè)句子中的第j個(gè)詞匯;把每個(gè)句子等分為前、中、后三部分,分別記為Ti1,Ti2,Ti3;關(guān)聯(lián)詞表為RT。
判斷規(guī)則如下:
4 語義分析
目前,比較成熟的語義分析手段主要有格語法,語義網(wǎng)絡(luò),義素分析法,優(yōu)選語義學(xué)和蒙塔格語法等等[6]。本文將結(jié)合中文科技論文文本的強(qiáng)領(lǐng)域特征在原有概念樹模型的基礎(chǔ)上創(chuàng)建一個(gè)領(lǐng)域概念樹模型,并在此基礎(chǔ)上進(jìn)行概念語義分析。從而很大程度上解決了自然語言的同義現(xiàn)象和相關(guān)性問題,提高了文本分類的準(zhǔn)確率。
4.1 領(lǐng)域概念樹
從語義角度上分析,中文科技論文文本往往具有強(qiáng)的領(lǐng)域特征。比如說,“禪宗”、“僧人”等詞匯就明顯地帶有強(qiáng)烈的“人文科學(xué)-宗教-佛教”領(lǐng)域的詞匯色彩;而“中超”、“切爾西”、“角球”等詞匯就明顯地帶有濃郁的“人文科學(xué)-體育-足球”領(lǐng)域的詞匯色彩。因此,本文在傳統(tǒng)概念樹基礎(chǔ)上結(jié)合中文科技論文文本強(qiáng)領(lǐng)域特征構(gòu)建一個(gè)新的語義模型――領(lǐng)域概念樹。如圖2所示。
圖2 領(lǐng)域概念樹
4.2 基于領(lǐng)域概念樹模型的概念語義分析算法
向量空間模型是文本分類特征提取中用得最多的特征模型,因?yàn)樗鼔蚝?jiǎn)單,而且特征提取的效果也不錯(cuò)。那么在VSM中,如何才能把領(lǐng)域概念樹中的概念反映到特征項(xiàng)中,我們是這樣處理的。
在數(shù)學(xué)上,詞匯層映射到概念層,可用下式表示:
(8)
式中,T0為詞匯層特征向量,Ts為概念特征向量,T可以用標(biāo)題名B、作者情況Z、中文摘要W、關(guān)鍵詞G、正文ZW和參考文獻(xiàn)CK等替代。
基于領(lǐng)域概念樹的概念語義分析算法主要包括下列操作:
設(shè)概念領(lǐng)域樹中各概念詞匯集,標(biāo)記為CDS。
Step1 輸入詞匯層特征向量:
(9)
式中Fi表示特征向量中的第i個(gè)特征項(xiàng)。該特征項(xiàng)函數(shù)主要變量是ti、wi和CS(ti),也可以包含其他特征項(xiàng)信息;其中ti是特征詞匯;wi是特征詞匯的權(quán)重,CS(ti)是詞匯ti的組塊標(biāo)注。
Step2 對(duì)詞匯層特征向量中各特征詞匯,通過領(lǐng)域概念路徑以及組塊標(biāo)注歸并屬于同一概念層次的特征詞匯。
式中T′i表示屬于同一概念層次的詞匯;ci表示歸并后Ti概念層次代碼標(biāo)記。
Step3 計(jì)算屬于同一概念層次的特征詞匯T′i所對(duì)應(yīng)的概念權(quán)重。
式中ρi表示同一概念層特征詞匯T′i的概念權(quán)重。
Step4 輸出基于領(lǐng)域概念樹的概念層特征向量:
由此可見,基于領(lǐng)域概念樹模型的概念語義分析,如果特征項(xiàng)中參數(shù)詞匯屬于領(lǐng)域概念樹中的某領(lǐng)域?qū)拥母拍钤~匯,那么該詞匯就能增強(qiáng)它在該領(lǐng)域?qū)拥臋?quán)重系數(shù),極大地解決了同義詞等語義問題,提高了分類的精確度。
5 語用分析
語用分析可以理解為詞匯的上下文語境的分析。本文中,自然語言處理在語義、語用層面上所描述的詞匯是基于領(lǐng)域概念樹中的概念詞匯。因此,本文基于詞匯間相似度和關(guān)聯(lián)度,提出了一種語境分析方法。
從數(shù)學(xué)角度上來分析,基于詞匯間相似度和關(guān)聯(lián)度的語境語用分析過程,可以用下式來表示:
式中Ts是概念語義分析后的特征向量,Tr是語境語用分析后的特征向量,T可以用標(biāo)題名B、作者情況Z、中文摘要W、關(guān)鍵詞G、正文ZW和參考文獻(xiàn)CK等替代;ξ是詞匯間相似度的閾值;η是詞匯間關(guān)聯(lián)度的閾值。
基于詞匯間相似度和關(guān)聯(lián)度的語境分析算法主要包括下列操作:
Step1輸入概念語義分析后的特征向量:
Step2對(duì)概念層中的詞匯進(jìn)行詞間相似度計(jì)算,如公式(16)和(17):
Step3對(duì)概念層中的詞匯進(jìn)行詞間關(guān)聯(lián)度計(jì)算,如公式(18)-(20):
Step4通過實(shí)驗(yàn)獲得詞匯間相似度的閾值ξ和詞匯間關(guān)聯(lián)度的閾值η,取詞匯間相似度Simlexical(ti,tj)>ξ和關(guān)聯(lián)度Relaxical(ti,tj)>η的詞作為新的特征項(xiàng)。
Step5 輸出經(jīng)過語境語用分析后的特征向量:
此算法主要是通過詞間相似度和關(guān)聯(lián)度來判斷同一概念層次上詞匯間的相關(guān)性,從而進(jìn)一步改善了自然語言處理過程的性能,來提高文本分類的準(zhǔn)確率。
6 舉例
為了具體說明該方法,以某標(biāo)題名來舉例說明,如下所示:
標(biāo)題名:計(jì)算機(jī)病毒防治的協(xié)同理論與法律對(duì)策
設(shè)t1="計(jì)算機(jī)",t2="病毒",t3="防治",t4="協(xié)同",t5="理論",t6="法律",t7="對(duì)策"。B0表示標(biāo)題名原始特征向量;Bs表示標(biāo)題名經(jīng)過語義分析后的特征向量;Br表示標(biāo)題名經(jīng)過語境分析后的特征向量。
首先語法分析(組塊分析):
表3 組塊分析結(jié)果
然后語義分析:
標(biāo)題中詞匯在領(lǐng)域概念樹模型中所對(duì)應(yīng)的概念,如表4所示。
表4
所以該標(biāo)題名的原始特征向量B0為:
最后語用分析:
詞間相似度關(guān)系(a=2),如表5所示。
表5 詞間相似度
詞間關(guān)聯(lián)度關(guān)系(K=4),如表6所示。
7 結(jié)論
本文利用自然語言處理的理論與技術(shù),構(gòu)建了基于自然語言處理的文本特征提取模型,并從語法、語義和語用三個(gè)層面分析,使自然語言的處理程度逐步深化。語法層面上,我們利用了基于詞性判斷規(guī)則進(jìn)行組塊分析;語義層面上,則結(jié)合中文科技論文文本的強(qiáng)領(lǐng)域特征創(chuàng)建了領(lǐng)域概念樹模型,并在此基礎(chǔ)上進(jìn)行了概念語義分析;語用層面上,基于概念層上詞匯間的相似度和關(guān)聯(lián)度,進(jìn)行了語境語用分析。
參考文獻(xiàn):
[1]劉穎.計(jì)算語言學(xué)[M].北京:清華大學(xué)出版社,2002.
[2]張春霞,郝天永.漢語自動(dòng)分詞的研究現(xiàn)狀與困難[J].系統(tǒng)仿真學(xué)報(bào),2005(17),1:138-145.
[3]Mladenic D, Grobelnik M.Feature selection for unbalanced class distribution and Na?ve Bayes [A].Proc of 16th Inter Conf on Machine Learning ICML-99[C].San Francisco, CA: Morgan Kaufmann Publishers, 1999:258-267.
[4]王怡,蓋杰,武港山等.基于潛在語義分析的中文文本層次分類技術(shù)[J].計(jì)算機(jī)應(yīng)用研究,2004,8:151-154.
[5]姚天順.自然語言理解[M].北京:清華大學(xué)出版社,1995.
[6]王曉龍.自然語言處理的若干問題研究.哈爾濱工業(yè)大學(xué),2004
[7]劉挺.語言模型.哈工大信息檢索研究室,2004