免費(fèi)論文查重認(rèn)準(zhǔn)CNKI論文查重,專(zhuān)為高校論文檢測(cè)、畢業(yè)論文查重、碩士論文查重誕生的論文檢測(cè)入口平臺(tái),CNKI論文查重系統(tǒng)涵蓋海量的數(shù)據(jù)庫(kù),為畢業(yè)生解決各種煩惱,論文查重軟件免費(fèi)為各種有論文檢測(cè)、論文查重需求的人提供,論文查重認(rèn)準(zhǔn)CNKI查重!
發(fā)布時(shí)間:2021-04-30 11:00:02 作者:知網(wǎng)小編 來(lái)源:www.derer.cn
在
1背景下電子文檔易于保存,可以進(jìn)行檢索和維護(hù),現(xiàn)在高中生提交的實(shí)驗(yàn)報(bào)告已從紙版逐步轉(zhuǎn)移到電子版。電子文檔帶來(lái)方便的同時(shí),對(duì)學(xué)生的剽竊也非常方便。為了防止
名學(xué)生的實(shí)驗(yàn)報(bào)告書(shū)的復(fù)印現(xiàn)象和教師的報(bào)告書(shū)的批改,需要人工總結(jié)分?jǐn)?shù),統(tǒng)計(jì)提交情況。這些工作需要時(shí)間,容易出錯(cuò)。教師需要有效的論文調(diào)查和統(tǒng)籌工具。減輕負(fù)擔(dān),把寶貴精力投入更有意義的工作中。但是,市場(chǎng)上的搜索軟件主要用于調(diào)查論文。收費(fèi),不能調(diào)查班級(jí)內(nèi)的抄襲情況。
為了解決上述問(wèn)題,設(shè)計(jì)了針對(duì)高中電子版實(shí)驗(yàn)報(bào)告特征的桌面軟件,輔助實(shí)驗(yàn)報(bào)告的管理,實(shí)現(xiàn)了班級(jí)內(nèi)檢查重量、合計(jì)分?jǐn)?shù)和統(tǒng)計(jì)不足狀況。結(jié)果自動(dòng)excel形式引導(dǎo),有效降低教師實(shí)驗(yàn)報(bào)告管理工作工作量,杜絕學(xué)生抄襲現(xiàn)象,促使學(xué)生認(rèn)真完成實(shí)驗(yàn),單獨(dú)寫(xiě)實(shí)驗(yàn)報(bào)告。2主要技術(shù)介紹2.1余弦相似性算法余弦相似性算法。這是計(jì)算文本類(lèi)似度的最常見(jiàn)的算法。余弦類(lèi)似度在計(jì)算文本的類(lèi)似度時(shí),首先需要將文本分詞,計(jì)算詞數(shù),然后文本可以用詞數(shù)矢量表示,通過(guò)計(jì)算兩個(gè)矢量之間的夾角余弦值來(lái)測(cè)量矢量之間的類(lèi)似度[1],并將文本的類(lèi)似度的計(jì)算效果非常好,廣泛應(yīng)用于文本類(lèi)似度的計(jì)算[2]。公式1中顯示了
種計(jì)算方法。例:A:安徽省合肥市B:安徽省安慶市通過(guò)NLPIR漢語(yǔ)分詞系統(tǒng)計(jì)算單詞的頻率,得到:安徽省合肥市安慶市A:[1,1,0]B:[1,0,1],AB的類(lèi)似度為0.5。2.2NLPIR漢語(yǔ)分詞系統(tǒng)采用了中國(guó)科學(xué)院的NLPIR漢語(yǔ)分詞系統(tǒng)[3],在實(shí)驗(yàn)報(bào)告書(shū)中進(jìn)行分詞,NLPIR根據(jù)交叉信息熵算法,能夠自動(dòng)計(jì)算并提取關(guān)鍵字,實(shí)現(xiàn)了自己的適用分詞和表記詞性,因此是斯特分詞的非二選一,被廣泛認(rèn)可并被應(yīng)用。
.POI本系統(tǒng)將appache放入POI中讀寫(xiě)操作word,POI支持office2003、2007、Excel2003和2007[4]。apache的開(kāi)發(fā)團(tuán)隊(duì)一直在更新POI進(jìn)行維護(hù)。功能豐富、完善。這些hwpf模塊可以實(shí)現(xiàn)字的doc文件的讀寫(xiě)操作。
xwpf模塊可以實(shí)現(xiàn)word的docx文件的讀寫(xiě)動(dòng)作[5]。本系統(tǒng)正在處理docx文件。使用xwpf模塊,讀寫(xiě)操作包含若干重要對(duì)象。在這里簡(jiǎn)單介紹一下。XWPFDocument的對(duì)象表示docx文檔。
XWPFDocument由以下幾個(gè)重要對(duì)象組成。這里是XWPF?Paraph對(duì)象表示文檔中的段落。XWPFRun對(duì)象表示具有相同屬性的文字。XWPFTable對(duì)象表示文檔中的表格。
XWPFTableRow表示表格中的一行。XWPFTableCell支持表格單元格。
3系統(tǒng)設(shè)計(jì)3.1系統(tǒng)功能模塊設(shè)計(jì)系統(tǒng)主要由五個(gè)模塊構(gòu)成,維護(hù)學(xué)生信息管理和實(shí)驗(yàn)報(bào)告模板管理兩個(gè)模塊的基本信息,檢測(cè)不足列表,匯總重量檢查和成績(jī)運(yùn)行三個(gè)模塊提供基礎(chǔ)數(shù)據(jù)。系統(tǒng)功能構(gòu)成如圖1所示。
.3.2數(shù)據(jù)庫(kù)設(shè)計(jì)采用開(kāi)源數(shù)據(jù)庫(kù)MySql保存學(xué)生、班級(jí)和實(shí)驗(yàn)報(bào)告的模板信息。具體表格的定義如下。4系統(tǒng)的核心功能讀取4.1實(shí)驗(yàn)報(bào)告內(nèi)容,要求學(xué)生匯總實(shí)驗(yàn)報(bào)告并提交docx文件,POI可以以XWPWordExtractor和XWPFDcument兩種方式讀取docx文件。XWPFWordExtractor內(nèi)部也參照了XWPFDcument,但只能得到簡(jiǎn)單的文本內(nèi)容和文檔屬性,無(wú)法獲得文檔內(nèi)容的屬性。因此,系統(tǒng)可以使用XWPFDcument對(duì)象獲取文本內(nèi)容的正確屬性信息。
以下使用XWPFDcument巡回XWPF石板,閱讀實(shí)驗(yàn)報(bào)告書(shū)的主要代碼。4.2檢查列表可以指定類(lèi)。或選擇學(xué)生列表的Excel。選擇文件,選擇工作所的文件夾,根據(jù)工作文件的命名格式提取學(xué)名和名字,與系統(tǒng)中存儲(chǔ)的班級(jí)學(xué)生進(jìn)行核對(duì),檢測(cè)沒(méi)有提交作業(yè)的學(xué)生,制作缺席名單。一部分的實(shí)現(xiàn)代碼如下。4.3報(bào)告的復(fù)查報(bào)告在本班范圍內(nèi)進(jìn)行,對(duì)各學(xué)生的報(bào)告和其他學(xué)生的報(bào)告進(jìn)行類(lèi)似性檢查,對(duì)類(lèi)似度大于設(shè)定閾值的報(bào)告填寫(xiě)復(fù)查報(bào)告。
具體實(shí)現(xiàn)過(guò)程:第一步:選擇重類(lèi)、工作模板和實(shí)驗(yàn)報(bào)告所的文件路徑。第二步:根據(jù)班上的號(hào)碼查學(xué)生信息,包括號(hào)碼、學(xué)號(hào)和姓名的第三步:循環(huán)學(xué)生名單,從指定的文件路徑找到學(xué)生的作業(yè),讀取作業(yè)內(nèi)容。對(duì)內(nèi)容進(jìn)行分詞處理,計(jì)算詞匯,循環(huán)結(jié)合后生成詞匯矩陣。
第4步驟:用余弦算法計(jì)算這些詞數(shù)向量之間的類(lèi)似度,生成類(lèi)似度矩陣。步驟5:縮小大于閾值的作業(yè),生成檢索結(jié)果文件。4.4報(bào)告成績(jī)的導(dǎo)出電子實(shí)驗(yàn)報(bào)告中,通常文件的最后一行有評(píng)分位置,一般設(shè)定得分關(guān)鍵字,測(cè)試數(shù)據(jù)設(shè)定“得分(百分制)”。但是,有些學(xué)生在寫(xiě)實(shí)驗(yàn)文章的時(shí)候,會(huì)錯(cuò)誤地刪除得分的關(guān)鍵詞,或者在得分后附上實(shí)驗(yàn)數(shù)據(jù)。在這里事先約定。如果文檔中有得分,則在這里評(píng)分。否則,將在文檔的最后一部分評(píng)分。該模塊首先選擇工作模板,獲取得分鍵,讀取字文件,獲得所有段落的集合,然后依次依次檢查段落中是否有關(guān)鍵字。您可以使用正則表達(dá)式獲得分值。否則,取出文檔的最后一部分,提取其中的分值。
在Excel文件中生成最后總結(jié)的分?jǐn)?shù)。5使用java語(yǔ)言在eclipse平臺(tái)上開(kāi)發(fā)結(jié)束語(yǔ)系統(tǒng),并通過(guò)POI提供的API來(lái)讀取word文檔的文本內(nèi)容。采用中國(guó)科學(xué)院NLPIR中文分詞系統(tǒng),對(duì)文本分詞用余弦類(lèi)似度算法計(jì)算類(lèi)似度,進(jìn)行論文驗(yàn)證。
系統(tǒng)實(shí)現(xiàn)了實(shí)驗(yàn)報(bào)告書(shū)的欠納檢查,在該級(jí)別檢查報(bào)告內(nèi)容的論文,制作論文的檢查報(bào)告,讀取報(bào)告的成績(jī),制作Excel的匯總表。系統(tǒng)能有效協(xié)助教師的實(shí)驗(yàn)報(bào)告管理,集中教師批改實(shí)驗(yàn)報(bào)告。下一個(gè)工作想采用B/S模型實(shí)現(xiàn)報(bào)告書(shū)的在線提交。