自然場景中的文字檢測與識別技術研究.pdf_第1頁
已閱讀1頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著智能設備的普及和GPU計算能力的快速發(fā)展,人們在快速產生圖片的過程中也在積極地尋求充分利用圖片資源的方式。目前,人們對于包含文字的圖片應用需求更加急切,因為包含圖片的文字可以方便人們對于圖片的檢索與存儲,而且可以在翻譯、VR等應用中給人們更加直接地幫助。然而因為自然場景中的圖像構成比一般的掃描圖像更加復雜,自然場景中的文字區(qū)域形態(tài)更加多變,圖片的光照、模糊度等都是自然場景圖片利用的障礙。本文分別針對英文文本的檢測和中文文本檢測和識別

2、的技術進行了研究:
  一、研究基于MSER(Maximally Stable Extremal Region)的自然場景英文檢測方法,實現了從字符篩選、文本組合、文本篩選的完整流程。其中針對字符候選區(qū)域的篩選算法,本文提出一個專門量化MSER字母篩選算法效果的評價方法,并根據該評價機制實現了一個改進的字符篩選方法。此外,本文構建了一套基于深度學習分類器的打分機制,通過打分進行文本篩選。通過上述方法改進,本文實現的自然場景中英文檢

3、測方法取得了較好的成果。對比傳統(tǒng)基于MSER的英文檢測方法,本文方法在相應的測試數據集上獲得了很好結果。
  二、研究將基于MSER自然場景英文檢測方法引入到漢字檢測中,并利用深度學習方法實現了所檢測漢字的內容識別。根據漢字的特點,使用了新的MSER篩選算法,實現了漢字筆畫候選區(qū)域篩選。在漢字區(qū)域的構建中,針對性地提出了區(qū)域聚合的合并方法。此外,本文通過計算機模擬字體、光照、陰影、背景等方面的變化組合來生成漢字識別訓練集,并利用C

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論