隨著智能機(jī)器人、無人駕駛、醫(yī)療診斷的飛速發(fā)展,文本的檢測與識別已經(jīng)成為定位和理解物體信息的重要途徑 [28]?,F(xiàn)實(shí)當(dāng)中,許多跟文本識別相關(guān)的應(yīng)用極大地方便了我們的生活,如車牌識別, 發(fā)票識別, 拍圖識字等等. 提到文本檢測識別,我們會(huì)聯(lián)想到的一個(gè)詞就是 OCR,OCR 是光學(xué)字符識別 Optical Character Recognition的簡稱,是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字的過程 [19]。 現(xiàn)在所說的OCR 通常也指場景文字識別,根據(jù)識別場景,可大致將 OCR 分為識別特定場景的專用 OCR 和識別多種場景的通用 OCR。