“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線

發布日期:
2024-05-07
瀏覽次數:

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線

全面免費開放個人版公測



獻禮讀書節,“尚古匯典·古籍數字服務平臺”,古籍OCR(個人版)公測全面上線,用戶可通過掃碼后,登錄平臺首頁領取200面額度的免費試用,并30天全平臺資源暢享VIP權限?。?!


“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線


中國有幾千年的輝煌文明,在上下五千年的歷史長河中,傳承了非常多的珍貴古籍。這些古籍承載著豐富的歷史、文化、政治、經濟等方面的信息,具有非常重要的價值。據《中國古籍總目》統計,中國目前現存可知古籍數量大約有20萬種,50萬個版本。在古籍數字化迅速發展的今日,依然有大量的古籍沒有完成文字識別轉錄工作。

“尚古匯典·古籍數字服務平臺”所搭載的光學字符識別(OCR)技術工具,能高效助力我們精準識別古籍中的內容與文字,深入分析版面并支持版式信息結構性輸出。這對于古籍的保護、檢索工作,乃至信息的深入挖掘和知識發現,均具有重大意義。

“尚古匯典” 古籍OCR工具根據用戶的特色,設計了兩大版本:一為個人版,一為機構版。


尚古匯典” 古籍OCR工具個人版優勢

●建立在高質量、大規模的古籍標準化標注數據基礎上,對原版古籍數據進行了針對性訓練。版式和文字的平均識別準確率均達98%。

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線


●行識別與字識別兩相對照,支持版式校正,以及原文與識別文字列對列逐字校正。

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線
“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線


●支持識別文本結構性區分導出。

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線


尚古匯典” 古籍OCR工具機構版優勢

在繼承OCR個人版優勢的同時,機構版更貼合實際項目管理需求,為機構用戶提供了更加全面、高效的文字識別體驗。

●?易錯字提醒:在高質量、大規模的古籍標準化標注數據基礎上,利用大數據算法,在OCR識別時將易錯字高亮提醒。

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線


●?字聚類功能:支持在選定的文本范圍內,進行以識別字為單位的關聯字圖聚合,并支持實時修正。該功能通過同一字圖的統一聚類來進行識別。

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線

●文本對比功能:在高質量、大規模的古籍標準化標注,以及古籍訓練的海量數據中,通過人工智能技術的相似文本篩選,支持識別結果比對驗證。


“尚古匯典·古籍數字服務平臺”將持續更新升級

歡迎長按以下二維碼,了解更多。

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線



相關推薦

“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線
全面免費開放個人版公測獻禮讀書節,“尚古匯典·古籍數字服務平臺”,古籍OCR(個人版...
交流分享|力維智聯亮相2024中國石油石化企業信息技術交流大會
4月24-25日,“2024中國石油石化企業信息技術交流大會”在北京隆重舉辦,作為中...
干貨!煉化企業建模效率提升數十倍的實踐分享
在數字化轉型的過程中,煉化企業面臨著技術門檻高、建模周期長以及模型部署困難等挑戰。傳...