1 / 7

Các phụ lục

Các phụ lục. Tesseract Tìm tư ̀ gần đúng Mã hóa dư ̃ liệu. Kiến trúc Tesseract. Lịch sử Tesseract. Được phát triển tại HP từ 1984 đến 1994. 1995 đoạt top 3 phần mềm OCR của UNLV Sản phẩm không thể thương mại được vì tính cồng kềnh .

cwen
Download Presentation

Các phụ lục

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Các phụ lục • Tesseract • Tìmtừ gầnđúng • Mã hóadữ liệu

  2. KiếntrúcTesseract

  3. LịchsửTesseract • Đượcpháttriểntại HP từ 1984 đến 1994. • 1995 đoạt top 3 phầnmềm OCR của UNLV • Sảnphẩmkhôngthểthươngmạiđượcvìtínhcồngkềnh. • 2005 Chuyển sang mãnguồnmở, dựánđược Google tàitrợvàcộngđồnglậptrìnhviên. • Phiênbảnmớinhất 3.01 hỗtrợtrên 40 ngônngữ • Cókhánănghuấnluyệnngônngữvà font mới

  4. Top 3 phầnmềm OCR tại UNLV • CaereOCR : http://www.dataid.com/ocrprodoverview.htm • XIS OCR engine • Tesseract OCR

  5. Tìm từ gần đúng Từcầnxửlý Thaythếtừngkýtự Dữ liệu có trongtừ điểnkhông? Đúng Đưavàodanhsáchtừgầnđúng Hiểnthịdanhsáchtừchọnlựa

  6. Tìmtừgầnđúng Từcầnxửlý Lấytấtcáccáctừcùngđộdàitừcầntra TínhkhoảngcáchLeveinsteinvàlấycáctừcó d =1 Hiểnthịdanhsáchtừchọnlựa

  7. Mã hóa dữ liệu • Tại sao? • Tránh vi phạm bản quyền dữ liệu. • Bảo mật dữ liệu tránh chỉnh sửa. • Thời gian giải mã: 1 ~ 6ms

More Related