# ocr **Repository Path**: snowjake/ocr ## Basic Information - **Project Name**: ocr - **Description**: ocr - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-10-09 - **Last Updated**: 2026-03-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # PaddleOCR PaddleOCR 是百度开源的超轻量级 OCR 工具库,支持文本检测、文本识别和方向分类等功能。基于 PaddlePaddle 深度学习框架开发,提供丰富的预训练模型和灵活的部署选项。 ## 项目特性 - **超轻量级模型**:提供移动端可部署的超轻量模型 - **多语言支持**:支持中文、英文、法语、德语、韩语、日语等多种语言 - **多种算法**:支持 DB、EAST、SAST 等检测算法,CRNN、Attention、SRN 等识别算法 - **丰富部署**:支持 Docker、Android、iOS、服务部署等多种部署方式 - **标注工具**:提供 PPOCRLabel 标注工具,支持自动标注 ## 目录结构 ``` PaddleOCR/ ├── ppocr/ # 核心算法模块 │ ├── data/ # 数据处理 │ ├── modeling/ # 模型构建 │ ├── postprocess/ # 后处理 │ └── utils/ # 工具函数 ├── tools/ # 训练和推理工具 ├── deploy/ # 部署相关 │ ├── docker/ # Docker 部署 │ ├── hubserving/ # PaddleHub 服务部署 │ ├── pdserving/ # Paddle Serving 部署 │ ├── android_demo/ # Android 示例 │ ├── ios_demo/ # iOS 示例 │ ├── cpp_infer/ # C++ 推理 │ └── lite/ # 端侧部署 ├── configs/ # 配置文件 ├── PPOCRLabel/ # 标注工具 └── doc/ # 文档 ``` ## 快速开始 ### 安装依赖 ```bash pip install paddlepaddle pip install paddleocr ``` ### 使用示例 ```python from paddleocr import PaddleOCR ocr = PaddleOCR(use_angle_cls=True, lang='ch') result = ocr.ocr('image.jpg', det=True, rec=True, cls=True) for line in result: print(line) ``` ## 预训练模型 - 超轻量中文 OCR 模型 - 通用中文 OCR 模型 - 英文识别模型 - 多语言识别模型 ## 部署选项 - **Docker**:支持 CPU/GPU 容器化部署 - **服务端**:支持 PaddleHub、Paddle Serving 部署 - **移动端**:支持 Android、iOS 端侧部署 - **C++**:支持服务器端 C++ 推理 ## 文档 详细使用文档请参阅 [PPOCRLabel/README.md](PPOCRLabel/README.md) ## 许可证 MIT License