百度 PaddleOCR 下载量突破 900 万,成为超 5.9k 开源项目首选OCR工具

百度 PaddleOCR 的累计下载量已经突破 900 万次,被超过 5.9k 个开源项目广泛使用,这款开源 OCR(光学字符识别)工具因其高效、准确和易于集成的特点而受到开发者的青睐,其突破性的识别技术,为处理图像中的文本提供了强有力的支持,促进了各种应用场景下的信息提取和数据处理效率的提升。

近日,百度通过其海外官方账号发布了全新的轻量级文字识别模型 pp-ocrv5。该模型参数量仅为0.07b,在仅千分之一的参数规模下,实现了与拥有700亿参数的大模型相当的ocr识别精度。在多个ocr应用场景的测试中,pp-ocrv5的表现优于gpt-4o、qwen2.5-vl-72b等大型通用视觉模型。目前,飞桨团队发布的相关技术博客已连续七天位居hugging face博客热度榜首位,引发开发者社区的高度关注。

百度 PaddleOCR 下载量突破 900 万,成为超 5.9k 开源项目首选OCR工具

百度 PaddleOCR 累计下载量突破 900 万,被超 5.9k 开源项目使用

据悉,2025年5月,飞桨团队正式推出PaddleOCR 3.0版本,构建了三大核心能力:文字识别方案PP-OCRv5、通用文档解析方案PP-StructureV3,以及原生集成文心大模型4.5的智能文档理解方案PP-ChatOCRv4。自2020年开源以来,PaddleOCR全球累计下载量已突破900万次,被超过5,900个开源项目直接或间接引用,成为GitHub上唯一一个Star数突破50,000的中国OCR开源项目。

百度 PaddleOCR 累计下载量突破 900 万,被超 5.9k 开源项目使用

源码地址:点击下载

网友留言(0 条)

发表评论