“上下文光学压缩”技术，图像视觉长文本识别与处理模型

https://github.com/deepseek-ai/DeepSeek-OCR/tree/main

产品标签

适用人群

功能标签

DeepSeek-OCR

深度求索

中国

免费20251020版本

评分

首次收录时间: 2025-10-20最近更新时间: 2025-11-04 问题反馈

WHAT ？

DeepSeek-OCR，并非简单的“图像识别”、”文字提取“ 工具，而是试图用「视觉方式」的方式解决长文本处理难题。

DeepSeek在论文中解释，这是一项通过光学二维映射来压缩上下文的可行性研究。目标是将超长的上下文内容，压缩成图片，通过少量的视觉token带代替原来长文本需要的大量token，从而降低大模型的使用费用。

DeepSeek-OCR核心功能

开源版本软件免费使用

开源版本核心功能安全开放，用户自行承担硬件成本。同时，使用效果也受硬件影响，效果非确定。

您对DeepSeek-OCR感觉如何

请先登录再发表内容~

关关

2026/05/07 18:11

4.5

效果质量：5上手难度：4.5指令要求：4.5创新性：5性价比：5

#工具类#

合集

标签