![]() 机器之心报谈 裁剪:杜伟 法国大模子独角兽 Mistral AI 报复 OCR(光学字符识别)领域了。 一泉源等于堪称「天下上最佳的 OCR 模子」! ![]() 新址品 Mistral OCR 是一种光学字符识别 API,它为文档雄厚缔造了新法式。与其他模子不同,Mistral OCR 大概往时所未有的准确度和贯通才气雄厚文档的每个元素(媒体、文本、表格、公式)。它以图像和 PDF 行为输入,并从有序交错的文本和图像中索要实质。 因此,Mistral OCR 称得上一种理思的模子,不错与以多样式文档(如幻灯片或复杂 PDF)行为输入的 RAG 系统勾通使用。 从目下启动,Mistral OCR 功能不错在 Le Chat 上免费试用。Mistral AI 还是将它行为 le Chat 上数百万用户的默许文档雄厚模子,并以 1000 页 / 好意思元的价钱发布了 API「mistral-ocr-latest」。目下,该 API 还是在开荒者套件 la Plateforme 上提供,并将很快提供给 Mistral AI 的云和推理配合股伴,同期不错有选拔地腹地部署。 对复短文档杀青 SOTA 雄厚 Mistral OCR 擅长雄厚复杂的文档元素,包括交错图像、数学抒发式、表格和高档布局(如 LaTeX 面目)。该模子不错更潜入地雄厚丰富的文档,尤其是包含图表、图形、公式和数字的科学论文。 比如 Alphafold 3 的 OCR 识别效能,从给定 PDF 中将文本、图像索要到 markdown 文档。 底下将 PDF 和对应的 OCR 输出收尾进行了并列相比。 比如数学公式: ![]() 比如阿拉伯笔墨: ![]() 基准测试收获全处所第一 Mistral OCR 在严格的基准测试中长期优于其他逾越的 OCR 模子,其在文档分析的多个方面都发达出色。Mistral AI 从文本文档中索要镶嵌图像和文本,不外进行相比的其他 LLM 不具备此功能。 因此,为了公谈相比,Mistral AI 在包含各式发表论文的里面「仅文本」测试集以及汇集 PDF 上进行了性能测试。 ![]() 接济原生多话语 自树立以来,Mistral AI 一直渴慕用我方的模子奇迹全天下,因此尽力在居品中杀青多话语功能。 Mistral OCR 将这一标的普及到了一个新水平,大概瓦解、雄厚和转录各大洲的数千种剧本、字体和话语。关于需要措置来自不同话语布景的文档的公共组织以及奇迹小众市集的超腹地化企业而言,ag平台百家乐这种通用性至关紧迫。 在「Fuzzy Match in Generation」(生成暧昧匹配)臆测打算相比中,Mistral OCR 取得了第一。 ![]() 在各式话语的相比中,Mistral OCR 雷同特等了 Azure OCR 和 Google Doc AI。 ![]() 同类居品中速率最快 Mistral OCR 比同类居品中的大巨额都更轻量,速率也昭彰快于它们,而且在单个节点上每分钟不错措置 2000 多页。这一快速措置文档的才气确保即使在高隐隐量环境中也能握续学习和矫正。 文档即领导、结构化输出 Mistral OCR 还引入了使用文档行为领导的功能,从而杀青了更宏大、更精准的指示遵守。此功能允许用户从文档中索要特定信息并将其面目化为结构化输出,举例 JSON。用户还不错将索要的输出皆集到卑劣函数调用和构建智能体中。 自行托管 终末,关于具有严格数据心事条目的组织,Mistral OCR 提供了自行托管选项。这可确保明锐或私密信息在组织里面的基础步伐内保握安全,从而稳妥监管和安全法式。 实测:Mistral OCR 很好,但也有局限 靠近 Mistral AI 堪称的「公共最佳 OCR 模子」,Pulse AI 团队进行了一番测试,论断是:照实很好,但尚未完全为企业使用作念好准备。 Mistral OCR 全都特等了一些前沿 LLM,但在简直生意文档中出现了一些罢了。 ![]() 图源:https://x.com/ritvikpandey21/status/1897800421357588546 关于财务文档:Mistral OCR 难以措置复杂的表格,出现了 17% 的列错位、±1.5% 的精度偏差以及丢失了暗示负值的关节括号。 ![]() 关于法律文档:复选框检测基本不存在,部分档次结构丢失,多行表格单位格团结或割断。 ![]() 正如 Mistral AI 博客中所说,他们正在采集用户的响应,并但愿异日几周 Mistral OCR 持续变得更好。 博客地址:https://mistral.ai/fr/news/mistral-ocr 参考皆集:https://www.runpulse.com/blog/beyond-the-hype-real-world-tests-of-mistrals-ocr |