表格、公式、印章识别太难?OpenVINO™ Day 0 支持 PaddleOCR-VL-1.5:端侧文档解析一键 SOTA

作者:武卓 文档解析远不止“把字读出来”:真正难点是读懂复杂版面——表格要保结构、公式要保排版、图表要提信息,连印章这类弧形字在屏拍/倾斜/弯折时都很容易失真。今天发布的PaddleOCR-VL-1.5 正是为此而来:仅 0.9B 参数就在权威评测集 OmniDocBench v1.5 取得 94.5% 高精度,超越全球顶尖通用大模型与文档解析专用模型,登顶 SOTA;在自建 Real5-Omni

openlab_96bf3613 3天前
532 0 0

让你的 AIPC “能听会说”: Fun-ASRNano × Fun-CosyVoice 3.0 全链路加速实战

作者:杨亦诚,纪书杰,周涛,任而今引言如果你希望让自己的 AIPC 能像真人一样又能听、又能说,那么 Fun-ASR-Nano 和 FunCosyVoice 3.0 是非常值得关注的两款模型,轻量化的设计,使他们能同时兼顾性能和效果,并可根据用户习惯持续Finetune优化,非常适合在端侧设备进行部署。Fun-ASR-Nano 是通义实验室打造的端到端语音识别模型,训练数据量级达到数千万小时,能理

openlab_96bf3613 5天前
632 0 0

OpenVINO™ Java API:让Java 开发者快速部署本地生成式AI

作者:黄明明 OpenVINO™社区开发专家1.关于APIOpenVINO™ Java API,旨在推动 OpenVINO™在Java领域的应用。OpenVINO™ Java API 由于是基于 OpenVINO™ 开发,所支持的平台与OpenVINO™ 一致,具体信息可以参考 OpenVINO™。 目前,开发者需要自行下载该项目,将其源代码中的 src 文件夹**到自己的代码当中,以便更好地利用

openlab_96bf3613 6天前
724 0 0

OpenVINO™ 模型部署开发者说:IR模型“信息全景图” —— OpenVINO™ Model Information Viewer 工具详解

开篇寄语】本文为 OpenVINO™ 社区开发者的实践分享,内容基于作者在真实项目中的经验整理。作为开源 AI 工具套件,OpenVINO™欢迎大家结合自身场景验证、交流、分享,共同推动技术实践进步。【作者简介】朱忠杰 ,AI 数据智能应用架构师,人工智能研发工程师,虞城县广厦互联网软件开发服务中心负责人在模型部署的实践中,我们曾强调 “先给模型做体检,再谈上线”(前篇回顾)。而一份完整的 “体检

openlab_96bf3613 9天前
352 0 0

使用 OpenVINO™加速部署通义 Z-Image(造相)文生图模型

引言【Z-Image-Turbo】(https://huggingface.co/Tongyi-MAI/Z-Image-Turbo) 是阿里巴巴通义团队最新推出的高性能文生图模型,基于 Diffusion Transformer (DiT) 架构,6B 参数量,仅需不到 10 个 steps 的采样,就能够快速生成高质量图像。本文将详细介绍如何使用 Intel® OpenVINO™ 工具套件来优化

openlab_96bf3613 17天前
2032 0 0
首页 上一页 1 2 3 下一页 尾页