AI视觉提升扫描效率,夸克揭秘“多模算法”如何提升识别精度 | 钛度前线

在智能识别领域,人工智能能做的比我们想象的更多。

夸克媒体开放日

夸克视觉技术负责人黄锐华

钛媒体App 8月24日消息,夸克举办“Meet AI”开放日活动。夸克视觉技术负责人黄锐华介绍了夸克app在日常生活中智能识别的应用案例以及技术原理。

根据夸克扫描王数据显示,学习是目前该应用排名第一的使用场景,学生对后期的编辑、分享、存储甚至创作都有了更加个性化的需求。夸克采用业界最新的深度学习算法,构建了完整的训练模型和技术能力,并为用户提供了智能化解决方案 。

其中,夸克扫描王就是以AI视觉技术为核心的智能工具,从识别、录入、编辑、管理、个性化创意等方面,满足不同场景下的用户需求,帮助他们处理各类扫描问题。支持高清扫描、文字提取、格式转换、照片修复、魔法擦除、自拍证件照等十余项功能。

2

文档矫正算法

通过在云端算力和视觉技术上发力,夸克可以帮助用户完成从传统图片、文件到数字化资产的转化。当被扫描内容模糊或有污渍时,夸克扫描王可以实现自动修复并提升清晰度;针对手机扫描容易出现的角度不正、遮挡等常见问题,夸克扫描王通过智能算法和图像识别进行摆正校对;针对个性化的信息处理需求,夸克加大在识别文字和版式上的技术投入,实现了提取文字、拍黑板、加密以及擦除等实用功能。

技术上,夸克突破了传统光学字符识别的瓶颈,首次将多模算法引入文字识别领域,让公式识别、手写识别的效果大幅度提升,印刷文字识别精度99.99%,手写文字识别精度 98.5%+。面对复杂的Word、Excel、PPT等板式和结构时,夸克扫描王也能像人类一样理解,并通过自然语言处理和计算机视觉技术的深度融合,帮助用户精准、快速的解决复杂问题。

同时,夸克也把游戏引擎数据模拟方法与半监督模型训练方法引入到文件扫描的模型开发中,通过深度模拟和还原快速提升文件矫正、字迹清晰度、背景杂质擦除的实际效果, 提高用户的满意度,同时提升最终文件的导出率。

此外除了传统的扫描识别功能外,夸克还开发出了魔法擦除、记录屏幕、照片修复等功能。其中去杂质、擦除、植发等个哦能,为用户提供了影像方面的创作空间。(本文首发钛媒体App,作者/吴泓磊,编辑/钟毅)

本文系作者 吴泓磊 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App

Baidu
map