OpenCV 5 正式发布:新一代 DNN 引擎原生兼容大模型,全面迈向大模型时代

作为全球计算机视觉和人工智能领域的重要基础设施,开源视觉库 OpenCV 如今迎来了一次关键性的重大更新。本周,OpenCV 团队正式发布了全新的OpenCV5。在延续二十多年技术积累的同时,这个版本也对整体架构进行了大规模的现代化升级。

image.png

自诞生以来,OpenCV 在机器人、嵌入式视觉、工业质检、医疗影像以及 AR/VR 等众多生产场景中,一直扮演着底层核心组件的角色。如今,这个项目在 GitHub 上已经获得超过 8.6 万星标,全球日安装量也超过百万次。而这次OpenCV5发布的核心目标,就是让这套经典开源库真正适应并融入大模型时代。

在所有更新之中,最受关注的无疑是全新的下一代 DNN(深度神经网络)引擎。该引擎采用了基于图(graph-based)的新架构,能够很好地支持算子融合,并且大幅增强了对 ONNX 的兼容能力,让算子覆盖率从 4.x 版本时期不足 23% 提升到了 80% 以上。更关键的是,这一新架构原生支持 Transformer 模型、大语言模型(LLM)以及视觉语言模型(VLM),这也意味着开发者今后可以更轻便地在端侧运行和调度 AI 大模型。

image.png

为了更好地应对高强度的端侧 AI 推理需求,OpenCV5在数据类型和底层优化方面也进行了较大的调整。新版本不仅进一步规范了 0D/1D 张量,还原生加入了对 FP16 和 BF16 这类低精度数据类型的支持,在尽量保证模型精度的同时,也显著减轻了内存占用压力。另外,新版还重新梳理了硬件加速层,允许芯片厂商和硬件供应商直接接入自己优化过的专用内核,摆脱了以往复杂混乱的条件编译方式。

除了底层性能的提升,开发者在工程使用上的体验也得到了明显改善。OpenCV5带来了更简洁、更现代的 Python 语言绑定,支持通过命名参数来替代过去需要靠记忆参数位置的写法。同时,团队也宣布正式淘汰传统 C API,让核心代码库更加精炼,整个构建流程也变得更简单。

image.png

在 3D 视觉和空间计算方面,新版本同样带来了不少升级,包括 ChArUco 标定板、多相机标定以及更强的可视化能力。再加上全新设计、更加清晰易读、也更方便查找的现代化文档,OpenCV5的发布,无疑为全球视觉算法工程师和大模型开发者搭建了一套更高效、更轻便、也更面向未来的技术基础。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享