IBM推出Granite 4.0 3B Vision:企业级文档数据提取新工具

近日,IBM面向公众推出全新的视觉语言模型Granite 4.0 3B Vision。该模型拥有30亿参数,重点围绕企业复杂文档的数据抽取做了深入优化,旨在帮助金融、法律、医疗等行业解决数字化进程中的非结构化数据处理难题。

在处理包含复杂表格、扫描件以及多种版式布局的文档时,这款模型表现格外突出。它将视觉理解与文本生成紧密结合,能精准定位文档里的关键信息,并快速转为可直接使用的结构化数据,大幅提升企业的办公效率。

IBM

轻量化设计实现性能与成本兼得

与动辄上千亿参数的大模型不同,Granite 4.0 3B Vision采用轻量化架构。它既能在云端高效运行,也便于部署在边缘设备上,在保证响应速度的同时,显著降低企业对硬件算力的投入成本。

在多项面向文档智能(Document AI)的基准测试中,该模型在复杂指令理解与图表分析方面均展现出行业领先的准确度。这意味着企业无需昂贵的服务器集群,也能获得准确、安全的文档解析能力。

开源生态助推企业构建专属AI应用

值得一提的是,IBM延续开源开放的策略,已通过开源社区发布该模型及其相关开发工具。开发者可以按自身行业的特殊需求对模型进行微调,快速搭建契合具体业务场景的自动化工作流。

这一举措将加速生成式AI在垂直领域的落地。随着Granite 4.0 3B Vision的普及,传统的人工校对与手动录入方式将逐步被取代,企业级数据处理正迈向全面智能化的新阶段。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享