当前,AI大模型高速发展,一系列基于大模型的人工智能应用相继问世,已经影响到了各行各业,更为普通人的日常生活带来了诸多变化。
多维视通作为视频技术应用的专业公司,更专注于将AI视觉大模型有效应用于视频侦查与安全防范领域。经过公司科研团队的持续努力,当前已取得重大突破!
面向公共安全领域等重大需求,多维视通聚焦行人目标,构建监控场景行人解析大模型,利用大量监控场景行人数据构建行人基础数据集,基于人体先验结构信息指导自监督模型预训练,并深入挖掘行人多重语义信息,高质量完成多种行人相关的下游多模态任务。
新一代的行人解析大模型在自有监控场景测试集泛化准确率提升15%以上,并在多个实际案件数据测试中效果显著,表明该大模型的准确率、鲁棒性及泛化能力均大幅增强。
应用案例一:
某案数据,以目标人背影为输入、在多摄像头数据中检索效果如下图,其中红框标注为目标人检出影像,包括了行人、换装行人、半身人像、骑车正面、骑车背面等影像。
下图以目标人骑车影像为输入、在多摄像头数据中检索效果,其中红框标注为目标人检出影像,包括了骑车正面、骑车背面、行人、半身人像等影像。
应用案例二:
某案数据,以目标人影像为输入、在多摄像头数据中检索效果如下图,其中黄色旗帜标注的检出结果均为目标人不同探头下、不同体态的影像,红框标注为目标人弱小影像。
综上可见,基于新一代的多维视通行人解析大模型应用,不仅视频目标检出准确率大幅提升,更在人车互搜、弱小目标检索等疑难应用场景下亦有大幅提升。
下一步,多维视通会尽快将这些科研成果应用于绝影等影系列产品,为一线公安、检察、海关、安防等实战部门,提供更多、更实用的新技术、新产品、新应用,敬请期待!
如需了解产品等相关问题,请联系各区域负责人,联系方式见下图: