当前位置:网站首页>玩转CANN目标检测与识别一站式方案
玩转CANN目标检测与识别一站式方案
2022-07-17 14:15:00 【华为云】
背景介绍
目标检测与识别是计算机视觉领域中的关键技术,随着深度学习技术的发展,目标检测与识别的应用场景也越来越广泛。当前, 主要有以下几个应用场景:
安全领域:指纹识别、物体识别等。
交通领域:车牌号识别、无人驾驶、交通标志识别等。
医疗领域:心电图、B超、健康管理、营养学等。
生活领域:智能家居、智能购物、智能测肤等。
但当前人工智能应用开发面临着开发周期长、AI软件栈理解成本高、算法模型与业务结合难度高、对开发人员技能要求高等门槛。为了降低AI应用开发的门槛,昇腾CANN开源了高性能的通用目标检测与识别一站式方案,通过其强大的可定制、可扩展性,旨在为AI开发者们提供更好的编程选择。
特别提示,如果您具有以下知识储备,将有助于学习:
具有C&C++编程经验。
了解异构计算架构CANN在昇腾AI全栈中的位置和作用。
了解应用编程框架AscendCL的关键特性,并能够基于AscendCL接口开发简单的AI应用。
目标
了解通用目标检测与识别一站式方案的功能与特性
了解ACLlite的背景及接口使用方法
深入了解通用目标检测与识别一站式方案的实现流程
能够基于此方案定制自己的AI应用
目标检测与识别一站式方案介绍
点此detect_and_classify,可查看方案源代码。
方案整体特性概括如下:

- 支持多格式输入和输出
通用目标检测和识别一站式方案支持图片、离线视频、RTSP视频流等多输入格式,开发者可基于此方案实现对图片和视频等不同格式的目标进行识别。另外在结果展示方面,支持图片、离线视频、Web前端等多形式展现,开发者可根据业务场景灵活呈现识别结果。
- 支持轻松替换和串接模型
该方案当前选用的是YoloV3图片检测模型与CNN颜色分类模型的串接,可实现基本的车辆检测和车辆颜色识别,开发者可轻松修改程序代码,自行替换/增加/删除AI模型,实现更多AI功能。
- 支持高效数据预处理
图片、视频等各类数据是进行目标检测和识别的原料,在把数据投入AI算法或模型前,我们需要对数据进行预加工,才能达到更加高效和准确的计算。该样例采用独立数据预处理模块,支持开发者按需定制,高效实现解码、抠图、缩放、色域转换等各种常见数据处理功能。
- 支持图片数、分辨率可变场景定制
在目标检测和识别领域,开发者们除了需要应对输入数据格式等方面差异,还会经常遇到图片数量、分辨率不确定的场景,这也是格外头疼的问题之一。比如,在目标检测和识别过程中,由于检测出的目标个数不固定,导致程序要等到图片攒到固定数量再进行AI计算,浪费了大量宝贵的AI计算资源。该样例开放了便捷的定制入口,支持设置多种数据量Batch档位、多种分辨率档位,在推理时根据实际输入情况灵活匹配,不仅扩宽了业务场景,更有效节省计算资源,大大提升AI计算效率。
- 支持多路多线程高性能编程
为了进一步提高编程的灵活性,满足开发者实现高性能AI应用,该样例支持通过极为友好和便捷的方式调整线程数和设备路数,极大降低学习成本,提升设备资源利用率。
- 高效后处理计算
除此之外,该样例后续还会将原本需要在CPU上进行处理的功能推送到昇腾AI处理器上执行,利用昇腾AI处理器强大的算力实现后处理的加速,进一步提升整个AI应用的计算效率。
边栏推荐
- Win10 install Apache Jena 3.17
- Beego framework realizes file upload + seven cattle cloud storage
- Svn learning
- 如何在 RHEL 9 中更改和重置忘记的root密码
- NPC, Microsoft, etc. proposed inclusivefl: inclusive federal learning on heterogeneous devices
- vSphere 下借助 vDS 或 NSX 做端口镜像的方法总结
- 早期单片机加密的一些方法 【评论区领取资料】
- Model comparison of material inventory management between sap ECC and s4hana material
- UE4 understanding of animation blueprint
- 微服务上线规范
猜你喜欢
![Some methods of early MCU encryption [get data in the comment area]](/img/14/8e1dcb799d8a3c0aefcac09be9dc51.png)
Some methods of early MCU encryption [get data in the comment area]

E-commerce sales data analysis and prediction (date data statistics, daily statistics, monthly statistics)

Journal日志与oplog日志的区别

OpenCV编程:OpenCV3.X训练自己的分类器

Unity3d 模型中心点的转换(源代码)

每日刷题记录 (二十六)

剑指 Offer II 041. 滑动窗口的平均值

Tire Defect Detection Using Fully Convolutional Network-论文阅读笔记

LeetCode 2335. Minimum total time required to fill the cup

NPC, Microsoft, etc. proposed inclusivefl: inclusive federal learning on heterogeneous devices
随机推荐
LeetCode 2249. Count the number of grid points in the circle
Unity3d 模型中心点的转换(源代码)
Opencv programming: opencv3 X trains its own classifier
树链剖分思想讲解 + AcWing 2568. 树链剖分(dfs序 + 爬山法 + 线段树)
The difference between journal log and oplog log
设置cmd命令提示符窗口的界面语言为英文
Some methods of early MCU encryption [get data in the comment area]
LeetCode 2315. Statistical asterisk (string)
Google Earth Engine APP(GEE)—设定中国区域的一个夜间灯光时序分析app
Google Earth Engine——Hansen Global Forest Change v1.8 (2000-2020) 森林覆盖度和森林损失量数据集
Win10 install Apache Jena 3.17
XSS.haozi.me刷题
Unity dropdown (editable, inputable) drop-down selection box with Text Association
vSphere 下借助 vDS 或 NSX 做端口镜像的方法总结
军品研制过程所需文件-进阶版
How does unity3d use the asset store to download some useful resource packages
Detailed explanation of Euler angle, axis angle, quaternion and rotation matrix
37. Flex layout
ENVI_IDL:使用反距离权重法选取最近n个点插值(底层实现)并输出为Geotiff格式(效果等价于Arcgis中反距离权重插值)
Over fitting and under fitting