计算机视觉达到了新的水平,远远超出了基本图像处理。这要归功于人工智能的整合。AI现在使计算机和系统能够从可用于高级行业中使用的数字图像中得出有意义的信息。目前,最常见的应用程序之一是安全和监视。
计算机视觉应用程序通常分为小型任务,例如图像分类,对象检测,特征提取,功能匹配,图像分割,边缘检测,姿势估计等。一个这样的应用程序可能负责序列中的几个图像处理任务,以从特定的图像或视频段中检索最大的含义。您可以了解有关计算机视觉应用程序如何工作的更多信息本文。
计算机视觉应用程序可以用几种高级语言进行编程。例如,C ++和Python是最受欢迎的。尽管C ++应用程序的执行最快,但由于其庞大的库和模块存储库,Python易于使用。
通常,AI Vision应用程序使用卷积神经网络(CNN),其中CNN的每一层都执行一个或多个图像处理任务。应用程序的复杂性越高,将层添加到CNN中。
有几种工具可用于计算机视觉应用那:
- 提供用于编程应用程序的集成环境
- 实现用于计算机视觉的算法
- 允许应用程序与其他软件组件连接,包括Microsoft Azure,Amazon Rekognition或Google Cloud Vision API等云服务。
流行的计算机视觉工具包括:
1。OPENCV
2。MATLAB
3。SimpleCV
4。张量
5。库达
6。gpuimage
OPENCV -顾名思义,开源计算机视觉(OPENCV)库是一个开源计算机视觉和机器学习(ML)库,最初由Intel于2000年发行。最新版本是OpenCV 4.7.0,在Apache 2下发布许可并免费用于商业用途。
该工具用C ++编写,并在C ++接口中使用新的算法和库编写。还提供了Python,Java,Matlab和JavaScript的接口。C ++,Python和Java接口支持Linux,Windows,MacOS,Android和iOS。OPENCV为实时计算机视觉提供编程功能。受支持的ML算法包括K-Nearest邻居,随机森林,决策树,天真的贝叶斯,支持向量机,人工神经网络和深神经网络。
MATLAB -一个针对工程师和科学家的编程和数值计算平台。MATLAB由一个具有许多编程功能,算法和用于计算机视觉,3D视觉和视频处理的应用程序的计算机视觉工具箱组成。例如,功能和算法可用于对象跟踪,运动估计,特征检测,提取,匹配,摄像机校准,语义分割,场景分类,实例分段,激光雷达和3D点云处理,深度学习和机器学习。
该平台允许使用Yolo,ACF和SSD等算法对对象检测器进行生成和培训。深度学习算法包括U-NET和Mask R-CNN。该工具箱支持C ++中的代码生成,以集成到现有代码,嵌入式视觉系统部署或桌面原型设计中。
SimpleCV -是一个开源平台,也是OpenCV的简化接口。它允许访问多个计算机视觉库,而无需概念,例如颜色空间,位深度,文件格式,特征值,位图存储,缓冲区管理等。
SimplECV的框架是根据BSD许可发布的,用Python编写。它可以与网络摄像头,IP摄像头,手机,Kinect和FireWire的图像和视频流一起使用。它的计算机视觉应用程序可以在Ubuntu Linux,Windows和MacOS上运行。SimpleECV也适用于计算机视觉应用程序的快速原型制作。
TensorFlow -是一个开源机器学习框架,其中包含用于ML和AI的各种工具,库和应用程序,包括计算机视觉。该框架可以训练ML模型或神经网络,以进行对象检测,对象分类,面部识别,手势识别,姿势估计,光学特征识别等。该框架具有C,C ++,Python,Java,JavaScript,GO,Swift,Swift和其他几种语言的编程接口。通过第三方API的张力流支持MATLAB,SCALA,RUST,R和C#等许多编程语言。
库达 -代表计算统一设备体系结构,这是由NVIDIA开发的平行计算平台,用于使用通用计算中的图形处理单元(GPU)。该平台有许多库支持处理图像,模拟信号和视频流。编程接口可用于C,C ++,Python,Matlab等。流行的计算机视觉CUDA库包括mingpu,OpenVidia和GPU4Vision。CUDA也可以用于对象检测,图像分类,分割和神经辐射场(NERF)。
gpuimage -是用于GPU加速图像的iOS库和基于OpenGL ES 2.0的视频处理。BSD许可的库可用于将GPU加速效果和过滤器应用于图像,视频和实时流。GPUIMAGE使用简单函数调用应用过滤器,而不是需要从头开始编程自定义文件。
你也许也喜欢:
提交以下:AI,,,,技术文章
与本文有关的问题?
询问并讨论edaboard.com和Electro-Tech-online.com论坛。
告诉我们你的想法!!
你一定是登录发表评论。