今天给大家分享一个开源的实例分割项目,闲话不多说,给大家讲解一下为什么我们要实例分割以及它的难点在哪里,然后我们在介绍今日主角:yolact。

为什么要实例分割

在计算机视觉领域,可以说目标检测已经达到了一个高度,速度可以到惊人的10ms以内,精度也还可以,并且越来越多的C++工业级别的实现,可以在这个AI算法仓库看到很多实现:codes.strangeai.pro
但是,实际上我们在很多场合需要用到分割,准确的来说,语义分割还不够,需要更进一步的实例风格。举个例子:智慧零售我们做商品计数,你用检测或分割都不准,但是实例分割可以分割出某一个类别的所有实例,你肉眼能看到的,计算机也就能看到。除此之外,在机器人、自动驾驶领域,都需要更加精准的实例分割。

问题

但,实际上我们会遇到很多问题,首先是实例分割的速度问题,比如maskrcnn,大家所熟知的,它采用非常轻的前端网络才勉强达到100ms以内的速度,也就是准实时,这对于机器人领域应用来说,速度远远不够。

关于maskrcnn,大家可以checkout一个非常好的实现,来自facebook,传送门.

今天介绍的这个实例分割项目,效果如下:

从速度来看,效果惊人:

c384f69d-4722-4b8c-b558-db11028de659-image.png

可以说是非常的realtime了。

还等什么,快来check一下!!来自于: https://github.com/dbolya/yolact

本文首发于奇点社区:一个中国的hacknews,专注AI高科技分享,http://talk.strangeai.pro