数据标注丨7大数据标注工具分享

“随着人工智能技术的发展,越来越多的公司和团队加入了此领域的研究,那么人工智能指的是什么呢?”

“人工智能“看似给人深不可测、迷离惝恍的感觉,但实际上人工智能的发展背后是需要大量的人类数据作为支撑,进而通过机器算法不断地模拟人类活动进行深度学习,识别这些数据样本去实现机器替代人工的愿景。机器是如何理解这些数据的呢?在这里我们就要提到一个重要名词:“数据标注。“数据标注简而言之就是人类通过计算机等工具对各类型的数据如:文本、视频、图像、音频等,通过不同的标注方式为他们贴上标签并提供给机器学习的过程。因此数据标注是人工智能发展过程中,必不可少的一个环节,据不完全统计,数据标注行业衍生出的全职标注人员已达数十万,兼职标注人员达数百万,并且这个数字一直在增长中,标注行业的需求在持续增长,选一个易用、高效的标注工具才能在竞争中取胜。数据标注讲究高效准确,一个好用的工具,可以帮助团队节约成本、提高标注效率。下面分享 7 个常用的数据标注工具 。

Labelme
Labelme 支持对图像进行多边形、矩形、圆、折线,点形式的标注,可用于目标检测,语义分割,图像分类等任务。作为一款开源工具,labelme 布局简单、但安装部署繁琐、数据管理困难,仅支持 JSON格式输出。
Python 版本安装地址: https://github.com/wkentaro/labelme

LabelImg
LabelImg 是国外的一款图像标注工具。使用前需要提前配置环境 python + lxml。Faster R-CNN,YOLO,SSD 等对象检测所需要的数据集。数据集管理和打开方式较困难,想用 labelImg 需要在 pythonlabelImg.py 打开一个标注的图形界面,在 open_dir 处打开images 所在的文件夹,在 change save dir打开 annotations 文件夹,才能开始标注,labelImg 的导出仅支持 XML 格式,导出文件格式为一张图片与一个 XML 文件对应。
安装地址:https://github.com/tzutalin/labelImg

LabelHub
LabelHub 是国内开发的一款协同式在线标注系统,区别于当下的标注工具,labelHub 主要解决了现有标注工具存在的很多问题,比如现有开源或在线标注工具需要安装各种环境、不同版本之间需要不同编译及配置部署、糟糕的用户体验等,同时他们的 KPI 管理系统能够实时看到项目进度、成员 KPI 等,主账号能够直接添加子成员、质检员,支持自动分发数据给多个成员同时进行标注,大大提高了标注的效率,节省了因管理分发数据集、质检传回数据等消耗的大量时间。并支持 CSV、XML、JSON 格式的文件一键导出,解决了数据管理困难,人员管理困难的标注痛点,非常适合线下团队或初创 AI 公司使用,总体来讲是使用过多款标注工具后,唯一给人感觉完整度较高,无需编译还有惊喜的标注工具。
使用地址:www.Labelhub.cn

VGG(VIA
VGG 是一款开源软件,支持在线或离线使用,能标注矩形、圆、椭圆、多边形、点和折线标注,VGG 有一个亮点,根据标签 ID 可以自定义不同的标签名称,在遇到复杂难懂的标签名称时,我们也能轻松搞定。但是标签设置较繁琐,数据导出方面支持 CSV、JSON 两种格式。
安装地址:http://www.robots.ox.ac.uk/~vgg/software/via/

CVAT
CVAT 是 Opencv 出品的一款网页版视频图像标注工具, 通过 Docker 进行部署,安装特定的环境及依赖库,打开谷歌 Chrome 浏览器去访问,Cvat 版本之间兼容性并不好,对于 python 版本的兼容较差,仅仅支持 Python3,总体体验并不友好。
安装地址:www.github.com/opencv/cvat

Labelbox
Labelbox 是国外的一款在线标注工具,界面简洁,但基础版本的图像标注只能进行矩形框以及多边形的标注,如果需要更多标注工具以满足不同的标注场景需要去 labelbox 自定义的标签界面导入 Api 接口,并使用 fetch 和 submit 函数与 labelbox 集成,对于普通标注人员来讲,学习成本很高,labelbox 支持 JSON和 CSV 两种格式的导出。由于Labelbox 服务器在国外,在网页端使用的效果十分不好,加载速度非常慢,很影响标注效率。
使用地址: https://labelbox.com/

精灵标注
精灵标注是国内开发的一款客户端标注工具,这款工具对于图片标注支持的类型较少,仅支持多边形、折线、矩形框的标注、如人脸识别等场景需要用到的点标注的缺失。但好在精灵标注支持文本、和视频的标注,不过行业内对于自然语言的标注还没有一个高效的方案,精灵标注支持在 Windows、Mac os、Linux系统下的安装,导出格式仅支持 PasalVoc 的 XML 格式。
安装地址: http://www.jinglingbiaozhu.com/

版权归觉醒向量所有,未经允许不得转载,如若转载请联系管理员:website@awkvector.com

觉醒向量专注于为全球人工智能企业提供优质的数据标注服务;我们通过一流的质量控制体系以及优质的服务态度,持续帮助国内外人工智能企业加快产品迭代速度

© 2018 觉醒向量版权所有

Made with ♥ by Awakening Vector

业务咨询