SO Development

Etiquetado de datos

Para todos los científicos de datos que se aventuran en la visión artificial y desarrollan modelos de visión personalizados para una variedad de aplicacionesNecesitamos una herramienta de etiquetado simple y rápida para crear conjuntos de datos que garanticen que los datos de entrenamiento sean de calidad suficiente para no afectar el rendimiento de los algoritmos de aprendizaje profundo.

Numerosas organizaciones ofrecen servicios de anotación de datos o cobran por software que automatiza este proceso. Sin embargo, aquí se hace hincapié en las tecnologías de código abierto actualmente disponibles. Cada herramienta es idónea para su uso previsto. Si bien es recomendable familiarizarse con diversas herramientas, el objetivo es comprender cuál funcionará mejor para el proyecto y cómo utilizarla correctamente [1]. Además de las funciones de gestión de proyectos, la automatización, la experiencia de usuario intuitiva, las API privadas y en la nube, y los formatos de archivos de anotación descargables, estos sistemas varían en varios aspectos importantes. Analizaremos algunas de las herramientas de anotación más utilizadas para la identificación y el seguimiento de objetos. Mosaic cuenta con experiencia en el desarrollo de aplicaciones de visión artificial que utilizan muchas de estas tecnologías.

Análisis de tamaño
Figura 1. Análisis del tamaño del mercado de herramientas de anotación de datos

Un componente crucial de todo esfuerzo de aprendizaje automático es el desarrollo de una fuente de datos de alta calidad. En la práctica, esto suele llevar más tiempo que el entrenamiento y la optimización de los hiperparámetros. Por lo tanto, es crucial elegir un instrumento adecuado para el etiquetado [2]. En esta sección, analizaremos con más detalle algunas de las principales herramientas de etiquetado de imágenes disponibles para aplicaciones de visión artificial:

  • EtiquetaImg
  • CVAT
  • VOTT
  • Etiquetame
  • Etiqueta Rect

Para aprovechar al máximo las tecnologías modernas de visión artificial, normalmente debemos monitorizar modelos de aprendizaje profundo mediante datos anotados. Si deseamos utilizar métodos de visión artificial, como la detección de objetos, en un nuevo conjunto de datos para identificar objetos únicos, necesitaremos recopilar y categorizar fotografías que contengan ocurrencias específicas de estos objetos.

1. Etiquetado

Labelmg es una herramienta gratuita y de código abierto para el procesamiento de imágenes, además de etiquetado, para anotaciones. Está desarrollada en Python y cuenta con una interfaz gráfica de usuario basada en el framework QT. Es una forma rápida y sencilla de etiquetar imágenes. La forma más sencilla de obtener LabelImg es a través de pip, que requiere Python 3. Escriba pip3 install en el símbolo del sistema. A continuación, en el símbolo del sistema, escriba labelImg para iniciar el programa. Labelmg acepta archivos de texto VOC XML o YOLO para el etiquetado. VOC XML es un formato más uniforme para el reconocimiento de objetos.

Fig. 2.
Fig. 2.

2. Herramienta de anotación de visión artificial (CVAT)

Intel desarrolló el CVAT, un programa gratuito anotación de imagen Aplicación. Además, es gratuita y de código abierto. CVAT es un programa fácil de usar para crear cuadros delimitadores y preprocesar conjuntos de datos de visión artificial para modelado. CVAT también puede utilizarse como herramienta para la anotación de vídeo, la segmentación semántica, la anotación de polígonos y otras actividades [3]. Sin embargo, la plataforma CVAT presenta varios problemas, entre ellos:

  • A cada usuario se le asignaron un máximo de diez tareas.
  • Se puede cargar un máximo de 500 MB de datos.
Fig. 3.
Fig. 3.

3. Herramienta de etiquetado visual de objetos (VOTT)

El equipo de Microsoft desarrolló una herramienta visual de etiquetado de objetos (VOTT) que utiliza visión artificial para detectar y etiquetar películas e imágenes. VOTT está disponible directamente en su sitio web si sus datos están almacenados en Azure Blob Storage o si utiliza Bing Image Search. La forma más sencilla de instalar VoTT en un equipo local es usar los paquetes de instalación incluidos con cada versión. Están disponibles los paquetes de instalación de VoTT para Mac OS X, VoTT para Linux y VoTT para Windows.

Fig. 4.
Fig. 4.

4. Labelme

Labelme, una biblioteca de anotaciones de código abierto, fue publicada en 2012 por el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT. Permite reconocer, segmentar y categorizar objetos según sus anotaciones (incluyendo anotaciones de polígonos, círculos, líneas y puntos). Además, permite anotar películas. El programa es multiplataforma, compatible con Ubuntu, macOS y Windows, y está escrito en Python y Qt4 (o Qt5) (2 o 3).

Fig. 5.
Fig. 5.

5. Etiqueta rectangular

RectLabel es un anotación de imagen Herramienta para identificar imágenes y detectar y segmentar objetos con cuadros delimitadores. RectLabel es compatible con el formato PASCAL VOC. Además, el cuadro de diálogo de etiquetas puede ajustarse para trabajar con características. Si bien RectLabel es una herramienta para etiquetar imágenes más compatible con Windows que LabelIMG, está diseñada específicamente para Mac OS X y es fácil de usar para cualquier usuario de Mac. Es completamente gratuita y ofrece diversas herramientas útiles para etiquetar fotografías con cuadros delimitadores y polígonos, entre otras funciones.

Fig. 6.

Referencias

  1. Rohlfing, K., Loehr, D., Duncan, S., Brown, A., Franklin, A., Kimbara, I., … y Wellinghoff, S. (2014). Comparación de herramientas de anotación multimodal. Gesprächsforschung–Online-Zeitschrift zur verbalen Interaktion, 7 (2006), 99-123.
  2. Dipper, S., Götze, M. y Stede, M. (mayo de 2004). Herramientas de anotación sencillas para tareas de anotación complejas: una evaluación. En Actas del taller LREC sobre corpus ricamente anotados basados ​​en XML(Págs.-54 62).
  3. Dybkjær, L., y Bernsen, NO (mayo de 2004). Hacia herramientas de anotación de propósito general: ¿Hasta dónde llegamos hoy? En LREC.

Visita nuestro Servicio de Inteligencia Artificial


Esto cerrará en 20 segundos