Nuestros modelos de reconocimiento utilizan únicamente la información de las articulaciones o esqueleto que obtenemos del vídeo grabado por el usuario. Con esta información del esqueleto del usuario podemos reconocer los diferentes signos del entorno médico.

Por lo tanto, la calidad del esqueleto es clave. Para generarlo empleamos un modelo de IA que detecta en cada uno de los fotogramas de un vídeo las articulaciones y puntos clave del cuerpo y las manos. Con esta información construye un esqueleto o una representación visual que muestra la posición y la estructura del usuario.

bloggif_6495c4933088d.gif

Para más información vea el siguiente vídeo explicativo: https://www.youtube.com/watch?v=LJdPn4YhNFQ

Pero, si el modelo de reconocimiento solo utiliza la información visual y la calidad con la que construyo el esqueleto es clave, ¿cómo puedo mejorar mi grabación para que el sistema reconozca mejor el signo que busco?

A continuación mostramos una serie de puntos con los que mejorar nuestras grabaciones:

  1. Mejora tu posicionamiento. Asegúrate de posicionarte en el centro del encuadre y mantén una distancia adecuada para que tu cuerpo, desde la cintura hacia arriba, se mantenga completamente visible a lo largo de la grabación.

    Evita que las manos o la cabeza se salgan del encuadre durante todo el vídeo. Además, evita cualquier obstrucción parcial del cuerpo causada por objetos externos que puedan ocultar parcialmente las manos.

Untitled

  1. Iluminación: La calidad de la iluminación afecta a la calidad del video capturado por la cámara. Ya habrás visto en videoconferencias que si la iluminación es baja aparecen imágenes borrosas con el movimiento donde los detalles finos no se detectan. Esto dificulta la detección del esqueleto.

    Es recomendable buscar una iluminación natural en la medida de lo posible, ya que proporciona una luz suave y uniforme que favorece la detección del cuerpo. Sin embargo, si no es posible se recomienda el uso de una fuente de luz adicional, como un foco de luz suave, pero evitando una iluminación directa, ya que puede generar sombras duras y/o “quemar” las zonas expuestas directamente.

  2. Cámara:

    Como la única información utilizada es visual, cómo se capture es también muy importante. Características como la resolución de la cámara, estabilidad de la cámara y la calidad de imagen es crucial para la detección precisa. Una imagen nítida y clara proporciona una detección precisa y estable de las articulaciones. Cuanto mejor es la cámara mejor será la detección del esqueleto.

  3. Evita movimientos bruscos pero sin perder la naturalidad. Los movimientos muy bruscos pueden dificultar la detección y generación del esqueleto del usuario precisamente por provocar imagen borrosa entre un fotograma y el siguiente. Aunque el modelo es capaz de realizar un seguimiento en tiempo real de las articulaciones, los movimientos bruscos pueden dificultar la detección y afectar la estabilidad del seguimiento. Si la iluminación es buena y la cámara es buena, seguramente será capaz de grabar a más de 15 fotogramas por segundo con suficiente nitidez, lo que garantiza una buena detección del esqueleto.

    Es importante tener en cuenta que aunque se deben evitar movimientos bruscos, también es esencial mantener la naturalidad en el signado. Los movimientos suaves y fluidos son más fáciles de detectar y seguir de manera precisa, por lo que se recomienda encontrar un equilibrio entre evitar movimientos demasiado bruscos y mantener la naturalidad en el signado.