Intel Labs lanza dos nuevos modelos para la estimación de la profundidad en la visión artificial

El sello norteamericano ha anunciado dos nuevas herramientas de inteligencia artificial basadas en el código abierto con el propósito de resolver las dificultades que plantea la estimación de la profundidad por ordenador.

Sobre VI-Depth 1.0

La nueva solución firmada por Intel Labs supone una línea de estimación de profundidad visual-inercial que integra la estimación de profundidad monocular y la odometría visual inercial (VIO) para producir estimaciones de profundidad densa con escala métrica. Un método capaz de realizar una alineación global de escala y desplazamiento mediante la profundidad métrica dispersa, seguida de una alineación densa basada en el aprendizaje. La percepción de la profundidad es fundamental para la navegación visual, y estimar correctamente las distancias puede ayudar a planificar el movimiento y evitar obstáculos. Algunas aplicaciones visuales requieren una profundidad estimada con precisión métrica, en la que cada valor de profundidad se proporciona en unidades métricas absolutas y representa la distancia física.

En este sentido, explican desde el laboratorio de Intel, la estimación precisa de la profundidad de VI-Depth puede ayudar en la reconstrucción de escenas, el mapeado y la manipulación de objetos. Sin embargo, combinar la precisión métrica y la alta generalidad ha supuesto un reto clave en la estimación de la profundidad basada en el aprendizaje. Por ello, VI-Depth incorpora los datos inerciales al proceso de estimación visual de la profundidad, no mediante la terminación de la profundidad de dispersa a densa, sino mediante la alineación de la profundidad de densa a densa utilizando factores de escala estimados y aprendidos.

De esta manera muestra una mejor reducción de errores con la alineación local basada en el aprendizaje que mediante la alineación global por mínimos cuadrados únicamente, y demuestra una transferencia exitosa de conjuntos de datos cruzados de disparo cero desde datos de entrenamiento sintéticos a datos de prueba del mundo real. Este enfoque modular permite la integración directa de los sistemas monoculares de estimación de la profundidad y VIO existentes y futuros. Asimismo resuelve la escala métrica para estimaciones de profundidad monocular métricamente ambiguas, ayudando a la implantación de modelos de estimación de profundidad sólidos y generales. En lo que a la canalización modular respecta, VI-Depth combina la estimación de profundidad basada en datos con el modelo de predicción de profundidad relativa MiDaS, junto con la unidad de medición del sensor IMU. La combinación de fuentes de datos permite a VI-Depth generar una profundidad métrica densa más fiable para cada píxel de una imagen.

Solución MiDas 3.1

A finales de 2022, Intel Labs publicó MiDaS 3.1, que añade nuevas funciones y mejoras al modelo de aprendizaje profundo de código abierto para la estimación de la profundidad monocular en la visión artificial. MiDaS, que se ha testado con grandes conjuntos de datos de imágenes diversos, es capaz de proporcionar profundidad relativa en interiores y exteriores, lo que lo convierte en un pilar versátil para muchas aplicaciones. Un rendimiento eficaz y eficiente para estimar la profundidad relativa de cada píxel en una imagen de entrada avala la utilidad de MiDas en una amplia gama de aplicaciones como la robótica, la realidad aumentada (RA), la realidad virtual (RV) y la visión artificial.

Cabe mencionar que recientemente ha sido integrada en Stable Diffusion 2.0, que es un modelo de difusión latente de texto a imagen capaz de generar imágenes fotorrealistas con entrada de texto. Con la integración de MiDaS, el modelo guiado por la profundidad de Stable Diffusion puede producir imágenes con un aspecto radicalmente distinto del original, pero conservando la geometría, lo que permite diversas aplicaciones. Otro ejemplo del éxito de este modelo son los entornos de RV de 360 grados creados por el creador digital Scottie Fox mediante una combinación de Stable Diffusion y MiDaS. Estos experimentos pueden dar lugar a nuevas aplicaciones virtuales, como la reconstrucción de escenas de crimen para casos judiciales, entornos terapéuticos para la atención sanitaria o experiencias de gaming inmersivas.

Imprimir Subir

TE PUEDE INTERESAR...

Juan Fernando Muñoz (Ministerio de Sanidad)

ENTREVISTAS

“El futuro de la asistencia sanitaria pasa por el uso de los datos y de la IA”

EMPRESAS

IBM pone sus ojos en HashiCorp para reforzar su apuesta por la nube híbrida y la IA

ENTREVISTAS

“Las leyes deberían considerar el valor de la información que hace poderosa la IA”

EMPRESAS

Snowflake lanza Arctic, su LLM de código abierto

TECNOLOGÍA

Digitalización de la gestión de los viajes corporativos: retos y oportunidades

EMPRESAS

SAS Viya sube de escalafón al incorporar IA generativa y grandes modelos de lenguaje

EMPRESAS

Qualcomm avanza en su particular revolución del entorno del PC con Snapdragon X Plus

TENDENCIAS

La economía digital ya pesa un 24,2% en el PIB

TENDENCIAS

La transformación de la salud digital impulsada por la inteligencia artificial

TENDENCIAS

El futuro de la salud: avances tecnológicos y oportunidades en el sector sanitario

OPINIÓN

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

TENDENCIAS

'ComputerWorld' y SEIS analizan la inversión TIC en sanidad en 2023

Mayte Ledo, secretaria de Estado de Digitalización e IA; José Luis Escrivá, ministro para la Transformación Digital; Mercedes Oblanca, presidenta de Accenture España y Portugal; y Alberto García Arrieta, managing director y responsable de AI & Data.

Accenture cimenta su apuesta por la IA y lanza sus nuevos GenAI Studios en Madrid y Barcelona

EMPRESAS

Miguel Sánchez Galindo, nuevo director general de DigitalES

EMPRESAS

José Andrés García Bueno dirigirá el negocio de Qlik en Iberia

TENDENCIAS

Especial Administraciones Públicas

Contenido Patrocinado

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

18 ABR 2024

En la edición de este año, que se celebrará el próximo 7 de mayo en Berlín, la tecnológica reunirá a diversas industrias y ecosistemas para debatir en torno al proceso de adopción de infraestructuras de datos capaces de acelerar la IA.

Forma parte de nuestra comunidad

¿Te interesan nuestras conferencias?

Especial Administraciones Públicas

No te pierdas...

Intel Labs lanza dos nuevos modelos para la estimación de la profundidad en la visión artificial

Sobre VI-Depth 1.0

Solución MiDas 3.1

TE PUEDE INTERESAR...

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

Radiografía de la Administración pública local y regional en clave tecnológica

El Viejo Continente se abre camino hacia la Década Digital 2030

Angelines Turón (SEPE): "La digitalización pasa por muchos proyectos que, cuando confluyen, forman un auténtico tsunami"

La transformación digital en España como motor hacia una economía próspera y sostenible

Geografía y copilotos, aliados para los CIO de la Administración

Asegurando la integridad de los datos en la Administración pública: el papel crucial de la tecnología

La IA y los datos se alzan como protagonistas del 'Digital Government Forum' 2024

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

32 años de Linux y su comunidad

MareNostrum 5 conquista los 314.000 billones de cálculos por segundo

El gasto global en nube soberana llegará a 258.000 millones de dólares en 2027

Los 'CIO 100 Awards Spain 2023' distinguen los proyectos de innovación tecnológica del año

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Por qué la mitad de los desarrolladores adoptarán software mejorado con inteligencia artificial

ChatGPT: 365 días después, el mundo parece otro

'Superapps': ¿La próxima gran novedad de las TI empresariales?

Las mujeres se hacen su camino en el ecosistema 'startupero' español

Grandes modelos lingüísticos: los cimientos de la IA generativa

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

Líderes de futuro: ingeniería de telecomunicación

Guía esencial de Microsoft 365