Reconstrucción de Objetos

Este repositorio contiene el código fuente de mi Trabajo de Fin de Grado (TFG).

Índice de Contenidos

Introducción
Algoritmos Comparados
2.1 Algoritmo del Estado del Arte
2.2 Algoritmo Propuesto (Vóxeles)
Ejecución del Programa
Benchmarks
Estructura del Proyecto
Posibles Mejoras en los Algoritmos Actuales
Crear Nuevos Algoritmos de Reconstrucción
7.1 La clase BaseModel
7.2 La clase BaseView
7.3 Incorporar el Nuevo Algoritmo
Crear Nuevos Objetos

Introducción

El objetivo de este proyecto es comparar dos enfoques diferentes para la reconstrucción de objetos tridimensionales a partir de sus vistas ortogonales (frontal, lateral, superior y sus opuestos), bajo un conjunto de restricciones concretas. Los objetos no contienen rampas, superficies circulares o huecos interiores.

Algoritmos Comparados

Algoritmo del Estado del Arte

Se ha seleccionado como algoritmo representativo del estado del arte a la tesis doctoral de Gálvez Lamolda:

Gálvez Lamolda, J. M. (1990). Reconstrucción de objetos a partir de vistas bidimensionales y su reconocimiento mediante momentos 3D: Desarrollos técnicos y aplicaciones. AccedaCRIS ULPGC. Acceso al documento

En dicho trabajo se presenta un algoritmo que teóricamente puede trabajar con todo tipo de objetos (incluyendo aquellos que no cumplen las restricciones descritas en la sección anterior).

Algoritmo Propuesto (Vóxeles)

Por otro lado, el algoritmo que se ha implementado para ser comparado con el seleccionado del estado del arte está basado en vóxeles, los cuales ofrecen una solución perfecta para este problema ya que los objetos a tratar son perfectamente 'divisibles' visualmente en cubos.

Ejecución del programa

El programa tiene como punto de entrada el archivo main.py que se encuentra en la raiz del proyecto. Asegurate de instalar antes de nada los requerimientos.

python main.py [-h] -p <path> -c <complexity> [-s <step>] [-r <resolution>] [-i]

Parámetro	Obligatorio	Valor por defecto	Descripción
`-p`	si	ninguno	Ruta al modelo a reconstruir.
`-c`	si	ninguno	Complejidad del algoritmo a usar para realizar la reconstrucción. Existen dos posiblilidades por defecto: `simple` o `complex`.
`-s`	no	1.0	Separación entre segmentos de rasterización para el algoritmo `complex`. Cuanto menor separación, mayor precisión tendrá el modelo reconstruido.
`-r`	no	8	Resolución del espacio de vóxeles para el algoritmo `simple`. Cuanto mayor sea la resolución del espacio del vóxeles, mayor precisión tendra el modelo reconstruido.
`-i`	no	ninguno	Muestra más información sobre el modelo reconstruido al final del proceso de reconstrucción.

demo.mp4

Benchmarks

A continuación, se presentan los resultados de los benchmarks correspondientes a los dos algoritmos implementados en el proyecto. En primer lugar, se muestran los resultados obtenidos con el algoritmo de José M. Gálvez, y a continuación se exponen los del algoritmo propio desarrollado en este trabajo, basado en vóxeles.

Las tablas incluyen dos columnas clave:

R.I (Reconstrucción Inicial): tiempo de ejecución (en segundos) correspondiente a la etapa de reconstrucción inicial del modelo.
R.M (Refinamiento del Modelo): tiempo de ejecución (en segundos) de la etapa de refinamiento posterior.

Los valores de cada tabla representan la media de cinco ejecuciones por cada nivel de precisión sobre el modelo de prueba someone. Las pruebas se han realizado en un sistema con CPU AMD Ryzen 7 5800X, 16 GB de RAM DDR4, y sistema operativo Windows.

Los resultados para la implementación del agoritmo de José M. Galvez:

Separación (uds)	R.I (seg)	R.M (seg)	Planos (uds)	Polígonos (uds)	Vértices (uds)
8	0,517	3,3578	17	19	115
7	0,4541	3,0368	18	17	105
6	0,4834	3,644	20	20	128
5	1,0824	7,1731	30	45	253
4	1,0199	7,086	32	41	245
3	1,1253	8,142	39	46	286
2	2,0125	12,3338	60	69	425
1	5,5638	24,0606	118	133	821
0,5	16,313	44,7234	228	243	1531

Los resultados para la implementación del algoritmo simplificado:

Resolución (uds)	R.I (seg)	R.M (seg)	Vóxeles totales	Vóxeles activos	Porcentaje activos
8	2,51E-05	0,1259	512	52	10,1563
16	1,93E-05	0,481	4096	294	7,1777
24	2,22E-05	1,0699	13824	1144	8,2755
32	2,56E-05	1,9026	32768	2576	7,8613
48	5,41E-05	4,2783	110592	8544	7,7257
64	8,81E-05	7,6205	262144	22174	8,4587
96	0,000283909	17,1236	884736	70784	8,0006
128	0,000326872	30,3715	2097152	167112	7,9685

Estructura del Proyecto

El proyecto tiene como punto de entrada el archivo main.py. Este se encarga de parsear los argumentos del programa e iniciar el proceso de reconstrucción. La reconstruccion de objetos se puede realizar mediante alguno de los algoritmos almacenados en core/complex o core/simple.

Ambos algoritmos hacen uso de las clases abstractas BaseModel y BaseView, pertenecientes a los archivos core/base_model.py y core/base_view.py para describir los objetos reconstruidos y sus vistas. Una vez reconstruido el objeto, se renderiza mediante la clase ModelRender almacenada en core/model_render.py.

Posibles mejoras en los algoritmos actuales

Está claro que la cantidad de objetos que pueden procesar los algoritmos actuales es limitada debido a las numerosas restricciones impuestas a este proyecto. Por ello, algunas posibles mejoras incluirían permitir objetos con huecos transversales y objetos con rampas. Si bien en la introducción se mencionó que no se permiten objetos con superficies circulares y esta posibilidad no se contempla entre las mejoras, es porque diferenciar entre rampas y superficies circulares resulta una tarea casi imposible.

Crear nuevos algoritmos de reconstrucción

La clase BaseModel

Tal y como se ha explicado en el punto anterior, todos los algoritmos de este proyecto hacen uso de las clases BaseModel y BaseView. La clase BaseModel contiene métodos abstractos que definen cada una de las etapas de reconstrucción y que han de ser sobrescritos por los algoritmos de reconstrucción, además de una función que dibuja el objeto reconstruido en un espacio 3D y otra que se encarga de mostrar información adicional tras la reconstrucción.

class BaseModel:

  def __init__(self, path: str, print_info: bool, viewClass: BaseView)
    # Inicializacion de otras propiedades...
    self.initial_reconstruction()
    self.refine_model()
    self.generate_surface()
    if self.print_info: self.additional_info()

  @abstractmethod
  def initial_reconstruction(self):
    warnings.warn('TODO')

  @abstractmethod
  def refine_model(self):
    warnings.warn('TODO')

  @abstractmethod
  def generate_surface(self):
    warnings.warn('TODO')

  @abstractmethod
  def draw_model(self):
    warnings.warn('TODO')

  @abstractmethod
  def additional_info(self):
    warnings.warn('TODO')

Tal y como se puede ver, en el constructor de la clase BaseModel se llaman a las tres funciones de reconstrucción de manera secuencial y, opcionalmente, se muestra información adicional. Por otra parte, el método draw_model es usado en la clase ModelRender para renderizar el modelo 3D usando la librería raylib.

Tip

La clase BaseModel tiene atributos adicionales que proporcionan mas información. Estos son: una lista de vistas del objeto y una tupla que guarda las dimensiones o bounding box que encierran al objeto real. Para mas información, échale un vistazo a la clase BaseModel

La clase BaseView

La idea tras la clase BaseView es almacenar toda la información relativa a una vista del modelo. Esto incluye la posición y orientación de la cámara a la hora de tomar una imagen del objeto a reconstruir, lo cual se traduce en tres vectores Vx, Vy, Vz y un punto O, tal y como se puede observar en la siguiente imagen:

Además de la información acerca de la cámara, se guarda la linea poligonal (lista de puntos) 2D que define el contorno de la proyección del objeto, es decir, la imagen que define la vista. Si bien se obtiene la linea poligonal del contorno de la vista, no se obtienen polígonos interiores que pueden definir huecos trasversales.

La clase BaseView contiene además un metodo que permite proyectar puntos 3D al plano de la vista y pasarlos a puntos 2D relativos al origen O de la vista, además de otro metodo que permite traducir coordenadas 2D relativas al origen de la vista a coordenadas 3D.

class BaseView:

  def __init__(self, path: Path):
    # Inicializa Vx, Vy, Vz, O

  def plane_to_real(self, point: tuple[float, float]):
    # Convierte un punto 2D a 3D

  def real_to_plane(self, point: tuple[float, float, float]):
    # Convierte un punto 2D a 3D

Estos metodos son bastante útiles durante el proceso de reconstrucción ya que son usados en clases que heredan de BaseModel con mucha frecuencia. A diferencia de BaseModel, BaseView ya contiene casi toda la información posible, por lo que es normal que nuevos algoritmos no hereden de BaseView sino que hagan uso directamente de la clase.

Incorporar el nuevo algoritmo

Una vez el desarrollador ha creado un nuevo algoritmo de reconstrucción usando la clase BaseModel, se puede integrar dicho algoritmo mediante anadir una nueva opción al parámetro --complexity de main.py. En dicho archivo también se deben de pasar los argumentos necesarios al nuevo algoritmo de reconstrucción.

Note

Quizás en próximas versiones del programa se incluya una funcionalidad que facilite la incorporación de nuevos algoritmos al programa de forma automática sin que se añada código adicional al archivo main.py. Mientras tanto, se deberá de usar la forma manual de anadir nuevos algoritmos.

Crear nuevos objetos

En el directorio examples/ se encuentran algunos objetos junto con sus vistas correspondientes. Un modelo está compuesto por una serie de subdirectorios, cada uno describiendo una vista. Cada vista ha de estar compuesta por un archivo camera.json que defina la orientacion de la camara y su posición, ademas de la proyeccion ortogonal del objeto para dicha configuracion de la camara en el archivo plane.bmp.

El contendio del archivo camera.json no es más que cada uno de los atributos para un objeto de la clase BaseView. Por ejemplo, un archivo para describir la posición y orientación de la cámara puede tener el siguiente contenido:

{
  "name": "elevation",
  "origin": [40,0,0],
  "vx": [0,-1,0],
  "vy": [-1,0,0],
  "vz": [0,0,1]
}

Note

Se ha de mencionar que los vectores Vx, Vy y Vz deben de estar normalizados, ya que esto evitaria potenciales errores en los metodos de reconstrucción. Esto se produce debido a que al cargarlos en un objeto BaseView estos valores no se normalizan.

Por otro lado, las proyecciones de un objeto almacenadas en las imágenes plane.bmp deben tener el siguiente formato para poder extraer de forma correcta la línea poligonal que describe el contorno de la proyección: La proyección debe tener un fondo blanco 255, los bordes de la figura proyectada serán negros 0 y la superficie de la figura de cualquier otro color RGB.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Reconstrucción de Objetos

Índice de Contenidos

Introducción

Algoritmos Comparados

Algoritmo del Estado del Arte

Algoritmo Propuesto (Vóxeles)

Ejecución del programa

Benchmarks

Estructura del Proyecto

Posibles mejoras en los algoritmos actuales

Crear nuevos algoritmos de reconstrucción

La clase BaseModel

La clase BaseView

Incorporar el nuevo algoritmo

Crear nuevos objetos

FilesExpand file tree

README_ES.md

Latest commit

History

README_ES.md

File metadata and controls

Reconstrucción de Objetos

Índice de Contenidos

Introducción

Algoritmos Comparados

Algoritmo del Estado del Arte

Algoritmo Propuesto (Vóxeles)

Ejecución del programa

Benchmarks

Estructura del Proyecto

Posibles mejoras en los algoritmos actuales

Crear nuevos algoritmos de reconstrucción

La clase BaseModel

La clase BaseView

Incorporar el nuevo algoritmo

Crear nuevos objetos