De lo mejor de mi cabeza, diría que depende de dos cosas.
- ¿Están calibradas las cámaras? Como en, ¿se conocen sus intrínsecos? En caso afirmativo, idealmente solo un punto de imagen en al menos dos posiciones de cámara debería ser suficiente para obtener la estimación de la posición 3D. Con múltiples cámaras e imágenes múltiples, podría calcular una estimación ‘óptima’ de la posición del punto.
- Si las cámaras no están calibradas, surge la pregunta de si todas las imágenes tomadas de las diferentes poses se toman de la misma cámara o no. En caso afirmativo, también tiene que estimar las características intrínsecas de la cámara, que podría proporcionar un número suficiente de correspondencias de puntos de imagen. Si no, supongo que no habrá una manera de localizar el punto en 3D ya que el número de incógnitas siempre será mayor que el número de ecuaciones.
Espero que ayude, y corrígeme si me equivoco.