cpp_api/api/coordinate__frame_8cc_source.html

 // Copyright (c) 2018, ETH Zurich and UNC Chapel Hill.

 // All rights reserved.

 //

 // Redistribution and use in source and binary forms, with or without

 // modification, are permitted provided that the following conditions are met:

 //

 //     * Redistributions of source code must retain the above copyright

 //       notice, this list of conditions and the following disclaimer.

 //

 //     * Redistributions in binary form must reproduce the above copyright

 //       notice, this list of conditions and the following disclaimer in the

 //       documentation and/or other materials provided with the distribution.

 //

 //     * Neither the name of ETH Zurich and UNC Chapel Hill nor the names of

 //       its contributors may be used to endorse or promote products derived

 //       from this software without specific prior written permission.

 //

 // THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"

 // AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE

 // IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE

 // ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDERS OR CONTRIBUTORS BE

 // LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

 // CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

 // SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

 // INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

 // CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

 // ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

 // POSSIBILITY OF SUCH DAMAGE.

 //

 // Author: Johannes L. Schoenberger (jsch-at-demuc-dot-de)


 #include "estimators/coordinate_frame.h"


 #include "base/gps.h"

 #include "base/line.h"

 #include "base/pose.h"

 #include "base/undistortion.h"

 #include "estimators/utils.h"

 #include "optim/ransac.h"

 #include "util/logging.h"

 #include "util/misc.h"


 namespace colmap {

 namespace {


 struct VanishingPointEstimator {

   // The line segments.

   typedef LineSegment X_t;

   // The line representation of the segments.

   typedef Eigen::Vector3d Y_t;

   // The vanishing point.

   typedef Eigen::Vector3d M_t;


   // The minimum number of samples needed to estimate a model.

   static const int kMinNumSamples = 2;


   // Estimate the vanishing point from at least two line segments.

   static std::vector<M_t> Estimate(const std::vector<X_t>& line_segments,

                                    const std::vector<Y_t>& lines) {

     CHECK_EQ(line_segments.size(), 2);

     CHECK_EQ(lines.size(), 2);

     return {lines[0].cross(lines[1])};

   }


   // Calculate the squared distance of each line segment's end point to the line

   // connecting the vanishing point and the midpoint of the line segment.

   static void Residuals(const std::vector<X_t>& line_segments,

                         const std::vector<Y_t>& lines,

                         const M_t& vanishing_point,

                         std::vector<double>* residuals) {

     residuals->resize(line_segments.size());


     // Check if vanishing point is at infinity.

     if (vanishing_point[2] == 0) {

       std::fill(residuals->begin(), residuals->end(),

                 std::numeric_limits<double>::max());

       return;

     }


     for (size_t i = 0; i < lines.size(); ++i) {

       const Eigen::Vector3d midpoint =

           (0.5 * (line_segments[i].start + line_segments[i].end)).homogeneous();

       const Eigen::Vector3d connecting_line = midpoint.cross(vanishing_point);

       const double signed_distance =

           connecting_line.dot(line_segments[i].end.homogeneous()) /

           connecting_line.head<2>().norm();

       (*residuals)[i] = signed_distance * signed_distance;

     }

   }

 };


 Eigen::Vector3d FindBestConsensusAxis(const std::vector<Eigen::Vector3d>& axes,

                                       const double max_distance) {

   if (axes.empty()) {

     return Eigen::Vector3d::Zero();

   }


   std::vector<int> inlier_idxs;

   inlier_idxs.reserve(axes.size());


   std::vector<int> best_inlier_idxs;

   best_inlier_idxs.reserve(axes.size());


   double best_inlier_distance_sum = std::numeric_limits<double>::max();


   for (size_t i = 0; i < axes.size(); ++i) {

     const Eigen::Vector3d ref_axis = axes[i];

     double inlier_distance_sum = 0;

     inlier_idxs.clear();

     for (size_t j = 0; j < axes.size(); ++j) {

       if (i == j) {

         inlier_idxs.push_back(j);

       } else {

         const double distance = 1 - ref_axis.dot(axes[j]);

         if (distance <= max_distance) {

           inlier_distance_sum += distance;

           inlier_idxs.push_back(j);

         }

       }

     }


     if (inlier_idxs.size() > best_inlier_idxs.size() ||

         (inlier_idxs.size() == best_inlier_idxs.size() &&

          inlier_distance_sum < best_inlier_distance_sum)) {

       best_inlier_distance_sum = inlier_distance_sum;

       best_inlier_idxs = inlier_idxs;

     }

   }


   if (best_inlier_idxs.empty()) {

     return Eigen::Vector3d::Zero();

   }


   Eigen::Vector3d best_axis(0, 0, 0);

   for (const auto idx : best_inlier_idxs) {

     best_axis += axes[idx];

   }

   best_axis /= best_inlier_idxs.size();


   return best_axis;

 }


 }  // namespace


 Eigen::Vector3d EstimateGravityVectorFromImageOrientation(

     const Reconstruction& reconstruction, const double max_axis_distance) {

   std::vector<Eigen::Vector3d> downward_axes;

   downward_axes.reserve(reconstruction.NumRegImages());

   for (const auto image_id : reconstruction.RegImageIds()) {

     const auto& image = reconstruction.Image(image_id);

     downward_axes.push_back(image.RotationMatrix().row(1));

   }

   return FindBestConsensusAxis(downward_axes, max_axis_distance);

 }


 Eigen::Matrix3d EstimateManhattanWorldFrame(

     const ManhattanWorldFrameEstimationOptions& options,

     const Reconstruction& reconstruction, const std::string& image_path) {

   std::vector<Eigen::Vector3d> rightward_axes;

   std::vector<Eigen::Vector3d> downward_axes;

   for (size_t i = 0; i < reconstruction.NumRegImages(); ++i) {

     const auto image_id = reconstruction.RegImageIds()[i];

     const auto& image = reconstruction.Image(image_id);

     const auto& camera = reconstruction.Camera(image.CameraId());


     PrintHeading1(StringPrintf("Processing image %s (%d / %d)",

                                image.Name().c_str(), i + 1,

                                reconstruction.NumRegImages()));


     std::cout << "Reading image..." << std::endl;


     colmap::Bitmap bitmap;

     CHECK(bitmap.Read(colmap::JoinPaths(image_path, image.Name())));


     std::cout << "Undistorting image..." << std::endl;


     UndistortCameraOptions undistortion_options;

     undistortion_options.max_image_size = options.max_image_size;


     Bitmap undistorted_bitmap;

     Camera undistorted_camera;

     UndistortImage(undistortion_options, bitmap, camera, &undistorted_bitmap,

                    &undistorted_camera);


     std::cout << "Detecting lines...";


     const std::vector<LineSegment> line_segments =

         DetectLineSegments(undistorted_bitmap, options.min_line_length);

     const std::vector<LineSegmentOrientation> line_orientations =

         ClassifyLineSegmentOrientations(line_segments,

                                         options.line_orientation_tolerance);


     std::cout << StringPrintf(" %d", line_segments.size());


     std::vector<LineSegment> horizontal_line_segments;

     std::vector<LineSegment> vertical_line_segments;

     std::vector<Eigen::Vector3d> horizontal_lines;

     std::vector<Eigen::Vector3d> vertical_lines;

     for (size_t i = 0; i < line_segments.size(); ++i) {

       const auto line_segment = line_segments[i];

       const Eigen::Vector3d line_segment_start =

           line_segment.start.homogeneous();

       const Eigen::Vector3d line_segment_end = line_segment.end.homogeneous();

       const Eigen::Vector3d line = line_segment_start.cross(line_segment_end);

       if (line_orientations[i] == LineSegmentOrientation::HORIZONTAL) {

         horizontal_line_segments.push_back(line_segment);

         horizontal_lines.push_back(line);

       } else if (line_orientations[i] == LineSegmentOrientation::VERTICAL) {

         vertical_line_segments.push_back(line_segment);

         vertical_lines.push_back(line);

       }

     }


     std::cout << StringPrintf(" (%d horizontal, %d vertical)",

                               horizontal_lines.size(), vertical_lines.size())

               << std::endl;


     std::cout << "Estimating vanishing points...";


     RANSACOptions ransac_options;

     ransac_options.max_error = options.max_line_vp_distance;

     RANSAC<VanishingPointEstimator> ransac(ransac_options);

     const auto horizontal_report =

         ransac.Estimate(horizontal_line_segments, horizontal_lines);

     const auto vertical_report =

         ransac.Estimate(vertical_line_segments, vertical_lines);


     std::cout << StringPrintf(" (%d horizontal inliers, %d vertical inliers)",

                               horizontal_report.support.num_inliers,

                               vertical_report.support.num_inliers)

               << std::endl;


     std::cout << "Composing coordinate axes..." << std::endl;


     const Eigen::Matrix3d inv_calib_matrix =

         undistorted_camera.CalibrationMatrix().inverse();

     const Eigen::Vector4d inv_qvec = InvertQuaternion(image.Qvec());


     if (horizontal_report.success) {

       const Eigen::Vector3d horizontal_camera_axis =

           (inv_calib_matrix * horizontal_report.model).normalized();

       Eigen::Vector3d horizontal_axis =

           QuaternionRotatePoint(inv_qvec, horizontal_camera_axis).normalized();

       // Make sure all axes point into the same direction.

       if (rightward_axes.size() > 0 &&

           rightward_axes[0].dot(horizontal_axis) < 0) {

         horizontal_axis = -horizontal_axis;

       }

       rightward_axes.push_back(horizontal_axis);

       std::cout << "  Horizontal: " << horizontal_axis.transpose() << std::endl;

     }


     if (vertical_report.success) {

       const Eigen::Vector3d vertical_camera_axis =

           (inv_calib_matrix * vertical_report.model).normalized();

       Eigen::Vector3d vertical_axis =

           QuaternionRotatePoint(inv_qvec, vertical_camera_axis).normalized();

       // Make sure axis points downwards in the image, assuming that the image

       // was taken in upright orientation.

       if (vertical_camera_axis.dot(Eigen::Vector3d(0, 1, 0)) < 0) {

         vertical_axis = -vertical_axis;

       }

       downward_axes.push_back(vertical_axis);

       std::cout << "  Vertical: " << vertical_axis.transpose() << std::endl;

     }

   }


   PrintHeading1("Computing coordinate frame");


   Eigen::Matrix3d frame = Eigen::Matrix3d::Zero();


   if (rightward_axes.size() > 0) {

     frame.col(0) =

         FindBestConsensusAxis(rightward_axes, options.max_axis_distance);

   }


   std::cout << "Found rightward axis: " << frame.col(0).transpose()

             << std::endl;


   if (downward_axes.size() > 0) {

     frame.col(1) =

         FindBestConsensusAxis(downward_axes, options.max_axis_distance);

   }


   std::cout << "Found downward axis: " << frame.col(1).transpose() << std::endl;


   if (rightward_axes.size() > 0 && downward_axes.size() > 0) {

     frame.col(2) = frame.col(0).cross(frame.col(1));

     Eigen::JacobiSVD<Eigen::Matrix3d> svd(

         frame, Eigen::ComputeFullV | Eigen::ComputeFullU);

     const Eigen::Matrix3d orthonormal_frame =

         svd.matrixU() * Eigen::Matrix3d::Identity() * svd.matrixV().transpose();

     frame = orthonormal_frame;

   }


   std::cout << "Found orthonormal frame: " << std::endl;

   std::cout << frame << std::endl;


   return frame;

 }


 void AlignToPrincipalPlane(Reconstruction* recon, SimilarityTransform3* tform) {

   // Perform SVD on the 3D points to estimate the ground plane basis

   const Eigen::Vector3d centroid = recon->ComputeCentroid(0.0, 1.0);

   Eigen::MatrixXd points(3, recon->NumPoints3D());

   int pidx = 0;

   for (const auto& point : recon->Points3D()) {

     points.col(pidx++) = point.second.XYZ() - centroid;

   }

   const Eigen::Matrix3d basis =

       points.jacobiSvd(Eigen::ComputeThinU | Eigen::ComputeThinV).matrixU();

   Eigen::Matrix3d rot_mat;

   rot_mat << basis.col(0), basis.col(1), basis.col(0).cross(basis.col(1));

   rot_mat.transposeInPlace();


   *tform = SimilarityTransform3(1.0, RotationMatrixToQuaternion(rot_mat),

                                 -rot_mat * centroid);


   // if camera plane ends up below ground then flip basis vectors and create new

   // transform

   Image test_img = recon->Images().begin()->second;

   tform->TransformPose(&test_img.Qvec(), &test_img.Tvec());

   if (test_img.ProjectionCenter().z() < 0.0) {

     rot_mat << basis.col(0), -basis.col(1), basis.col(0).cross(-basis.col(1));

     rot_mat.transposeInPlace();

     *tform = SimilarityTransform3(1.0, RotationMatrixToQuaternion(rot_mat),

                                   -rot_mat * centroid);

   }


   recon->Transform(*tform);

 }


 void AlignToENUPlane(Reconstruction* recon, SimilarityTransform3* tform,

                      bool unscaled) {

   const Eigen::Vector3d centroid = recon->ComputeCentroid(0.0, 1.0);

   GPSTransform gps_tform;

   const Eigen::Vector3d ell_centroid = gps_tform.XYZToEll({centroid}).at(0);


   // Create rotation matrix from ECEF to ENU coordinates

   const double sin_lat = sin(DegToRad(ell_centroid(0)));

   const double sin_lon = sin(DegToRad(ell_centroid(1)));

   const double cos_lat = cos(DegToRad(ell_centroid(0)));

   const double cos_lon = cos(DegToRad(ell_centroid(1)));


   // Create ECEF to ENU rotation matrix

   Eigen::Matrix3d rot_mat;

   rot_mat << -sin_lon, cos_lon, 0, -cos_lon * sin_lat, -sin_lon * sin_lat,

       cos_lat, cos_lon * cos_lat, sin_lon * cos_lat, sin_lat;


   const double scale = unscaled ? 1.0 / tform->Scale() : 1.0;

   *tform = SimilarityTransform3(scale, RotationMatrixToQuaternion(rot_mat),

                                 -(scale * rot_mat) * centroid);

   recon->Transform(*tform);

 }


 }  // namespace colmap

frame
Rect frame
Definition: BitmapWindowSystem.cpp:31

image
std::shared_ptr< core::Tensor > image
Definition: FilamentRenderer.cpp:184

points
int points
Definition: FileIOFactory.cpp:144

utils.h

pose.h

colmap::Bitmap
Definition: bitmap.h:51

colmap::Bitmap::Read
bool Read(const std::string &path, const bool as_rgb=true)
Definition: bitmap.cc:485

colmap::Camera
Definition: camera.h:20

colmap::Camera::CalibrationMatrix
Eigen::Matrix3d CalibrationMatrix() const
Definition: camera.cc:75

colmap::GPSTransform
Definition: gps.h:20

colmap::GPSTransform::XYZToEll
std::vector< Eigen::Vector3d > XYZToEll(const std::vector< Eigen::Vector3d > &xyz) const
Definition: gps.cc:82

colmap::Image
Definition: image.h:29

colmap::Image::Tvec
const Eigen::Vector3d & Tvec() const
Definition: image.h:325

colmap::Image::Qvec
const Eigen::Vector4d & Qvec() const
Definition: image.h:301

colmap::Image::ProjectionCenter
Eigen::Vector3d ProjectionCenter() const
Definition: image.cc:152

colmap::RANSAC
Definition: ransac.h:56

colmap::RANSAC::Estimate
Report Estimate(const std::vector< typename Estimator::X_t > &X, const std::vector< typename Estimator::Y_t > &Y)
Definition: ransac.h:159

colmap::Reconstruction
Definition: reconstruction.h:40

colmap::Reconstruction::NumRegImages
size_t NumRegImages() const
Definition: reconstruction.h:440

colmap::Reconstruction::Transform
void Transform(const SimilarityTransform3 &tform)
Definition: reconstruction.cc:455

colmap::Reconstruction::Images
const std::unordered_map< image_t, class Image > & Images() const
Definition: reconstruction.h:500

colmap::Reconstruction::ComputeCentroid
Eigen::Vector3d ComputeCentroid(const double p0=0.1, const double p1=0.9) const
Definition: reconstruction.cc:375

colmap::Reconstruction::Image
const class Image & Image(const image_t image_id) const
Definition: reconstruction.h:454

colmap::Reconstruction::NumPoints3D
size_t NumPoints3D() const
Definition: reconstruction.h:442

colmap::Reconstruction::Camera
const class Camera & Camera(const camera_t camera_id) const
Definition: reconstruction.h:450

colmap::Reconstruction::Points3D
const std::unordered_map< point3D_t, class Point3D > & Points3D() const
Definition: reconstruction.h:508

colmap::Reconstruction::RegImageIds
const std::vector< image_t > & RegImageIds() const
Definition: reconstruction.h:504

colmap::SimilarityTransform3
Definition: similarity_transform.h:24

colmap::SimilarityTransform3::Scale
double Scale() const
Definition: similarity_transform.cc:245

colmap::SimilarityTransform3::TransformPose
void TransformPose(Eigen::Vector4d *qvec, Eigen::Vector3d *tvec) const
Definition: similarity_transform.cc:215

kMinNumSamples
static const int kMinNumSamples
Definition: coordinate_frame.cc:55

coordinate_frame.h

gps.h

line.h

logging.h

misc.h

QtCompat::endl
QTextStream & endl(QTextStream &stream)
Definition: QtCompat.h:718

Utils::distance
static double distance(T *pot1, T *pot2)
Definition: utils.h:111

colmap
Definition: AutomaticReconstructionController.h:17

colmap::UndistortImage
void UndistortImage(const UndistortCameraOptions &options, const Bitmap &distorted_bitmap, const Camera &distorted_camera, Bitmap *undistorted_bitmap, Camera *undistorted_camera)
Definition: undistortion.cc:939

colmap::DetectLineSegments
std::vector< LineSegment > DetectLineSegments(const Bitmap &bitmap, const double min_length)
Definition: line.cc:42

colmap::RotationMatrixToQuaternion
Eigen::Vector4d RotationMatrixToQuaternion(const Eigen::Matrix3d &rot_mat)
Definition: pose.cc:70

colmap::EstimateManhattanWorldFrame
Eigen::Matrix3d EstimateManhattanWorldFrame(const ManhattanWorldFrameEstimationOptions &options, const Reconstruction &reconstruction, const std::string &image_path)
Definition: coordinate_frame.cc:156

colmap::InvertQuaternion
Eigen::Vector4d InvertQuaternion(const Eigen::Vector4d &qvec)
Definition: pose.cc:93

colmap::JoinPaths
std::string JoinPaths(T const &... paths)
Definition: misc.h:128

colmap::ClassifyLineSegmentOrientations
std::vector< LineSegmentOrientation > ClassifyLineSegmentOrientations(const std::vector< LineSegment > &segments, const double tolerance)
Definition: line.cc:79

colmap::EstimateGravityVectorFromImageOrientation
Eigen::Vector3d EstimateGravityVectorFromImageOrientation(const Reconstruction &reconstruction, const double max_axis_distance)
Definition: coordinate_frame.cc:145

colmap::QuaternionRotatePoint
Eigen::Vector3d QuaternionRotatePoint(const Eigen::Vector4d &qvec, const Eigen::Vector3d &point)
Definition: pose.cc:110

colmap::PrintHeading1
void PrintHeading1(const std::string &heading)
Definition: misc.cc:225

colmap::StringPrintf
std::string StringPrintf(const char *format,...)
Definition: string.cc:131

colmap::LineSegmentOrientation::VERTICAL
@ VERTICAL

colmap::LineSegmentOrientation::HORIZONTAL
@ HORIZONTAL

colmap::DegToRad
float DegToRad(const float deg)
Definition: math.h:171

colmap::AlignToENUPlane
void AlignToENUPlane(Reconstruction *recon, SimilarityTransform3 *tform, bool unscaled)
Definition: coordinate_frame.cc:333

colmap::AlignToPrincipalPlane
void AlignToPrincipalPlane(Reconstruction *recon, SimilarityTransform3 *tform)
Definition: coordinate_frame.cc:302

ecvColor::LookUpTable::at
Rgb at(size_t color_id)
Definition: ecvColorTypes.cpp:77

ransac.h

colmap::ManhattanWorldFrameEstimationOptions
Definition: coordinate_frame.h:16

colmap::ManhattanWorldFrameEstimationOptions::max_axis_distance
double max_axis_distance
Definition: coordinate_frame.h:26

colmap::ManhattanWorldFrameEstimationOptions::max_image_size
int max_image_size
Definition: coordinate_frame.h:18

colmap::ManhattanWorldFrameEstimationOptions::min_line_length
double min_line_length
Definition: coordinate_frame.h:20

colmap::ManhattanWorldFrameEstimationOptions::max_line_vp_distance
double max_line_vp_distance
Definition: coordinate_frame.h:24

colmap::ManhattanWorldFrameEstimationOptions::line_orientation_tolerance
double line_orientation_tolerance
Definition: coordinate_frame.h:22

colmap::RANSACOptions
Definition: ransac.h:22

colmap::RANSACOptions::max_error
double max_error
Definition: ransac.h:25

colmap::UndistortCameraOptions
Definition: undistortion.h:18

colmap::UndistortCameraOptions::max_image_size
int max_image_size
Definition: undistortion.h:28

undistortion.h