cpp_api/api/Indexer_8h_source.html

 // ----------------------------------------------------------------------------

 // -                        CloudViewer: www.cloudViewer.org                  -

 // ----------------------------------------------------------------------------

 // Copyright (c) 2018-2024 www.cloudViewer.org

 // SPDX-License-Identifier: MIT

 // ----------------------------------------------------------------------------


 #pragma once


 #include <Logging.h>


 #include <sstream>


 #include "cloudViewer/core/CUDAUtils.h"

 #include "cloudViewer/core/Dtype.h"

 #include "cloudViewer/core/ShapeUtil.h"

 #include "cloudViewer/core/SizeVector.h"

 #include "cloudViewer/core/Tensor.h"

 #include "cloudViewer/utility/MiniVec.h"


 // The generated "Indexer_ispc.h" header will not be available outside the

 // library. Therefore, forward declare all exported ISPC classes.

 #ifdef BUILD_ISPC_MODULE

 namespace ispc {

 struct TensorRef;

 struct Indexer;

 }  // namespace ispc

 #endif


 namespace cloudViewer {

 namespace core {


 class Indexer;


 class IndexerIterator;


 // Maximum number of dimensions of TensorRef.

 static constexpr int64_t MAX_DIMS = 5;


 // Maximum number of inputs of an op.

 // MAX_INPUTS shall be >= MAX_DIMS to support advanced indexing.

 static constexpr int64_t MAX_INPUTS = 5;


 // Maximum number of outputs of an op. This number can be increased when

 // necessary.

 static constexpr int64_t MAX_OUTPUTS = 2;


 template <int NARGS, typename index_t = uint32_t>

 struct OffsetCalculator {

     OffsetCalculator(int dims,

                      const int64_t* sizes,

                      const int64_t* const* strides)

         : dims_(dims) {

         if (dims_ > MAX_DIMS) {

             utility::LogError("tensor has too many (>{}) dims_", MAX_DIMS);

         }


         for (int i = 0; i < MAX_DIMS; ++i) {

             if (i < dims_) {

                 sizes_[i] = sizes[i];

             } else {

                 sizes_[i] = 1;

             }

             for (int arg = 0; arg < NARGS; arg++) {

                 strides_[i][arg] = i < dims_ ? strides[arg][i] : 0;

             }

         }

     }


     CLOUDVIEWER_HOST_DEVICE utility::MiniVec<index_t, NARGS> get(

             index_t linear_idx) const {

         utility::MiniVec<index_t, NARGS> offsets;

 #if defined(__CUDA_ARCH__)

 #pragma unroll

 #endif

         for (int arg = 0; arg < NARGS; arg++) {

             offsets[arg] = 0;

         }


 #if defined(__CUDA_ARCH__)

 #pragma unroll

 #endif

         for (int dim = 0; dim < MAX_DIMS; ++dim) {

             if (dim == dims_) {

                 break;

             }

             index_t mod = linear_idx % sizes_[dim];

             linear_idx = linear_idx / sizes_[dim];


 #if defined(__CUDA_ARCH__)

 #pragma unroll

 #endif

             for (int arg = 0; arg < NARGS; arg++) {

                 offsets[arg] += mod * strides_[dim][arg];

             }

         }

         return offsets;

     }


     int dims_;

     index_t sizes_[MAX_DIMS];

     index_t strides_[MAX_DIMS][NARGS];

 };


 struct TensorRef {

     // The default copy constructor works on __device__ as well so we don't

     // define it explicitly. shape_[MAX_DIMS] and strides[MAX_DIMS] will be

     // copied fully.

     TensorRef() : data_ptr_(nullptr), ndims_(0), dtype_byte_size_(0) {}


     TensorRef(const Tensor& t) {

         if (t.NumDims() > MAX_DIMS) {

             utility::LogError("Tensor has too many dimensions {} > {}.",

                               t.NumDims(), MAX_DIMS);

         }

         data_ptr_ = const_cast<void*>(t.GetDataPtr());

         ndims_ = t.NumDims();

         dtype_byte_size_ = t.GetDtype().ByteSize();

         for (int64_t i = 0; i < ndims_; ++i) {

             shape_[i] = t.GetShape(i);

             byte_strides_[i] = t.GetStride(i) * dtype_byte_size_;

         }

     }


     void Permute(const SizeVector& dims) {

         // Check dims are permuntation of [0, 1, 2, ..., n-1]

         if (static_cast<int64_t>(dims.size()) != ndims_) {

             utility::LogError("Number of dimensions mismatch {} != {}.",

                               dims.size(), ndims_);

         }

         std::vector<bool> seen_dims(ndims_, false);

         for (const int64_t& dim : dims) {

             seen_dims[dim] = true;

         }

         if (!std::all_of(seen_dims.begin(), seen_dims.end(),

                          [](bool seen) { return seen; })) {

             utility::LogError(

                     "Permute dims must be a permuntation from 0 to {}.",

                     dims.size() - 1);

         }


         // Map to new shape and strides

         SizeVector new_shape(ndims_);

         SizeVector new_byte_strides(ndims_);

         for (int64_t i = 0; i < ndims_; ++i) {

             int64_t old_dim = shape_util::WrapDim(dims[i], ndims_);

             new_shape[i] = shape_[old_dim];

             new_byte_strides[i] = byte_strides_[old_dim];

         }

         for (int64_t i = 0; i < ndims_; ++i) {

             shape_[i] = new_shape[i];

             byte_strides_[i] = new_byte_strides[i];

         }

     }


     inline bool IsContiguous() const {

         SizeVector shape(ndims_);

         SizeVector strides(ndims_);

         for (int64_t i = 0; i < ndims_; ++i) {

             shape[i] = shape_[i];

             strides[i] = byte_strides_[i] / dtype_byte_size_;

         }

         return shape_util::DefaultStrides(shape) == strides;

     }


     bool operator==(const TensorRef& other) const {

         bool rc = true;

         rc = rc && (data_ptr_ == other.data_ptr_);

         rc = rc && (ndims_ == other.ndims_);

         rc = rc && (dtype_byte_size_ == other.dtype_byte_size_);

         for (int64_t i = 0; i < ndims_; ++i) {

             rc = rc && (shape_[i] == other.shape_[i]);

             rc = rc && (byte_strides_[i] == other.byte_strides_[i]);

         }

         return rc;

     }


     bool operator!=(const TensorRef& other) const { return !(*this == other); }


 #ifdef BUILD_ISPC_MODULE

     ispc::TensorRef ToISPC() const;

 #endif


     void* data_ptr_;

     int64_t ndims_ = 0;

     int64_t dtype_byte_size_ = 0;

     int64_t shape_[MAX_DIMS];

     int64_t byte_strides_[MAX_DIMS];

 };


 enum class DtypePolicy {

     NONE,        // Do not check. Expects the kernel to handle the conversion.

                  // E.g. in Copy kernel with type casting.

     ALL_SAME,    // All inputs and outputs to to have the same dtype.

     INPUT_SAME,  // All inputs have the same dtype.

     INPUT_SAME_OUTPUT_BOOL  // All inputs have the same dtype. Outputs

                             // have bool dtype.

 };


 class TensorIterator {

 public:

     TensorIterator(const Tensor& tensor)

         : input_(TensorRef(tensor)), ndims_(tensor.NumDims()) {}


     CLOUDVIEWER_HOST_DEVICE int64_t NumWorkloads() const {

         int64_t num_workloads = 1;

         for (int64_t i = 0; i < ndims_; ++i) {

             num_workloads *= input_.shape_[i];

         }

         return num_workloads;

     }


     CLOUDVIEWER_HOST_DEVICE void* GetPtr(int64_t workload_idx) const {

         if (workload_idx < 0 || workload_idx >= NumWorkloads()) {

             return nullptr;

         }

         int64_t offset = 0;

         workload_idx = workload_idx * input_.dtype_byte_size_;

         for (int64_t i = 0; i < ndims_; ++i) {

             offset += workload_idx / input_.byte_strides_[i] *

                       input_.byte_strides_[i];

             workload_idx = workload_idx % input_.byte_strides_[i];

         }

         return static_cast<void*>(static_cast<char*>(input_.data_ptr_) +

                                   offset);

     }


 protected:

     TensorRef input_;

     int64_t ndims_;

 };


 class Indexer {

 public:

     Indexer() {}

     Indexer(const Indexer&) = default;

     Indexer& operator=(const Indexer&) = default;


     Indexer(const std::vector<Tensor>& input_tensors,

             const Tensor& output_tensor,

             DtypePolicy dtype_policy = DtypePolicy::ALL_SAME,

             const SizeVector& reduction_dims = {});


     Indexer(const std::vector<Tensor>& input_tensors,

             const std::vector<Tensor>& output_tensors,

             DtypePolicy dtype_policy = DtypePolicy::ALL_SAME,

             const SizeVector& reduction_dims = {});


     bool CanUse32BitIndexing() const;


     IndexerIterator SplitTo32BitIndexing() const;


     std::unique_ptr<Indexer> SplitLargestDim();


     Indexer GetPerOutputIndexer(int64_t output_idx) const;


     bool ShouldAccumulate() const { return accumulate_; }


     bool IsFinalOutput() const { return final_output_; }


     void ShrinkDim(int64_t dim, int64_t start, int64_t size);


     int64_t NumReductionDims() const;


     int64_t NumDims() const { return ndims_; }


     const int64_t* GetPrimaryShape() const { return primary_shape_; }

     int64_t* GetPrimaryShape() { return primary_shape_; }


     const int64_t* GetPrimaryStrides() const { return primary_strides_; }


     int64_t NumWorkloads() const;


     int64_t NumOutputElements() const;


     int64_t NumInputs() const { return num_inputs_; }


     int64_t NumOutputs() const { return num_outputs_; }


     TensorRef& GetInput(int64_t i) {

         if (i >= num_inputs_ || i < 0) {

             utility::LogError("0 <= i < {} required, however, i = {}.",

                               num_inputs_, i);

         }

         return inputs_[i];

     }

     const TensorRef& GetInput(int64_t i) const {

         if (i >= num_inputs_ || i < 0) {

             utility::LogError("0 <= i < {} required, however, i = {}.",

                               num_inputs_, i);

         }

         return inputs_[i];

     }


     TensorRef& GetOutput(int64_t i) {

         if (i >= num_outputs_ || i < 0) {

             utility::LogError("0 <= i < {} required, however, i = {}.",

                               num_outputs_, i);

         }

         return outputs_[i];

     }

     const TensorRef& GetOutput(int64_t i) const {

         if (i >= num_outputs_ || i < 0) {

             utility::LogError("0 <= i < {} required, however, i = {}.",

                               num_outputs_, i);

         }

         return outputs_[i];

     }


     TensorRef& GetOutput() {

         if (num_outputs_ > 1) {

             utility::LogError("num_outputs_ == {} > 0, use GetOutput(i)",

                               num_outputs_);

         }

         return GetOutput(0);

     }

     const TensorRef& GetOutput() const {

         if (num_outputs_ > 1) {

             utility::LogError("num_outputs_ == {} > 0, use GetOutput(i)",

                               num_outputs_);

         }

         return GetOutput(0);

     }


     bool IsReductionDim(int64_t dim) const {

         // All outputs have the same shape and reduction dims. Even if they

         // don't have the same initial strides, the reduced strides are always

         // set to 0. Thus it is okay to use outputs_[0].

         return outputs_[0].byte_strides_[dim] == 0 && primary_shape_[dim] > 1;

     }


     CLOUDVIEWER_HOST_DEVICE char* GetInputPtr(int64_t input_idx,

                                               int64_t workload_idx) const {

         if (input_idx < 0 || input_idx >= num_inputs_) {

             return nullptr;

         }

         return GetWorkloadDataPtr(inputs_[input_idx],

                                   inputs_contiguous_[input_idx], workload_idx);

     }


     template <typename T>

     CLOUDVIEWER_HOST_DEVICE T* GetInputPtr(int64_t input_idx,

                                            int64_t workload_idx) const {

         if (input_idx < 0 || input_idx >= num_inputs_) {

             return nullptr;

         }

         return GetWorkloadDataPtr<T>(inputs_[input_idx],

                                      inputs_contiguous_[input_idx],

                                      workload_idx);

     }


     CLOUDVIEWER_HOST_DEVICE char* GetOutputPtr(int64_t workload_idx) const {

         return GetWorkloadDataPtr(outputs_[0], outputs_contiguous_[0],

                                   workload_idx);

     }


     template <typename T>

     CLOUDVIEWER_HOST_DEVICE T* GetOutputPtr(int64_t workload_idx) const {

         return GetWorkloadDataPtr<T>(outputs_[0], outputs_contiguous_[0],

                                      workload_idx);

     }


     CLOUDVIEWER_HOST_DEVICE char* GetOutputPtr(int64_t output_idx,

                                                int64_t workload_idx) const {

         return GetWorkloadDataPtr(outputs_[output_idx],

                                   outputs_contiguous_[output_idx],

                                   workload_idx);

     }


     template <typename T>

     CLOUDVIEWER_HOST_DEVICE T* GetOutputPtr(int64_t output_idx,

                                             int64_t workload_idx) const {

         return GetWorkloadDataPtr<T>(outputs_[output_idx],

                                      outputs_contiguous_[output_idx],

                                      workload_idx);

     }


 #ifdef BUILD_ISPC_MODULE

     ispc::Indexer ToISPC() const;

 #endif


 protected:

     void CoalesceDimensions();


     // Permute reduction dimensions to front.

     // TODO: Sort the dimensions based on strides in ascending orderto improve

     // thread coalescing.

     void ReorderDimensions(const SizeVector& reduction_dims);


     void UpdatePrimaryStrides();


     void UpdateContiguousFlags();


     static void BroadcastRestride(TensorRef& src,

                                   int64_t dst_ndims,

                                   const int64_t* dst_shape);


     static void ReductionRestride(TensorRef& dst,

                                   int64_t src_ndims,

                                   const int64_t* src_shape,

                                   const SizeVector& reduction_dims);


     CLOUDVIEWER_HOST_DEVICE char* GetWorkloadDataPtr(

             const TensorRef& tr,

             bool tr_contiguous,

             int64_t workload_idx) const {

         // For 0-sized input reduction op, the output Tensor

         // workload_idx == 1 > NumWorkloads() == 0.

         if (workload_idx < 0) {

             return nullptr;

         }

         if (tr_contiguous) {

             return static_cast<char*>(tr.data_ptr_) +

                    workload_idx * tr.dtype_byte_size_;

         } else {

             int64_t offset = 0;

             for (int64_t i = 0; i < ndims_; ++i) {

                 offset += workload_idx / primary_strides_[i] *

                           tr.byte_strides_[i];

                 workload_idx = workload_idx % primary_strides_[i];

             }

             return static_cast<char*>(tr.data_ptr_) + offset;

         }

     }


     template <typename T>

     CLOUDVIEWER_HOST_DEVICE T* GetWorkloadDataPtr(const TensorRef& tr,

                                                   bool tr_contiguous,

                                                   int64_t workload_idx) const {

         // For 0-sized input reduction op, the output Tensor

         // workload_idx == 1 > NumWorkloads() == 0.

         if (workload_idx < 0) {

             return nullptr;

         }

         if (tr_contiguous) {

             return static_cast<T*>(tr.data_ptr_) + workload_idx;

         } else {

             int64_t offset = 0;

             for (int64_t i = 0; i < ndims_; ++i) {

                 offset += workload_idx / primary_strides_[i] *

                           tr.byte_strides_[i];

                 workload_idx = workload_idx % primary_strides_[i];

             }

             return static_cast<T*>(static_cast<void*>(

                     static_cast<char*>(tr.data_ptr_) + offset));

         }

     }


     int64_t num_inputs_ = 0;

     int64_t num_outputs_ = 0;


     TensorRef inputs_[MAX_INPUTS];


     TensorRef outputs_[MAX_OUTPUTS];


     bool inputs_contiguous_[MAX_INPUTS];


     bool outputs_contiguous_[MAX_OUTPUTS];


     int64_t primary_shape_[MAX_DIMS];


     int64_t primary_strides_[MAX_DIMS];


     int64_t ndims_ = 0;


     bool final_output_ = true;


     bool accumulate_ = false;

 };


 class IndexerIterator {

 public:

     struct Iterator {

         Iterator() {};

         Iterator(const Indexer& indexer);

         Iterator(Iterator&& other) = default;


         Indexer& operator*() const;

         Iterator& operator++();

         bool operator==(const Iterator& other) const;

         bool operator!=(const Iterator& other) const;


         std::vector<std::unique_ptr<Indexer>> vec_;

     };


     IndexerIterator(const Indexer& indexer);


     Iterator begin() const;

     Iterator end() const;


 private:

     const Indexer& indexer_;

 };


 }  // namespace core

 }  // namespace cloudViewer

indexer
Indexer indexer
Definition: BinaryEWSYCL.cpp:30

CUDAUtils.h
Common CUDA utilities.

CLOUDVIEWER_HOST_DEVICE
#define CLOUDVIEWER_HOST_DEVICE
Definition: CUDAUtils.h:44

Dtype.h

size
int size
Definition: FileIOFactory.cpp:130

offset
int offset
Definition: FileIOFactory.cpp:135

MiniVec.h

ShapeUtil.h

SizeVector.h

Tensor.h

cloudViewer::core::Dtype::ByteSize
int64_t ByteSize() const
Definition: Dtype.h:59

cloudViewer::core::IndexerIterator
Definition: Indexer.h:640

cloudViewer::core::IndexerIterator::begin
Iterator begin() const
Definition: Indexer.cpp:667

cloudViewer::core::IndexerIterator::end
Iterator end() const
Definition: Indexer.cpp:671

cloudViewer::core::IndexerIterator::IndexerIterator
IndexerIterator(const Indexer &indexer)
Definition: Indexer.cpp:641

cloudViewer::core::Indexer
Definition: Indexer.h:262

cloudViewer::core::Indexer::ReorderDimensions
void ReorderDimensions(const SizeVector &reduction_dims)
Definition: Indexer.cpp:491

cloudViewer::core::Indexer::GetOutputPtr
CLOUDVIEWER_HOST_DEVICE T * GetOutputPtr(int64_t workload_idx) const
Definition: Indexer.h:451

cloudViewer::core::Indexer::SplitLargestDim
std::unique_ptr< Indexer > SplitLargestDim()
Definition: Indexer.cpp:238

cloudViewer::core::Indexer::GetInput
const TensorRef & GetInput(int64_t i) const
Definition: Indexer.h:352

cloudViewer::core::Indexer::GetWorkloadDataPtr
CLOUDVIEWER_HOST_DEVICE T * GetWorkloadDataPtr(const TensorRef &tr, bool tr_contiguous, int64_t workload_idx) const
Definition: Indexer.h:572

cloudViewer::core::Indexer::ndims_
int64_t ndims_
Indexer's global number of dimensions.
Definition: Indexer.h:628

cloudViewer::core::Indexer::outputs_contiguous_
bool outputs_contiguous_[MAX_OUTPUTS]
Array of contiguous flags for all output TensorRefs.
Definition: Indexer.h:608

cloudViewer::core::Indexer::accumulate_
bool accumulate_
Definition: Indexer.h:637

cloudViewer::core::Indexer::GetPrimaryShape
const int64_t * GetPrimaryShape() const
Definition: Indexer.h:316

cloudViewer::core::Indexer::GetOutputPtr
CLOUDVIEWER_HOST_DEVICE T * GetOutputPtr(int64_t output_idx, int64_t workload_idx) const
Definition: Indexer.h:474

cloudViewer::core::Indexer::final_output_
bool final_output_
Definition: Indexer.h:633

cloudViewer::core::Indexer::NumDims
int64_t NumDims() const
Returns number of dimensions of the Indexer.
Definition: Indexer.h:312

cloudViewer::core::Indexer::ShouldAccumulate
bool ShouldAccumulate() const
Definition: Indexer.h:297

cloudViewer::core::Indexer::GetPrimaryStrides
const int64_t * GetPrimaryStrides() const
Definition: Indexer.h:321

cloudViewer::core::Indexer::GetOutput
const TensorRef & GetOutput(int64_t i) const
Definition: Indexer.h:368

cloudViewer::core::Indexer::GetOutputPtr
CLOUDVIEWER_HOST_DEVICE char * GetOutputPtr(int64_t output_idx, int64_t workload_idx) const
Definition: Indexer.h:461

cloudViewer::core::Indexer::num_inputs_
int64_t num_inputs_
Number of input and output Tensors.
Definition: Indexer.h:595

cloudViewer::core::Indexer::ShrinkDim
void ShrinkDim(int64_t dim, int64_t start, int64_t size)
Definition: Indexer.cpp:364

cloudViewer::core::Indexer::IsFinalOutput
bool IsFinalOutput() const
Definition: Indexer.h:299

cloudViewer::core::Indexer::primary_shape_
int64_t primary_shape_[MAX_DIMS]
Definition: Indexer.h:621

cloudViewer::core::Indexer::GetInputPtr
CLOUDVIEWER_HOST_DEVICE char * GetInputPtr(int64_t input_idx, int64_t workload_idx) const
Definition: Indexer.h:406

cloudViewer::core::Indexer::GetOutput
TensorRef & GetOutput()
Definition: Indexer.h:378

cloudViewer::core::Indexer::UpdateContiguousFlags
void UpdateContiguousFlags()
Update input_contiguous_ and output_contiguous_.
Definition: Indexer.cpp:565

cloudViewer::core::Indexer::IsReductionDim
bool IsReductionDim(int64_t dim) const
Returns true if the dim -th dimension is reduced.
Definition: Indexer.h:394

cloudViewer::core::Indexer::inputs_
TensorRef inputs_[MAX_INPUTS]
Array of input TensorRefs.
Definition: Indexer.h:599

cloudViewer::core::Indexer::outputs_
TensorRef outputs_[MAX_OUTPUTS]
Array of output TensorRefs.
Definition: Indexer.h:602

cloudViewer::core::Indexer::GetOutput
const TensorRef & GetOutput() const
Definition: Indexer.h:385

cloudViewer::core::Indexer::NumInputs
int64_t NumInputs() const
Number of input Tensors.
Definition: Indexer.h:339

cloudViewer::core::Indexer::Indexer
Indexer(const Indexer &)=default

cloudViewer::core::Indexer::NumReductionDims
int64_t NumReductionDims() const
Returns the number of reduction dimensions.
Definition: Indexer.cpp:395

cloudViewer::core::Indexer::CanUse32BitIndexing
bool CanUse32BitIndexing() const
Returns true iff the maximum_offsets in bytes are smaller than 2^31 - 1.
Definition: Indexer.cpp:198

cloudViewer::core::Indexer::ReductionRestride
static void ReductionRestride(TensorRef &dst, int64_t src_ndims, const int64_t *src_shape, const SizeVector &reduction_dims)
Definition: Indexer.cpp:602

cloudViewer::core::Indexer::GetOutputPtr
CLOUDVIEWER_HOST_DEVICE char * GetOutputPtr(int64_t workload_idx) const
Definition: Indexer.h:438

cloudViewer::core::Indexer::GetPerOutputIndexer
Indexer GetPerOutputIndexer(int64_t output_idx) const
Definition: Indexer.cpp:303

cloudViewer::core::Indexer::GetInput
TensorRef & GetInput(int64_t i)
Returns input TensorRef.
Definition: Indexer.h:345

cloudViewer::core::Indexer::NumWorkloads
int64_t NumWorkloads() const
Definition: Indexer.cpp:406

cloudViewer::core::Indexer::NumOutputElements
int64_t NumOutputElements() const
Returns the number of output elements.
Definition: Indexer.cpp:414

cloudViewer::core::Indexer::NumOutputs
int64_t NumOutputs() const
Number of output Tensors.
Definition: Indexer.h:342

cloudViewer::core::Indexer::BroadcastRestride
static void BroadcastRestride(TensorRef &src, int64_t dst_ndims, const int64_t *dst_shape)
Definition: Indexer.cpp:575

cloudViewer::core::Indexer::inputs_contiguous_
bool inputs_contiguous_[MAX_INPUTS]
Array of contiguous flags for all input TensorRefs.
Definition: Indexer.h:605

cloudViewer::core::Indexer::GetOutput
TensorRef & GetOutput(int64_t i)
Returns output TensorRef.
Definition: Indexer.h:361

cloudViewer::core::Indexer::GetPrimaryShape
int64_t * GetPrimaryShape()
Definition: Indexer.h:317

cloudViewer::core::Indexer::num_outputs_
int64_t num_outputs_
Definition: Indexer.h:596

cloudViewer::core::Indexer::GetWorkloadDataPtr
CLOUDVIEWER_HOST_DEVICE char * GetWorkloadDataPtr(const TensorRef &tr, bool tr_contiguous, int64_t workload_idx) const
Definition: Indexer.h:542

cloudViewer::core::Indexer::primary_strides_
int64_t primary_strides_[MAX_DIMS]
Definition: Indexer.h:625

cloudViewer::core::Indexer::GetInputPtr
CLOUDVIEWER_HOST_DEVICE T * GetInputPtr(int64_t input_idx, int64_t workload_idx) const
Definition: Indexer.h:424

cloudViewer::core::Indexer::SplitTo32BitIndexing
IndexerIterator SplitTo32BitIndexing() const
Definition: Indexer.cpp:234

cloudViewer::core::Indexer::UpdatePrimaryStrides
void UpdatePrimaryStrides()
Update primary_strides_ based on primary_shape_.
Definition: Indexer.cpp:556

cloudViewer::core::Indexer::Indexer
Indexer()
Definition: Indexer.h:264

cloudViewer::core::Indexer::operator=
Indexer & operator=(const Indexer &)=default

cloudViewer::core::Indexer::CoalesceDimensions
void CoalesceDimensions()
Definition: Indexer.cpp:425

cloudViewer::core::SizeVector
Definition: SizeVector.h:70

cloudViewer::core::SmallVectorBase::size
size_t size() const
Definition: SmallVector.h:119

cloudViewer::core::TensorIterator
Definition: Indexer.h:222

cloudViewer::core::TensorIterator::NumWorkloads
CLOUDVIEWER_HOST_DEVICE int64_t NumWorkloads() const
Definition: Indexer.h:227

cloudViewer::core::TensorIterator::input_
TensorRef input_
Definition: Indexer.h:251

cloudViewer::core::TensorIterator::TensorIterator
TensorIterator(const Tensor &tensor)
Definition: Indexer.h:224

cloudViewer::core::TensorIterator::ndims_
int64_t ndims_
Definition: Indexer.h:252

cloudViewer::core::TensorIterator::GetPtr
CLOUDVIEWER_HOST_DEVICE void * GetPtr(int64_t workload_idx) const
Definition: Indexer.h:235

cloudViewer::core::Tensor
Definition: Tensor.h:32

cloudViewer::core::Tensor::NumDims
int64_t NumDims() const
Definition: Tensor.h:1172

cloudViewer::core::Tensor::GetDtype
Dtype GetDtype() const
Definition: Tensor.h:1164

cloudViewer::core::Tensor::GetDataPtr
T * GetDataPtr()
Definition: Tensor.h:1144

cloudViewer::core::Tensor::GetStride
int64_t GetStride(int64_t dim) const
Definition: Tensor.h:1139

cloudViewer::core::Tensor::GetShape
SizeVector GetShape() const
Definition: Tensor.h:1127

LogError
#define LogError(...)
Definition: Logging.h:60

Logging.h

cloudViewer::core::shape_util::WrapDim
int64_t WrapDim(int64_t dim, int64_t max_dim, bool inclusive)
Wrap around negative dim.
Definition: ShapeUtil.cpp:131

cloudViewer::core::shape_util::DefaultStrides
SizeVector DefaultStrides(const SizeVector &shape)
Compute default strides for a shape when a tensor is contiguous.
Definition: ShapeUtil.cpp:214

cloudViewer::core::MAX_OUTPUTS
static constexpr int64_t MAX_OUTPUTS
Definition: Indexer.h:46

cloudViewer::core::MAX_DIMS
static constexpr int64_t MAX_DIMS
Definition: Indexer.h:38

cloudViewer::core::DtypePolicy
DtypePolicy
Definition: Indexer.h:200

cloudViewer::core::DtypePolicy::ALL_SAME
@ ALL_SAME

cloudViewer::core::DtypePolicy::INPUT_SAME_OUTPUT_BOOL
@ INPUT_SAME_OUTPUT_BOOL

cloudViewer::core::DtypePolicy::INPUT_SAME
@ INPUT_SAME

cloudViewer::core::DtypePolicy::NONE
@ NONE

cloudViewer::core::MAX_INPUTS
static constexpr int64_t MAX_INPUTS
Definition: Indexer.h:42

cloudViewer::t::geometry::kernel::voxel_grid::index_t
int index_t
Definition: VoxelBlockGrid.h:23

cloudViewer
Generic file read and write utility for python interface.
Definition: AutoSegmentationTools.h:16

cloudViewer::core::IndexerIterator::Iterator
Definition: Indexer.h:642

cloudViewer::core::IndexerIterator::Iterator::operator==
bool operator==(const Iterator &other) const
Definition: Indexer.cpp:660

cloudViewer::core::IndexerIterator::Iterator::operator++
Iterator & operator++()
Definition: Indexer.cpp:651

cloudViewer::core::IndexerIterator::Iterator::operator*
Indexer & operator*() const
Definition: Indexer.cpp:649

cloudViewer::core::IndexerIterator::Iterator::Iterator
Iterator()
Definition: Indexer.h:643

cloudViewer::core::IndexerIterator::Iterator::Iterator
Iterator(Iterator &&other)=default

cloudViewer::core::IndexerIterator::Iterator::operator!=
bool operator!=(const Iterator &other) const
Definition: Indexer.cpp:663

cloudViewer::core::IndexerIterator::Iterator::vec_
std::vector< std::unique_ptr< Indexer > > vec_
Definition: Indexer.h:652

cloudViewer::core::OffsetCalculator
Definition: Indexer.h:49

cloudViewer::core::OffsetCalculator::sizes_
index_t sizes_[MAX_DIMS]
Definition: Indexer.h:101

cloudViewer::core::OffsetCalculator::OffsetCalculator
OffsetCalculator(int dims, const int64_t *sizes, const int64_t *const *strides)
Definition: Indexer.h:50

cloudViewer::core::OffsetCalculator::get
CLOUDVIEWER_HOST_DEVICE utility::MiniVec< index_t, NARGS > get(index_t linear_idx) const
Definition: Indexer.h:70

cloudViewer::core::OffsetCalculator::dims_
int dims_
Definition: Indexer.h:100

cloudViewer::core::OffsetCalculator::strides_
index_t strides_[MAX_DIMS][NARGS]
Definition: Indexer.h:102

cloudViewer::core::TensorRef
A minimalistic class that reference a Tensor.
Definition: Indexer.h:106

cloudViewer::core::TensorRef::byte_strides_
int64_t byte_strides_[MAX_DIMS]
Definition: Indexer.h:197

cloudViewer::core::TensorRef::TensorRef
TensorRef(const Tensor &t)
Definition: Indexer.h:112

cloudViewer::core::TensorRef::shape_
int64_t shape_[MAX_DIMS]
Definition: Indexer.h:196

cloudViewer::core::TensorRef::ndims_
int64_t ndims_
Definition: Indexer.h:194

cloudViewer::core::TensorRef::IsContiguous
bool IsContiguous() const
Returns True if the underlying memory buffer is contiguous.
Definition: Indexer.h:164

cloudViewer::core::TensorRef::operator==
bool operator==(const TensorRef &other) const
Definition: Indexer.h:174

cloudViewer::core::TensorRef::Permute
void Permute(const SizeVector &dims)
Permute (dimension shuffle) the reference to a Tensor.
Definition: Indexer.h:132

cloudViewer::core::TensorRef::data_ptr_
void * data_ptr_
Definition: Indexer.h:193

cloudViewer::core::TensorRef::TensorRef
TensorRef()
Definition: Indexer.h:110

cloudViewer::core::TensorRef::operator!=
bool operator!=(const TensorRef &other) const
Definition: Indexer.h:186

cloudViewer::core::TensorRef::dtype_byte_size_
int64_t dtype_byte_size_
Definition: Indexer.h:195

cloudViewer::utility::MiniVec
Definition: MiniVec.h:24