Система побудована на таких же принципах, на яких будуються існуючі тривимірні камери. Лазер посилає короткий імпульс інфрачервоного світла, а спеціальний датчик вимірює час, витрачений світлом на шлях до об'єкта і назад. Традиційні системи, що працюють на принципі виміру часу використовують один з двох доступних методів, щоб отримати інформацію про глибину кожного пікселя зображення.
Система LIDAR використовує розгортку лазерного променя, який представляє серію коротких імпульсів, по одному імпульсу на піксел зображення, для кожного окремого імпульсу вимірюється час повернення відбитого світла. Такі системи повільні і вимагають застосування механічних пристроїв, що здійснюють розгортку лазерного променя.
Більш дорогі і високоякісні тривимірні камери використовують інший підхід. Вся сцена відразу висвітлюється імпульсом розсіяного лазерного світла, а для визначення глибини кожного пікселя використовуються матриці чутливих елементів. Такі матриці швидкодіючих чутливих елементів хоч і виготовляються подібно до звичайних матриць, але коштують набагато дорожче. Вартість таких камер становить тисячі доларів.
Дослідники з Массачусетського технологічного інституту, застосувавши складні алгоритми математичної обробки сигналу, поєднати два вищенаведених методу в один досить швидкодіючий метод. У новій системі використовується оригінальний датчик-фотоприймач, який по суті є камерою з одним єдиним пикселом, а вся сцена висвітлюється відразу лазером, який виробляє серію коротких імпульсів.
Для суміщення візуальних даних, отриманих звичайною камерою з даними глибини використовується метод так званої параметричної обробки сигналу. Він працює завдяки допущенню, що всі поверхні в межах одного пікселя зображення є плоскими. Це, звичайно не зовсім так, але фізика світла, відбитого від плоскої поверхні більш проста, ніж фізика світла, відбитого кривими поверхнями.
Але параметричний алгоритм адаптує отриману інформацію до математичної моделі, заснованої на відображенні світла від плоских поверхонь, що дозволяє отримати досить точну тривимірне зображення, маючи мінімум початкової візуальної інформації.
Використання складних математичних алгоритмів дозволяє використовувати вельми прості апаратні засоби, дешевий фотодетектор і звичайний аналого-цифровий перетворювач (АЦП), стандартний вузол всіх мобільних телефонів. Фоточутливий елемент має швидкодію 0,7 наносекунди і для обробки надходять з нього даних цілком вистачає продуктивності процесорів, які встановлюються в смартфонах. Для порівняння, ігрова приставка Xbox для обробки даних від контролера Kinect вимагає чималої частини обчислювальної потужності свого графічного процесора (GPU).