Three - Dimensional Vision Forstructure and Motion Estimation
نویسنده
چکیده
This thesis addresses computer vision techniques estimating geometric properties of the 3-D world from digital images. Such properties are essential for object recognition and classi cation, mobile robots navigation, reverse engineering and synthesis of virtual environments. In particular, this thesis describes the modules involved in the computation of the structure of a scene given some images, and o ers original contributions in the following elds. Stereo pairs recti cation. A novel recti cation algorithm is presented, which transform a stereo pair in such a way that corresponding points in the two images lie on horizontal lines with the same index. Experimental tests prove the correct behavior of the method, as well as the negligible decrease of the accuracy of 3-D reconstruction if performed from the recti ed images directly. Stereo matching. The problem of computational stereopsis is analyzed, and a new, e cient stereo matching algorithm addressing robust disparity estimation in the presence of occlusions is presented. The algorithm, called SMW, is an adaptive, multi-window scheme using left-right consistency to compute disparity and its associated uncertainty. Experiments with both synthetic and real stereo pairs show how SMW improves on closely related techniques for both accuracy and e ciency. Features tracking. The Shi-Tomasi-Kanade feature tracker is improved by introducing an automatic scheme for rejecting spurious features, based on robust outlier diagnostics. Experiments with real and synthetic images con rm the improvement over the original tracker, both qualitatively and quantitatively. iii Uncalibrated vision. A review on techniques for computing a three-dimensional model of a scene from a single moving camera, with unconstrained motion and unknown parameters is presented. The contribution is to give a critical, uni ed view of some of the most promising techniques. Such review does not yet exist in the literature. 3-D motion. A robust algorithm for registering and nding correspondences in two sets of 3-D points with signi cant percentages of missing data is proposed. The method, called RICP, exploits LMedS robust estimation to withstand the e ect of outliers. Experimental comparison with a closely related technique, ICP, shows RICP's superior robustness and reliability. iv Riassunto Questa tesi, intitolata Visione Tridimensionale per la Stima di Struttura e Moto, tratta di tecniche di Visione Arti ciale per la stima delle propriet a geometriche del mondo tridimensionale a partire da immagini numeriche. Queste propriet a sono essenziali per il riconoscimento e la classi cazione di oggetti, la navigazione di veicoli mobili autonomi, il reverse engineering e la sintesi di ambienti virtuali. In particolare, saranno descritti i moduli coinvolti nel calcolo della struttura della scena a partire dalle immagini, e verranno presentati contributi originali nei seguenti campi. Retti cazione di immagini steroscopiche. Viene presentato un nuovo algoritmo per la retti cazione, il quale trasforma una coppia di immagini stereoscopiche in maniera che punti corrispondenti giacciano su linee orizzontali con lo stesso indice. Prove sperimentali dimostrano il corretto comportamento del metodo, come pure la trascurabile perdita di accuratezza nella ricostruzione tridimensionale quando questa sia ottenuta direttamente dalle immagini retti cate. Calcolo delle corrispondenze in immagini stereoscopiche. Viene analizzato il problema della stereovisione e viene presentato un un nuovo ed e ciente algoritmo per l'identi cazione di coppie di punti corrispondenti, capace di calcolare in modo robusto la disparit a stereoscopica anche in presenza di occlusioni. L'algoritmo, chiamato SMW, usa uno schema multinestra adattativo assieme al controllo di coerenza destra-sinistra per calcolare la disparit a e l'incertezza associata. Gli esperimenti condotti con immagini sintetiche e reali mostrano che SMW sortisce un miglioramento in accuratezza ed e cienza rispetto a metodi simili . v Inseguimento di punti salienti. L'inseguitore di punti salienti di Shi-TomasiKanade viene migliorato introducendo uno schema automatico per lo scarto di punti spuri basato sulla diagnostica robusta dei campioni periferici (outliers). Gli esperimenti con immagini sintetiche e reali confermano il miglioramento rispetto al metodo originale, sia qualitativamente che quantitativamente. Ricostruzione non calibrata. Viene presentata una rassegna ragionata dei metodi per la ricostruzione di un modello tridimensionale della scena, a partire da una telecamera che si muove liberamente e di cui non sono noti i parametri interni. Il contributo consiste nel fornire una visione critica e uni cata delle pi u recenti tecniche. Una tale rassegna non esiste ancora in letterarura. Moto tridimensionale. Viene proposto un algoritmo robusto per registrate e calcolare le corrispondenze in due insiemi di punti tridimensionali nei quali vi sia un numero signi cativo di elementi mancanti. Il metodo, chiamato RICP, sfrutta la stima robusta con la Minima Mediana dei Quadrati per eliminare l'e etto dei campioni periferici. Il confronto sperimentale con una tecnica simile, ICP, mostra la superiore robustezza e a dabilit a di RICP. vi Ringraziamenti Devo a Bruno Caprile se ho deciso di intraprendere l'impervia strada della ricerca: egli e stato per me un maestro, mi ha insegnata ad amarla e mi ha dimostrato, con l'esempio, cosa fosse l'integrit a scienti ca e morale. Per quanto riguarda questa tesi, il ringraziamento pi u grande va ad Emanuele Trucco, che mi ha costantemente seguito, incoraggiato, sorretto e guidato, sia dal punto di vista scienti co, che da quello umano. Vincenzo Isaia ed Emanuele Trucco hanno letto le bozze della tesi, ed hanno contribuito con preziosi commenti. Ringrazio Agostino Dovier, Marino Miculan, Stefano Mizzaro e Vittorio Murino per l'amicizia e per l'aiuto che mi hanno prestato in varie occasioni. Tutti coloro che mi sono vicini hanno dovuto, in ragione della loro vicinanza, sopportare i momenti di cattivo umore, gli sfoghi e le assenze, sia siche che spirituali. A loro, e segnatamente a Paola, Vincenzo ed Egle, chiedo scusa e dedico questa tesi. vii
منابع مشابه
Key-Frame Selection and an LMedS-Based Approach to Structure and Motion Recovery
Auto-calibration forstructure and motion recovery can be used for match move where the goal is to insert synthetic 3D objects into real scenes and create views as if they were part of the real scene. However, most auto-calibration methods for multi-views utilize bundle adjustment with non-linear optimization, which requires a very good starting approximation. We propose a novel key-frame select...
متن کاملEstimation on Three-dimensional Motion Parameters in Binocular Vision of Robot Tracking and Control System
Abstract: Motion is an important part of visual research. There are lots of motion vision problems in industrial process control, vehicle navigation, flying target tracking and traffic monitoring. Combing three-dimensional motion of computer vision to position and track spatial position of moving objects for the achieved sequential image is a great challenge for computer vision, which is worthy...
متن کاملObject Motion Estimation Based on Hybrid Vision for Soccer Robots in 3D Space
Effective object motion estimation is significant to improve the performance of soccer robots in RoboCup Middle Size League. In this paper, a hybrid vision system is constructed by combining omnidirectional vision and stereo vision for ball recognition and motion estimation in three-dimensional (3D) space. When the ball is located on the ground field, a novel algorithm based on RANSAC and Kalma...
متن کاملDense 3D Structure and Motion Estimation as an aid for Robot Navigation
Three-dimensional scene reconstruction is an important tool in many applications varying from computer graphics to mobile robot navigation. In this paper, we focus on the robotics application, where the goal is to estimate the 3D rigid motion of a mobile robot and to reconstruct a dense three-dimensional scene representation. The reconstruction problem can be subdivided into a number of subprob...
متن کامل2D Motion Estimation in the Extraction of 3D Motion and Structure of Rigid Objects
Two-dimensional motion estimation is a task that emerges in several elds of research such as coding and compression, content-based video retrieval and computer vision. The problem has been tackled by several authors and various algorithms can be found in the literature focusing either on accuracy or low computational cost. Present work investigates the e cient application of existing motion est...
متن کاملLeast Squares Estimation of 3D Shape and Motion of Rigid Objects from Their Orthographic Projections
ÐThe extraction of motion and shape information of three-dimensional objects from their two-dimensional projections is a task that emerges in various applications such as computer vision, biomedical engineering, and video coding and mining especially after the recent guidelines of the Motion Pictures Expert Group regarding MPEG-4 and MPEG-7 standards. Present work establishes a novel approach f...
متن کامل