上QQ阅读APP看书,第一时间看更新
译者序
近年来,深度学习在图像、声音和语义识别方面取得了长足的进步,首先影响的是OpenCV这样的老牌视觉识别库。因而,我们看到了OpenCV近年来的快速迭代,它在坚持以传统机器学习为主体的机器视觉的基础上,吸收了最新的深度学习成果,由原来的3.x版本升级为版本4,很多模块由原来的contrib部分固化并转入到主模块中。本书的版本升级也成了顺势而为的结果。
本书第3版秉承了一贯的面向工程的作风,在保留必要公式的情况下,将原有的工程项目升级到最新的技术,并带来了新的真实项目体验。这些项目包括在树莓派上进行实时图像处理、使用SfM模块进行3D可视化重构、使用新的深度人脸模块进行人脸检测、使用深度卷积进行车牌识别、学习全新的OpenCV.js、Android相机标定和AR、iOS全景图实现等。本书第3版尤为可贵的在于加入了第9章“为项目找到最佳OpenCV算法”和第10章“避免OpenCV中的常见陷阱”,可帮助程序员在成百上千的API中进行需求权衡、设计、技术选型、优化和避免陷阱,这些经验之谈难能可贵,显著提升了本书的实用价值。
视觉工程不是简单的技术选型,每一个实现目标的背后都可能需要烦琐的前期步骤、中期的陷阱和曲折,以及后期的反复调优,希望本书能帮助视觉工程师利用最新的OpenCV技术实现工程中的需求,找出研究与应用之间的平衡。
感谢刘波老师对本书翻译的支持,也感谢柯增燕同学对本书所做的大量前期工作。特别要感谢我的妻子李平,她的体谅和付出让我得以抽出时间来进行提高和分享的工作。