计算机视觉有多先进?开一开特斯拉就知道了。深度学习技术已在人脸识别、交互式仿真和医学成像方面取得了令人兴奋的突破,但最让人心潮澎湃的当属自动驾驶技术。如今,自动驾驶的汽车已经能在高速上畅意驰骋并对各种复杂路况做出灵活反应了。
计算机如何“理解”它所“看到”的东西?本书试图将深度学习应用于计算机视觉以回答该问题。本书仅用高中代数知识阐明视觉直觉背后的概念。你将了解如何使用深度学习架构来构建视觉系统应用程序,以实现图像生成和人脸识别功能。
主要内容
图像分类和目标检测
先进的深度学习架构
迁移学习与生成对抗网络
DeepDream和神经风格迁移
视觉嵌入和图像搜索
阅读门槛
本书适用于Python中级程序员。
Mohamed Elgendy是Rakuten(乐天)公司的工程副总裁。作为一名经验丰富的人工智能专家,他曾就职于Amazon和Twilio并致力于AI产品的构建和管理。