阅读新闻

姚班校友、斯坦福助理教授吴佳俊翻译视觉计算经典《Vision》中文

发布日期:2022-01-21 18:13   来源:未知   阅读:

  这本书的作者大卫 · 马尔(David Courtnay Marr)在计算机领域几乎无人不知。他是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。为了纪念其贡献,计算机领域顶会 ICCV 特别设置了「马尔奖」,该奖项被看作是计算机视觉研究方面的最高荣誉之一。

  马尔在 1980 年去世,一生的研究心血集结于遗著《Vision》中。在这本书中,马尔描述了理解视觉感知的通用框架,并介绍了关于如何研究和理解大脑及其功能等更广泛的问题。

  长期以来, 马尔的创造力、智力以及整合来自神经科学、心理学和计算的见解和数据的能力,影响了来自大脑和认知科学领域的众多研究人员。

  这本书厘清了计算理论、算法、实现三个研究层次,不仅对神经科学和认知科学都产生了深远影响,也对计算机视觉在 1980 — 1990 年代的蓬勃发展提供了指导思想。

  马尔视觉计算理论的提出,标志着计算机视觉成为了一门独立的学科。《Vision》影响了一代大脑和认知科学家,激励了许多人进入该领域。

  北京通用人工智能研究院院长,北京大学、清华大学讲席教授朱松纯表示:「我在 1989 年作为一名大三学生有幸读到这本书的第一个中译本,从而走上了计算机视觉的科研道路。」

  粤港澳大湾区数字经济研究院理事长,美国国家工程院外籍院士沈向洋表示:「我看过的第一本计算机视觉英文书就是 David Marr 的 Vision。」

  马尔关注的低层视觉和三维结构的重建在很长一段时间内主导了计算机视觉的研究,我国正式步入“探日”时代,探测太阳有何。而低层视觉和三维重建确实是人类视觉中不可或缺的部分。除了计算理论的进展,计算机视觉领域过去十年的爆发式进展还应当归功于算法(以卷积神经网络和反向传播算法为代表)、硬件实现(以 GPU 为代表)和数据(以 ImageNet 为代表)这几个层次的进展。其中,计算理论、算法和实现三者与马尔的三个理解层次完全符合。

  在近年深度学习的热潮之中,掌握本书介绍的视觉计算理论,对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。

  中文版《视觉》的译者是清华姚班校友、斯坦福大学计算机科学系助理教授吴佳俊。

  在书籍的推荐序言中,斯坦福大学红杉讲席教授,美国国家工程院、国家医学院、艺术与科学院院士李飞飞表示:「Marr 在《视觉》一书中描述的视觉计算理论的思想,在数十年间主导了计算机视觉的发展。四十年后的今天,我们再读这本书,会发现虽然 Marr 的具体计算理论可能是理想化的,但他对计算理论这一概念的追求,启发了我们找到了物体识别这个新的计算目标,构建了 ImageNet 这样的数据集,并最终影响了今日计算机视觉的发展。」

  最后,为了满足读者们的热情,机器之心特别向读者赠送 10 本《视觉》。读者可以根据自己对这一的了解,在留言区写下感想,获赞最多的前 10 名读者将获赠此书。未获奖读者可以点击「阅读原文」中的链接,原价 119 元,优惠价 69 元包邮。