盲人水墨画师,那些团体开采了三个新算法

作者:生活摄影

图片 1

图片 2

对于计算机来说,最困难的任务之一是“如何回答视觉问题”,也就是回答关于图像的问题。这不是理论上的脑筋急转弯:这些技能对于盲人的日常生活是至关重要的。

56岁的盲人摄影师Rosita McKenzie将于8月份在爱丁堡艺术节上展示她的摄影作品。

这是一场别开生面的摄影展在加州大学举办,与普通摄影展不同,这次展览的作品全都出自盲人摄影师之手。到底盲人心中的世界是什么样的?展出的作品中,不乏传统意义上的好作品,更有一些非常新颖精彩的拍摄视角,但也有一些没对好焦,有的连画面都是模糊的,但都是这些盲人摄影师真实的生活写照。

图片 3

大家一定都会很好奇盲人要怎样拍摄她所理解的世界,甚至是他们能够拍出正常的照片吗?这里给出的照片都是Rosita拍摄的。

穿透黑暗的凝视

盲人可以使用照相软件来拍照,并附上问题,比如,“这件衬衫什么颜色?”或者“牛奶什么时候过期?”然后请志愿者提供答案。这些图像往往由于聚焦不准,变得很模糊,使志愿者无法作答。

Rosita在采访中说道:“我从未想过自己能够拍摄照片。拍照的过程帮助我把一些东东烙印在了我记忆中,一些你们称之为画面,而在我头脑里并不那么清晰的玩意。”

拍摄:Kurt Weston

计算机视觉系统可以帮助他们,比如,如果拍摄的照片不合适,这个系统将会提示照相者重新拍摄。但目前机器还不能做到这一点,部分原因是没有大量的真实图像数据可以用来训练它们。

“我能够通过触摸、拥抱等动作来了解一个人,不仅仅是外形,这种方式也能让我了解对方的内心。例如我的朋友Mary MacIver,我觉得她是一个害羞的人,所以我只会悄悄的拍她的背影。”

Weston是这次参展的12位盲人摄影师之一,其中4人并不是完全看不见,但只剩下非常微弱的视力。

德克萨斯大学-奥斯汀分校的Danna Gurari和几位同事近日推出了包含31000张图片的数据库,以及有关这些图片的问题和答案。

Rosita使用全自动的数码相机,这能帮助她完成对焦等动作,有时候她也需要助手帮助她完成拍摄

My Dying Machine

图片 4

拍摄:Kurt Weston

同时,Gurari和同事给机器视觉界带来一个挑战:使用他们的数据集训练机器,解决现实问题,使机器成为盲人日常生活中一个有效的助手。

Weston的摄影技巧包括要求他的拍摄对象将他们脸朝向相机,这样做不仅仅赋予了他的作品写实主义的意味,更在被摄者靠着玻璃的区域创造了一片浓厚的阴影,这块阴影不仅生动而且突出了细节,而其他在远处的东西也迅速被融入了模糊和黑暗中。

该数据集来自现有的名为VizWiz的应用程序,该应用程序由匹兹堡卡内基梅隆大学的Jeff Bigham及其同事开发,目的是帮助盲人。 Bigham也是研究小组的成员。

帽贝

盲人可以使用这个APP来拍摄照片,并且附上要问的问题,然后发送给志愿者团队,由他们回答这些问题。但是这个APP也有缺点。比如,志愿者因为某些原因无法作答,或图像本身没有显示答案。

拍摄:Bruce Hall

图片 5

虽然深受眼疾的折磨,但Hall依然有一点微弱的视力。对他而言,相机或其他设备都是一种了解身边世界的更好的工具。我爱相机,我需要相机。他说。

为了找到更好的方法,Gurari和同事分析了70000张照片,这些照片来自VizWiz用户的分享。这个团队删除了包含信用卡信息、地址等个人详细信息的照片,只留下了大约31000张照片及其相关录音。

狂乱

然后他们向亚马逊Mechanical Turk众包服务中心的工作人员展示了这些图片和问题,要求每个工作人员提供一个由短句组成的答案。他们为每个图像收集10个答案以确保答案准确。

拍摄:Bruce HallHall的生活,很大一部分是围绕在他患有孤独症的双胞胎儿子Jack和James身上的。

这31000张图片、问题和答案构成了新的VizWiz数据库,Gurari和他的同事正在公开发布这个数据库,同时,还对数据进行了初步分析,对机器视觉在提供帮助方面面临的挑战提供了独特的见解。

拍摄:Gerardo Nigenda

图片 6

今年42岁的Nigenda生于墨西哥,他管自己的作品叫交互拍摄。就像他照片中表达的那样,他对声音、记忆和其他感官触觉很敏锐,并且会用盲文在照片上表达出自己的感受。这种拍摄方法其实是一种双盲:Nigenda会请一个视力健全的人帮助描述自己拍的照片,但这个视力正常的人又无法理解Nigenda写的盲文,需要依赖他的解释。这幅照片的意义大致可以这么理解:在有形与无形之间,可以到一种情感上的平衡。

只有2%的盲人愿意机器以“是”或“否”来回答,低于2%的盲人愿意机器只回复数字。

卡尔顿山

问题有时候很简单,但并不总是这样。许多问题只能笼统地概括为“这是什么?”而且还有其他意想不到的问题。事实表明,虽然大多数问题都以“what”开头,但有大约四分之一的问题通常以一个非常突兀的词开始。这可能是在记录过程中因为剪辑问题而导致的,但有些问题仍然是可以作答的。例如,记录的问题是“卖出或使用此牛奶的日期”,如果图像提供了正确的信息,就可以直接回答。

拍摄:Rosita McKenzie

经过研究小组的分析,超过四分之一的图像无法提供答案,因为这些图像不清楚或不包含相关的信息。能够快速发现这些问题,对于机器视觉算法来说将是一个好的开端。

因为看不到,苏格兰艺术家McKenzie的这幅作品充满着自在随性。她的灵感并非来源于视觉的刺激。我把我的相机放在离自己一臂长的地上,或者将它举过头顶,她说,因为看不见,所以我的拍摄可能带有实验性质,但我能感觉到光线照射到脸上,能听到风吹树叶的声音,能闻到空气中花儿的芬芳。人们问我怎样把握我的镜头,呵呵,事实上,我并不。

这也是机器视觉社区所面临的挑战。Gurari及其他研究人员说:“我们引入这个数据集,是为了鼓励更大的社区开发更多的能够帮助盲人的通用算法。改进VizWiz算法可以同时让更多的人了解盲人的技术需求,同时为研究人员开发帮助盲人消除障碍的辅助技术,提供了一个令人兴奋的新机会。”

门口的查理

这无疑是个值得追求的目标。

拍摄:Pete Eckert

原文链接:

来源:MIT科技评论

智能观 编译

我是个很视觉化的人。Eckert说,我只是看不到而已。从1980年刚刚完全看不见开始,Eckert就开始拍摄照片。对他而言,看不见反而是一种优势。能看到的摄影师总是抱怨自己能看到的东西。我对他们说,如果你看不到,只是因为你的视觉给你带来了干扰。

—完—

电解人

亲爱的朋友:

是的,这无疑是个值得追求的目标。相信有一天,让技术真正惠及每个人,终将成为现实。

近安!

智能观 一米

2018-3-11 于北京中关村

想知道AI加教育领域有哪些最新研究成果?

想要AI领域更多的干货?

想了解更多专家的“智能观”?

请在对话界面点击“找找看”,去获取你想要的内容吧。

声明:

编译文章旨在帮助读者了解行业新思想、新观点及新动态,为原作者观点,不代表智能观观点。

拍摄:Pete Eckert

图片 7

Eckert先在室内的某一处对好焦,关上工作室所有的灯,然后打开慢门,用光、蜡烛、激光或其他光线做画笔,在镜头前涂鸦。

Hesse总是在流浪,她几乎跑过世界上的各个地方,而她身边总有一台照相机。她说她能用自己的一只眼睛,看到事物的概貌,她凭借着好奇心和灵感拍摄,在陌生的地方,我会被某些色彩、声音或者模糊的影像吸引,我走到它面前,却完全不知道那是什么,所以我就用相机拍下它。之后,我会根据拍下的照片弄明白自己看到了什么。

Hesse总是在流浪,她几乎跑过世界上的各个地方,而她身边总有一台照相机。她说她能用自己的一只眼睛,看到事物的概貌,她凭借着好奇心和灵感拍摄,在陌生的地方,我会被某些色彩、声音或者模糊的影像吸引,我走到它面前,却完全不知道那是什么,所以我就用相机拍下它。之后,我会根据拍下的照片弄明白自己看到了什么。

编辑:admin

本文由www.4546.com发布,转载请注明来源

关键词: www.4546.com