写于 2017-10-04 06:50:00| 万博官网manbet电脑版| 技术

当Matt King在2009年注册Facebook时,他已经完全失明了将近20年

他使用屏幕阅读器浏览互联网,这是一个读取网页架构和内容的软件当时,King是一名工程师在IBM和一个国际排名中的串联赛道运动竞赛者(他和一个有视力的同伴在1996年亚特兰大残奥会上获得第四名)然而,对于King来说,创建账户和寻找朋友的过程 - 可能是一个有视力的人在整个星期六早上消耗了十五分钟

更糟糕的是,一旦他走到他朋友的墙上,他们大部分都是沉默的

大多数人的帖子都是照片,没有说明性的标题,对他来说是看不见的“我想,太好了,这里还有一个对我来说没用的空间,”他说King现在是Facebook的一个无障碍专家,Jeff Wieland领导公司的交流在可靠性方面,他支持自动替代文本,这是一种依靠人工智能生成照片语音描述的新技术今天,该功能开始向iOS用户设置为英语的Facebook用户推出,并逐渐进入其他用户语言和平台在最近的一个星期一早上,King在他的iPad上进行了自动替代文字的演示在他的模拟新闻源的顶部,一位同事切尔西科勒发布了一张蓬松,俗气的比萨饼,配上意大利辣香肠和橄榄女性机器人的声音开始高速叙述页面的内容(合成的声音可以在不丢失其清晰度的情况下将最多六百个单词塞进一分钟,这样就可以让用户以相当快的速度浏览页面)“标题五级,切尔西科勒,照片,“声音说,然后它读取科勒的标题:”星期天晚上挥霍“在那一点,就国王而言,图像可能有e描绘了从特斯拉模型3到烘焙套装的任何内容他重新加载了启用了自动替代文字的页面,合成的声音吟唱着“图像可能包含披萨,食物” - 装备King有足够的背景来键入“See you at at健身房,哈哈,“或”百胜,看起来不错,“或任何数量的适当回应(如果您在iOS设备上使用Facebook,您可以自己尝试:在设置中启用VoiceOver,打开Facebook应用程序,然后滚动浏览新闻提示每当你翻过照片时,语音都会告诉你它认为照片包含的内容

可访问性一直是网络上的一个问题,特别是因为它已经变得更加可视化两年前,包括Facebook在内的数十家科技公司Wieland称之为“一次巨大的握手”,他们签署了一系列名为“无障碍富互联网应用程序套件”(ARIA)的建议,旨在使网络不仅在技术上可访问,而且让所有人都感到愉快(The公司的支持不仅反映了对平等机会的高度承诺:世界卫生组织估计,地球上近4%的人口是视障人士,是潜在客户的重要基地

根据ARIA标准,任何非 - 网页上的文本内容应具有可由屏幕阅读器说出的有意义的文本内容HTML提供了一种简单的解决方案:alt属性,嵌入在图像的底层代码中的简短描述任何希望创建可访问的设计者然后,在上传照片时只需要指定一个alt属性为了使代码有用,但是必须在整个网站上一致地实现在Facebook的情况下,这不是那么容易实现的,因为照片通常是上传的由个人用户,不需要添加标签或描述性标题 - 并且通常不会在Faceb上共享超过20亿个图像ook,Instagram,Messenger和WhatsApp每天都需要一个拥有1600万名全职人类标记器的团队才能跟上

幸运的是,在过去的几年中,机器学习的进步导致了人工智能代理的创建能够识别对象的Google Plus在2013年开始自动标记其用户的照片,而Flickr在2014年也跟进了

在这两种情况下,算法的实施主要是为了提高可搜索性它们非常准确,尽管存在一些令人震惊的失败 (这两个程序最初都倾向于将标签“猿”添加到黑人的照片中)Facebook是第一个实现可访问性技术的人,并采取了更谨慎的方法,King解释说他们的AI编程不添加标签除非它至少百分之七十确定它是正确的如果在谷歌图像搜索中一个痘痘的脸回来标记为“披萨”,没有人的感受受到伤害但如果金对朋友的照片反应她的斑点青少年对于披萨的评论,他很可能感到有所减弱,而不是被赋予权力“这绝对是一个糟糕的数据比没有数据更糟糕的情况,”金说,人工智能目前认识到大约一百个对象和概念,包括食物词和外观描述符,如“胡须”和“微笑”这种有限的词汇,结合技术内置的厌恶犯错误,意味着它的描述缺乏视觉内容的丰富性“It ca有点挑逗,“金说”人们会写'哇',但自动描述不会让我说哇“北加州红杉的照片,像大教堂一样翱翔天空,将翻译为”Image可能包含树木,天空,户外“一个订婚肖像成为”两个人,微笑,珠宝“科勒的挥霍只是”比萨饼“,而不是”意大利辣香肠和橄榄比萨饼“:系统的物体识别尚未细化到足以指定尽管如此,金说,自动替代文字使他的新闻提供“更有趣”,虽然他几乎没有成为一个高容量的评论者,但他现在更有可能“喜欢”充满信心的形象,维兰德他们的同事们去年6月开始实施自动替代文字背后的代码,几个月前他们招募了一组阿尔法测试人员,其中包括电影行业前动画和视觉效果艺术家Marco Salsiccia,两年前完全失去视力,仅仅四十分钟,由于视网膜闭塞“我以前用Facebook分享模因,”Salsiccia告诉我“后来,它变得更加个性化感觉就像我唯一的来源我正在学习如何以盲人的身份驾驭世界 - 但是我无法理解我的朋友们所发布的文章的百分之九十“在使用自动替代文字后,Salsiccia有一些投诉作为一名艺术家,他特别喜欢由于AI显然无法区分绘图和照片“还有改进的余地”这一事实感到恼火,他说,他告诉我他很期待这项技术的公开发布,但Wieland很快就指出了自动替代文字仍处于早期阶段上周,一组五千名测试人员开始使用它,通过调查提供反馈和功能请求(他们异常高的回复率是证据,Wieland建议d,对视力障碍者更好的图像描述的渴望)测试者特别热衷于AI学习识别文本和识别人脸“几乎每一个问卷,如果面部识别不是第一个请求,它是第二个“Wieland说:”这就是我渴望的事情,因为我知道我们可以做到这一点,“King说,不幸的是,Wieland指出,隐私问题使自动面部标记不受限制,至少目前在内部,但是,团队开始尝试这两个功能同时,它们使AI能够回答问题,以便用户可以通过与之交谈来收集更多信息“这只是第一步,”Wieland说