信息无障碍,让障碍群体拥抱人工智能

最近,我们关注到两则新闻。第一则是,一名深圳的视障工程师蔡勇斌自学编程成为一家机构的测试总监,被包括《南方都市报》、英国《每日邮报》在内的国内外媒体争相报道,也让他所在的“信息无障碍研究会”视障工程师团队进入大众视野;

另第二则是,一位视障用户发表的一篇谈论手机QQ OCR文字识别功能的帖子,分享了人工智能落地应用带给视障群体的体验。

互联网确实在一定程度上改变了障碍群体的生活,但相比健全人来说,这些改变显然还不够。

不过,这两年随着人工智能在各个应用层面的深入,障碍群体也成为技术革新红利的受益者,甚至可以通过人工智能更接近真实地“看到”或“听到”外面的世界。

包括BAT在内的不少互联网公司都已将人工智能视为业务增长的核心驱动力,展开了人工智能的军备竞赛,也取得不少研究成果。

腾讯旗下就下设优图实验室、AI Lab及微信AI三个人工智能团队,投入大批资源人力,抢占人工智能潮头。

其中之一的优图实验室主要专注于机器学习、模式识别、认知技术的研究落地,并将技术开放应用到QQ、财付通、天天P图、滴滴、中国联通等众多产品中。

这些技术应用不仅优化了健全人的体验,更为障碍群体带来的重大利好,推动信息无障碍,让他们像健全人一样拥抱互联网和独立生活。

从这个层面来说,人工智能的应用创造的价值不可谓不大。

在了解人工智能对障碍群体生活的改变之前,我们先了解一下这个群体以及信息无障碍事业。

障碍群体与信息无障碍

从购物到通信,从工作到娱乐,互联网的高速发展让每个网民都享受到技术革新红利,其中也包括障碍群体。

2016年3月首份《中国互联网视障用户基本情况报告》发布,显示目前中国有1300万视障者,占总人口的1.2%到1.3%,和健全人一样,身处互联网时代的他们也一样使用电脑、手机、Pad,通过互联网交流、购物、学习。

图:蔡勇斌在玩“拳皇”游戏

除此之外,中国还有7000万读写障碍者、2000万听力障碍者,以及1.3亿老年人,和视障群体一样,他们也一样期待实现“信息无障碍”。

障碍群体的互联网体验主要通过搭建智能手机、读屏软件等“信息无障碍”产品实现。与物理空间的无障碍环境建设类似,信息无障碍通过给互联网产品加设“盲道”、“坡道”、“升降机”等多种方式帮助障碍群体完成互联网体验。

1997年2月,万维网联盟(W3C)为了成立WAI(Web Accessibility initiative),制定了一系列的关于信息无障碍的标准、规范、检测表等,并在全球范围推动无障碍网络运动。

我国正式提出信息无障碍概念是2004年在北京举办的第一届中国信息无障碍论坛。

“读屏软件”是障碍用户常用的一种辅助工具。国内障碍用户常用的主流读屏软件根据客户端的不同,主要分为两类:PC端有争渡、永德、NVDA等;移动端有VoiceOver、TalkBack、保益等。读屏软件能把屏幕上的内容转换成语音,障碍人士只需点击键盘按键、滑动手指或双击屏幕就能获取相关的信息。

但仍有大量问题仅靠读屏软件是无法解决的。

例如,代码书写不规范引起的读取失败,页内跳转、页面弹窗时不注重焦点管理造成的操作不畅。

导致这些问题的主要原因有两个:一些企业并不知道视障群体也是他们的用户,不知道什么是信息无障碍;一些企业知道,但由于不了解用户的真实需求,产品无障碍体验做得不好。

最终的结果是,在互联网体验上,障碍群体并不能做到与健全人的平等。

《中国互联网视障用户基本情况报告》显示,66%的视障者认为目前我国互联网产品勉强能让视障者使用,另有20%的视障者认为大多数互联网产品很难使用。

“大多数产品很难用”,障碍群体需要怎样的产品?

为了帮助障碍群体表达需求,寻找解决路径,2005年中国大陆第一家致力于信息无障碍环境建设的民间NGO“信息无障碍研究会”成立了。

该组织还组建了一支精通IT和信息无障碍专业知识的、由障碍群体组成的、全职的“信息无障碍工程师”团队,前文提到的视障工程师蔡勇斌就是其中一员。

相较于互联网企业内部的软件工程师,蔡勇斌所在的团队更加了解障碍群体的思维方式和使用习惯,也更加懂得这个群体的需求。在蔡勇斌看来,障碍群体的互联网需求并不止于基本的通讯、信息浏览,还包括丰富的学习、娱乐体验。

截至目前,蔡勇斌所在的工程师团队已经为包括手机QQ、微信、手机淘宝、支付宝等在内的超过100款款互联网产品提供包括咨询、测试与解决方案、培训等在内的信息无障碍服务。

图:蔡勇斌在工作

信息无障碍研究会同样获得了互联网公司的关注。2013年,信息无障碍研究会与腾讯、阿里巴巴集团、百度、微软(中国)等互联网巨头共同发起“信息无障碍产品联盟”,推动信息无障碍事业的扩大。

腾讯对信息无障碍的支持最早始于QQ对读屏软件的支持。

2009年,腾讯的黄希彤开始关注并推进信息无障碍,项目从QQ、QQ空间等产品发起,逐渐扩散到全公司20多个产品和技术团队中,包括微信、QQ音乐等。

从2012年开始,腾讯专门成立团队进行QQ的无障碍化改造,同时一直与信息无障碍研究会的工程师团队保持密切合作。

最终QQ 2013版本通过支持无障碍标准化接口,完善键盘的操作体验,让障碍用户更顺畅的通过QQ与外界沟通。

2012年,腾讯成立优图实验室,在图像处理、模式识别、机器学习、数据挖掘、深度学习、音频语音分析等领域开展技术研发和业务落地。

其中OCR识别技术已经在越来越多地应用到实际的场景中,推动整个文本检测领域的消费应用升级,包括障碍群体的各类互联网体验。

开头提到信息无障碍研究会的一位视障成员小悟发布一篇谈论手机QQ OCR识别功能的帖子,讲述信息无障碍研究会工程师在常规对手机QQ进行无障碍测试中得知OCR识别功能即将上线。

通过这一功能,用户收到的所有相关图片中原有的文字都可以秒变文本,其体验甚至优于ABBYY等专业级识别应用。

基于对障碍用户,特别是视障群体需求的理解,信息无障碍研究会工程师意识到这一功能价值巨大,建议重点优化无障碍体验。

这一反馈被迅速传递到腾讯公司,手机QQ、腾讯优图与信息无障碍研究会快速成立专项讨论小组,推动此功能的专项无障碍优化。

几周后发布的7.1.8版本中,各项没有文字命名的控件都做了信息无障碍支持。

受益者不止小悟这样的视障人士。手机QQ通过 OCR识别功能还可以通过识别阅读实体书、药品说明,甚至沐浴露和洗发水等任何存在识别困难的图片及文本。

这意味着,不管是视障人士还是视力下降的老人,都能自主解决生活中的细节难题。对于他们来说,能够体验到更多等同于健全人的乐趣,才是最大的欣慰。

这还只是优图人工智能应用的冰山一角。到目前为止,优图实验室的AI技术已经广泛应用在金融、安防、寻亲、医疗等领域。同时,团队也一直关注障碍群体的需求,努力让技术普惠到更多人。我们也期待更多惠及障碍群体的应用更快的出现在主流互联网产品中。

信息无障碍事业任重道远

蔡勇斌、小悟代表的是中国障碍群体接触互联网技术的最前沿人群,他们的呼号与努力已经显现出效果,但对于庞大的整体来说,这些改变远远不够。

图:蔡勇斌和同事走在路上

企业不能缺位,政策法规推动的行业标准同样关键,强制性和政策鼓励性法规是推动信息无障碍加速发展的强有力助推器。

但事实上,与欧美一些国家相比,我国在这方面仍存在颇多不足。

以美国为例,首先在基础法律上有残障人士歧视法案,作为基本的支持性法律条文。

基于此条文,政府也要求在通信、信息科技、运输、教育等等行业和领域实现无障碍,并且出台Section 508,对于政府采购无障碍服务和产品给予最大的支持和政策鼓励。比如通信行业有《21世纪通讯及视频科技无障碍法案》,给出了无障碍指导意见以及政策支持方向。

在互联网产品端的实现上,信息无障碍应该不仅仅是加分项,而是必选项。Facebook的工程师们就公开表态,没有进行信息无障碍优化的产品是拿不出手的产品。

在推动信息无障碍这条路上,信息无障碍研究会已默默走过10多年。

信息无障碍研究会有关负责人曾经表示,理想的行业规范,是在产品调研和规划之初,就考虑产品的信息无障碍,或者至少将之纳入到产品的开发和维护的流程当中。

我们也希望BAT的示范效应,可以加速中国信息无障碍的进程。

对于未来的期望,蔡勇斌的回答让人意外却又感慨:“我们的工作就是为盲人进入互联网时代搭建基础,信息无障碍一旦实现,互联网的力量就可以让我们和常人实现生活和工作上的真正平等,我的工作也就不需要继续了。”