摄像艺术_摄像交流论坛-摄像123网

深圳市信息无障碍研究会秘书长杨骅表示

发布:admin05-26分类: 摄像交流

  5月16日,全球无障碍宣传日之际,腾讯优图实验室宣布攻克AI手语识别技术挑战,联合深圳市信息无障碍研究会发布“优图AI手语翻译机”,致力于通过人工智能技术为听障人群搭建无障碍沟通平台。

  据优图实验室AI手语识别项目组研究员阳赵阳介绍,优图AI手语翻译机以普通摄像头作为手语采集装置,依托高性能计算机进行后台运算,用户只需面对摄像头完成手语表达,翻译机屏幕界面就能快速把手语转换为文字,帮助听障人士和健听人士进行正常交流,未来有望在机场、高铁、民政窗口等公共场所部署应用,助力信息无障碍城市建设。

  据介绍,此次发布的“优图AI手语翻译机”产品,利用了普通摄像头和高性能计算机,可以识别听障人士的手语,并快速识别翻译成文字。

  腾讯优图研究员阳赵阳表示,手语翻译的核心技术是手语识别(SLR),通过计算机算法,自动区分手语表达中的各类手势、动作、手势和动作之间的切换,最后将手语翻译成为文字。此前也有一些团队探索过用人工智能技术缓解听障人士沟通障碍,但往往需要借助一些额外的设备或传感器,不仅增加了使用门槛,而且也无法保证对复杂手语表达的识别率。不仅如此,手语特有的地域性、复杂性和多样性,使得手语识别技术即使在深度学习的帮助下也依然存在很大的挑战,难以被实际应用。

  此次优图AI手语翻译机产品,通过自研算法实现了对复杂手语表达的识别技术突破,该算法参考了先进的手势识别、动作识别和序列翻译等技术,考虑了手语的地域性和多样性表达,包含了不同的表达习惯和速度。

  据介绍,优图实验室手语识别数据集覆盖了近千句日常表达,900个常用词汇,是最大的中文手语识别数据集。与此同时,优图对数据进行了进一步的分析和归纳,使优图AI手语翻译机能够实现整句的识别和翻译,用户表达的时候可以连贯将整个句子表达完,不需要设定特定的结束或起始动作,也无需在句中故意停顿或放慢速度。

  “优图团队将继续进行语料库拓展和算法优化,进一步探索在机场、民政等公共服务领域部署,提供无障碍沟通解决方案,方便听障人日常交流提供便利。”腾讯杰出科学家贾佳亚教授表示。

  为进一步深入接触听障群体,了解手语和优化数据和识别算法,目前腾讯优图实验室已和深圳市信息无障碍研究会成立AI手语识别联合项目组,双方将基于手语数据采集、产品算法优化等展开长期深度的合作,通过与听障者或手语使用者进一步接触,扩充数据容量,完善数据规范,致力于推动后续的产品和服务部署。

  深圳市信息无障碍研究会秘书长杨骅表示,腾讯优图提供的这项技术,可以在一定程度上缓解听障者的沟通障碍,为听障者提供更好的服务。

  标签:手语 优图 ai 手语翻译 腾讯 算法 实验室 摄像头 数据集 听障者 深圳市信息无障碍研究会 识别技术 人工智能 民政 障碍 地域性 项目组 技术 手势 文字

温馨提示如有转载或引用以上内容之必要,敬请将本文链接作为出处标注,谢谢合作!

欢迎使用手机扫描访问本站