编辑: 元素吧里的召唤 2019-07-06
2018 年5月24 日 星期四 Tel: (010)

62580722 前沿 FRONTIER 执行主编: 赵广立 编辑: 贡晓丽 校对: 何工劳 E-mail押glzhao@stimes.

cn

6 5 月21 日,

2018 微软人工智能大会的讲台 上, 微软全球执行副总裁、 微软人工智能及微软研 究事业部负责人沈向洋迎来了一位特殊的来 宾―― ―来自南京工业大学的硕士研究生宋昊F.

1993 年出生的宋昊F, 在一岁时由于医生用 药不慎造成神经性听力损失,被诊断为终生听力 严重损伤. 经过不懈的艰苦练习, 宋昊F如今已经 可以像常人一样发出声音, 但受限于听力损失, 他 的语音、 语调会显得有些吃力和不自然. 当天,昊F与沈向洋进行了现场对话.基于 Microsoft Translator 打造的微软语音服务, 专门针 对昊F的声音特点定制了语音识别模型,能够以 极高的准确度将他的语音实时转换成文字,还能 同步翻译成英语或其它语言,从而真正实现了无 障碍沟通. 现场演示之后, 沈向洋还宣布, 微软将充分发 挥其在人工智能 (AI) 领域的优势技术和资源, 与 中国产、 学、 研各界展开全方位合作, 为科研教育 打造一流平台、 为企业创新开发先进方案、 为全民 AI 提供免费培训;

与此同时, 微软将认知服务扩 展到智能边缘,推出 ONNX 项目及 ML.NET 开 源跨平台人工智能开发框架,并为微软小冰赋予 更多创意功能, 以18 项创新技术、 工具、 服务, 全 力助推中国开发者, 把握数字化转型机遇. 让沟通没有障碍 宋昊F使用的这项用来帮助听力受损人群无 障碍沟通的技术源于微软与美国罗彻斯特理工学 院的一项合作.利用微软的人工智能技术和认知 服务中的 Microsoft Translator 服务, 科研人员开发 出了可定制的自动语音识别解决方案,让学生能 够更加从容自如地与世界交流. 如果能够充分调动技术进步的全部潜力, 那 么我们一定可以解决更多困扰人类社会的重大问 题. 沈向洋介绍, 微软推出的 人工智能无障碍计 划 , 将在未来五年的时间内, 投入

2500 万美元, 助力全球开发者充分利用微软提供的人工智能技 术和平台施展才华、发挥创意,为世界各地超过

10 亿残障人士, 打造一个便利、 平等、 没有障碍的 世界. 如今, 计算机在看、 听、 说、 推理等方面的能 力、 效率和准确度持续提升, 微软将这些成果打包 成解决方案, 推出了实时语音到文本转换、 计算机 视觉识别、 文本预测输入等功能和服务. 利用这些 触手可及的技术, 人们可以为视觉、 听觉、 感知、 学习、行动能力有所不便的人群或者是心理疾病患 者, 打造出人工智能应用和产品, 帮助他们无障碍 地面对工作、 生活和与人沟通. 微软 人工智能无障碍计划 的目标, 就是通 过助力全球各地的开发者, 尽可能地放大人工智 能的影响力.沈向洋介绍, 这项计划在实施过程 中将分为三种途径:首先,微软会为开发者、 院校、 非营利组织、 发明者提供技术方面的种子资 金支持, 帮助他们以人工智能为突破点, 创造出 能帮助残障人士更好地工作、 生活和与人沟通的 解决方案;

其次, 微软对具有潜力的项目给予更 大的技术投入, 并让微软的人工智能专家参与其 中, 帮助其成果实现规模化发展;

第三, 微软还可 以将人工智能与开放设计融入现有的平台和产 品, 与合作伙伴一起将人工智能创新打造为平台 级服务, 从而为更多人提供服务, 让无障碍的福 利实现最大化. 唱歌有气息才与人类神似 会上,微软小冰还给与会者带来了她创作的 歌曲 《我知我新》 . 如果你听得够仔细, 会发现这次 歌手小冰的唱法跟那些被调教出来的虚拟歌姬有 了细微的差别―― ―小冰更像人类了,有了气息的 变化. 小冰两年前唱第一首歌的时候,就像你去 KTV, 听到隔壁包厢传过来的声音, 但我们欣喜 若狂. 小冰的开发负责人、 微软 (亚洲) 互联网 工程研究院副院长李笛表示, 想让 AI 唱歌且不 跑调, 这在技术上早已不难实现, 但让 AI 唱的歌 听起来像人类唱的, 形神兼备, 这成了小冰团队 的新课题. 首先可以确定的是, AI 没有情感, 在音准上, 它可以做到完美. 那么, 怎样才能让她实现艺术创 作, 像人类那样有感情地歌唱? 微软研发团队从诱发源上做了调整. 这个方 法的灵感, 始于小冰在偶然的一天对一张脚扭伤 的照片给出的回应: 哎呀, 伤得严重吗? 这让 李笛团队意识到, 想让 AI 产生偏感性行为方式, 需要的是足够丰富、 偏感性的诱发源, 而这些带 有感性色彩的诱发源, 此前一直被当作 杂质 过 滤掉了. 同样的道理,当音乐人小柯在评价小冰的歌 唱时说: 声音很好, 但很单薄, 因为这个声音没有 气息 , 开发者也立刻明白了问题出在哪里.人类 在唱歌时气息的变化、 韵律感, 这些丰富的细节不 应该被过滤, 它们也是宝贵的诱发源. 李笛这样总结这套全新的 AI 调教方法: 神似, 来自于我们对人类创作的一种重新的拟合. 这 更像是一种黑盒子, 是从已知去推导未知. 最终完 成形神兼备的过程, 我们认为应该是发端于形似, 最终通过规则达到神似. AI 的每一次进步,其实都源自人类对自身更 深层次的理解认知. 从 人机交互 到 人机交流 从微软人工智能大会所传递的信息看, 更具 有现实意义的, 还在于如何推进中国人工智能的 发展, 以及生态体系的构建. 据悉, 微软将向合作 伙伴和开发者开放 全双工语音技术 (Full Du- plex) , 将 人机交互 进化为能像人类一样自然 地 人机交流 , 开发者可以使用这项技术打造自 己的对话应用.今年

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题