编辑: wtshxd | 2019-07-01 |
5 个集成项目, 根 据承担集成项目的
10 个项目组的不完全统计, 论 文分别发表在信息科学、 认知科学、 心理学、 神经 科学、 物理学、 生命科学等领域的国际核心学术刊 物上, 充分体现了多学科交叉的特点和我们研究 工作的学术水平, 另外, 自然科学基金委信息学部 在重大研究计划实施的管理机制创新方面,也为 不同领域专家的合作立项创造了宽松的环境 . 比如, 视觉注意机制是生物视觉的一个重要 特性, 早期的研究主要集中在心理学、 认知科学 和神经生理学等领域, 上世纪
80 年代后, 这一课 题引起了计算机视觉、 人工智能等领域学者的重 视.该重大研究计划针对自主式车辆视觉导航的 需要, 多个课题组对此问题开展了深入的研究, 在 计算视觉与生物视觉结合方面开展了深入的多 学科交叉, 取得一批重要学术成果: 清华大学在 人机驾驶模型融合研究方面, 开展了驾驶员感知 信息处理与融合的认知机制研究;
吉林大学模拟 真实驾驶员对预期轨迹信息的认知处理机理, 研 究无人驾驶车辆的局部路径规划问题;
西安交通 大学研究了视觉注意机制建模问题, 成为视觉注 意力检测的代表性工作. 不过, 在郑南宁看来, 研究者的学科交叉还 有待进一步深入. 一方面, 学科交叉取决于学者的热情, 这是 根本因素.同时, 也要有自上而下的组织. 不过 他指出, 从实际情况来看, 这两方面都有所不足, 研究者应该更多地去主动思考科学问题背后的 学科交叉需求, 对于研究中存在的一些急功近利, 也需要去改变 . 实际上,不仅解决科学问题需要学科交叉, 应对人工智能所带来的深刻的社会问题, 也同样 需要学科交叉. 因为人工智能模糊了物理现实、 数据和个人的界限, 延伸出复杂的伦理、 法律和安 全问题.人工智能的逐渐普及和深度应用一定会 给人们带来心理的影响, 进而产生社会人文风险, 这已不是传统的工程安全方法能够解决的问题 了.因此在这些领域, 人文社会学科和哲学学科 将会大有作为. 郑南宁说.
2018 中国智能车未来挑战赛开幕式现场 项目组供图 本报见习记者 程唯珈 当前, 互联 网语音与影像的内容遍布生活各个角落, 而语言当之无愧地成为信息最重要的载体. 如何实现高效的语音处理、 识别 和关联检索, 成为互联网音频检索业务智能化的竞争关键. 基于人们 互联网连接方式的改变, 以语 音为核心的智能交互将是大趋势. 在接受 《中国科学 报》 采访时, 中科院 声学所研究员颜永红如是说. 然而, 与美国等 发达国家相比, 我国智能语音处理技术的民用市场普及率较低, 面对新一 轮科技竞争, 智能化语音发展成为国家需求. 在国家自然科学基金委员 会(以下简称自然科学基金委) 重大研究计划 视听觉信息的认 知计算 支持下, 颜永红带领团 队就多人多方对话中的语音分 离、内容分析与理解开展深入研 究, 并取得了良好的市场效应.复 杂声学场景下的语音分离、内容 分析与理解是信息处理领域前沿 性和基础性的研究课题. 颜永红表示, 该研究最大的 亮点在于多语言建模. 我们做 的混合语音识别, 比如中文里面 夹杂着英语, 系统都可以有效地 识别与解码.而且通过数据共 享,我们建立了语音的统一表 达,这样在引擎构建的时候, 可 以大幅削减数据量需求. 在基础理论和关键技术研 究的基础上, 团队还构建了语音 交互系统和海量音频内容检索 系统, 并针对国家重大需求研究 开发了相应的平台进行应用推 广. 基于海计算和云计算环境 的音频内容识别与理解服务平 台就是其中之一. 该平台重点解 决了在实际应用环境下语音识 别技术面对噪声、 信道和口音的 稳健性问题及大规模并发处理 等实际应用难题. 在互联网领域, 我们先后 跟国内三大互联网企业―― ―百度、 腾讯和阿里巴巴, 进行了卓 有成效的合作,推出了语音输 入、 语音和音乐检索、 语音客服 等应用. 另一个则是多语种海量音 频信息自动处理平台.团队研发 出语音关键词识别、 说话人 / 语 种识别、 固定音频检索等核心技 术,有效提高了识别系统对噪 声、 信道及口音的适应性和在实 际应用环境下的识别性能, 构建 了符合实际业务流程的多语种 海量音频自动理解系统. 在颜永红看来, 这些都离不 开自然科学基金委的统筹规划. 视听觉的认知计算 重大研究 计划专家指导组充分发挥顶层 设计作用, 聚集了各领域的优秀 人才, 并尽最大可能发挥已有优 势项目的潜力. 颜永红表示,团队未来将 继续加强基础研究建设,开展 对韵律识别等领域的前瞻研究 并将项目集成与推广. 假以时 日,基于语音操作的科技产品 会有更大的市场和更广阔的用 途. 他说. 寻求智能时代的语音空间本报见习记者程唯珈当很多人对人工 智能还懵懵懂懂时, 一 个被认为是人工智能 下一个风口的 黑科 技 ―― ―有望实现 人 机共融 的脑―机接口 技术已悄然来临. 什么是脑―机接口? 脑―机接口主要是 通过解码大脑活动信 号获取思维认知等信 息, 实现人脑与外界直 接交流, 在医学康复领 域的应用已逐步兴起. 它除了能帮助具 有严重功能障碍的患 者建立与外界的交流 通道,还可将康复训 练中很多的被动运动 转换成患者的主动运 动, 实现大脑、 机器与 肌体的深度融合, 靶向 诱导并强化推动中枢 神经可塑性变化, 从而 提高康复效果, 克服传 统康复手段被动单一 的缺陷. 在国家自然科学 基金委员会 (以下简称 自然科学基金委) 重大 研究计划 视听觉信息 的认知计算 支持下, 天津大学医学工程与 转化医学研究院院长、 天津神经工程国际联 合研究中心主任明东 带领团队突破了一系 列基于脑―机―肌信息环路的卒中康复机 器人基础理论与关键 技术, 有望帮助致残病人恢复正常生活、 重建其对生活和康复的信心. 我们整个项目研究工作紧密围绕 面向高性能人机交互的训练型脑―机― 肌协同交互信息环路模型,分别开展了 脑―机、肌―机和脑―肌交互中的关键 技术研究. 明东告诉 《中国科学报》 , 在脑―机交互的神经信息学复合编解码技 术研究中, 团队实现了反应式、 主动式、 被动式的脑―机高效通信;