工大要闻
 工大要闻 
当前位置: 首页>>工大要闻>>正文
计算机学院王鹏教授指导学生在CVPR 2020文本视觉问答人工智能竞赛中取得冠军
2020-05-26 16:50 高晨雨  计算机学院

西工大新闻网526日电高晨雨)近日,IEEE国际计算机视觉与模式识别会议(CVPR)文本视觉问答竞赛(TextVQA)结果揭晓,由我校计算机学院王鹏教授指导的由研一学生高晨雨、大四学生朱琪组成的队伍获得冠军,并获邀参加CVPR 2020 VQA Workshop。

CVPR会议始于1983年,由IEEE举办,是计算机视觉和模式识别领域的顶级会议。本次会议举办的文本视觉问答竞赛要求算法能够同时理解图像中文本和物体的信息,并针对开放性的问题产生答案。该任务涉及到多种计算机视觉和自然语言处理技术,例如场景文本识别、目标检测与识别、机器推理、问题回答等,是当前最复杂的图像与文本交互任务之一。

此次参赛队伍的主力为计算机学院研一学生高晨雨和大四学生朱琪,经过指导,两人设计了一个基于异质图神经网络的文本视觉问答算法(算法框架见图1),通过对图像中文本和物体区域间关系的显式建模,提升了算法的综合推理能力,在比赛任务上得到了较大的性能提升(算法结果可视化见图2)。相关工作已投稿计算机视觉领域顶级会议。

图1 算法框架图

图2 算法结果可视化图

据悉,王鹏教授2019年以来带领本科生或低年级研究生参加了多项国内国际人工智能竞赛,并多次取得优异成绩。针对本科生和低年级研究生在人工智能课程学习过程中所暴露的理论知识理解不深、综合实践能力不强、创新意识不足等问题,通过课(课堂教学)、赛(人工智能竞赛)、研(科学研究和论文撰写)相结合,构建了一套全方位的人工智能创新能力培养模式。通过课堂教学,进行人工智能综合交叉学科基础知识的传授、思辨能力的锻炼和创新意识的培养;通过人工智能相关竞赛,激发学生的研究兴趣和斗志,快速提升综合实践能力;通过更深入的科研工作及论文撰写,培养学生的创新能力和严谨的治学态度。课、赛、研三者循序渐进,互为补充,丰富了教学手段,加快了综合系统培养的进度,全方位提升了学生的人工智能创新能力,探索了一种新的本科生及低年级研究生阶段的创新型人才培养模式。

(审稿:高武)

关闭窗口