辽宁新闻
高考首日,两个智能机器人做数学题,成绩如何
发布时间:2017-06-08 15:25:28 文章来源:澎湃新闻网

  在6月7日高考第一天里,有一位特殊的“考生”开始了它的高考“首秀”。它就是人工智能机器人“AI-MATHS”。据澎湃新闻报道,在断网断题库的环境下,AI-MATHS用时22分钟完成了北京卷文科数学高考题,成绩为105分(总分150分)。之后,AI-MATHS挑战全国二卷数学卷,用时10分钟,成绩为100分(总分150分)。

  与此同时,在北京,另一个人工智能机器人Aidam与6名往届高考状元展开了一场“北京卷文科数学”的人机大战,最终Aidam的成绩仅与高考状元的平均分相差1分。

  AI-Maths在答北京文科数学卷

  人工智能机器人高考“首秀”:断网断库

  6月7日18时10分许,一场特别的高考模拟在成都高新区天府新谷园区10号楼举行,考生是人工智能机器人“AI-MATHS”。

  AI-MATHS诞生于2014年,是成都准星云学科技有限公司依托清华大学大数据、人工智能、自然语言识别等技术,研发的一款以自动解题技术为核心的人工智能系统。

  AI-MATHS是一个黑色的大机箱,被安排在一间完全断网的房间内,并用警戒线围起,黑色的服务器机箱中有11台服务器负责解题。为保证考试公正,考试现场没有人可以操作这些服务器。房间门外贴有“所有设备断网段库”的标识。

  所谓断网断库意味着,模仿考生封闭环境的闭卷考试;测试复杂逻辑推理能力与联想能力;断绝一切可能的外界支持,包括专家系统库。这也是人工智能技术的核心——断网断库场景下的综合逻辑推理能力。

  断网断库小样本训练是国家863类人解题项目的要求。由此来验证系统是否能自主形成学习复杂逻辑推理和数理思维,锻炼系统超越人类力所能及的思维能力以及类人的举一反三联想推理能力,为跨行业应用做物美价廉的技术支撑。

  7日,该公司首席执行官、清华大学苏州研究院大数据中心主任林辉介绍,

  房间门外贴有“所有设备断网段库”的标识

  高考机器人最大的问题:读不懂题

  “AI-MATHS”分别挑战了北京卷文科数学以及全国二卷文科数学的考试,分别用时22分钟和10分钟,得分为105分和100分。这个成绩接近于此前研究人员为它设定的110分的目标。

  两次考试具体得分如下:

  北京文科数学卷,选择题满分、填空题20分、解答题45分,全卷105分;

  全国卷二选择题55分、填空题20分,解答题25,全卷100分。

  在选择题和填空题上,“AI-MATHS”表现十分亮眼。丢分环节主要是解答题,有些题目甚至是0分。

  这相当于中等成绩水平的高中毕业生。

  由于高考数学成绩尚未出炉,人们还无法判断AI-MATHS和人类考生相比到底处在什么水平。不过,阅卷老师现场评估认为,

  “看不懂题。”研发高考机器人最大的难点在于,要让系统准确理解人类语言。

  作为“家长”——成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉指出了“自家孩子”在答题时的一个弱点,

  林辉说,“直接用数学语言表述的应用题它可以轻松解答,但它最大的弱项是不能理解考题里场景式的描述语言,它会读不懂题目。”

  高考数学机器人为何会读不懂题目?对于这个问题,林辉打了个比方,如果题目是10-1=?人工智能系统可以轻松作答。但如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”面对这样的情况,人工智能系统就“傻”了,“它不理解小明是什么、小丽是什么、吃又是什么意思。”

  实际上,为了“AI-MATHS”迅速克服这解题的弱点,准星云学科研团队此前对“AI-MATHS”已进行了500套试卷、12000道题目的魔鬼式训练。

  研究人员表示,AI-MATHS在自然语言识别方面还有待提高。用参与阅卷的数学老师的话说,AI-MATHS要考好数学,还得先学好语文。

  研究人员相信,经过更多的训练和学习以后,未来AI-MATHS会取得更好的成绩。

  6名往届高考状元1分险胜智能机器人

  而与此同时,在北京,一场高考的人机大战也打响了。

  由中小学智能化教育公司“学霸君”自主研发的智能教育机器人Aidam,首次与6名高考理科状元在北京同台PK,解答2017年高考文科数学试卷。

  最终,Aidam仅用9分47秒就答题结束,成绩为134分。6名高考状元的答题时间是55分钟,成绩平均分为135分。

  据“学霸君”创始人张凯磊介绍,为了便于展示,Aidam答题放慢了速度,平时每道题完成时间应该在7~15秒。

  据了解,“学霸君”投入数年时间,集200多位技术人员之力进行智能教育机器人的研发。资深教师和工程师在7000万道题目之上构建了推理引擎和庞杂的知识元,机器在所有的解题路径中探索出最简明的一种。