您的位置: 首页 新闻 行业新闻

66372-20170608081853262-529872458.jpg

  2017 年 6 月 7 日,成都高新区天府新谷,准星高考机器人 AI-Maths 在答北京文科数学卷。 本文图均为澎湃新闻记者赖鑫琳图

  2017 年高考第一天,数学高考机器人 AI-MATHS 首次公开挑战高考试题。

  19 时 16 分,成都准星云学科技有限公司研发设计的数学高考机器人 AI-MATHS,在断网断题库的环境下,用时 22 分钟完成当天北京卷文科数学高考试题的解题,经过现场批阅,成绩为 105 分(总分 150 分)。

  此后,AI-MATHS 再次挑战解答全国二卷数学卷,用时 10 分钟。全卷总分 100 分(总分 150 分)。

  这次自动解题技术阶段性公开测试的整个过程由公证机构见证。

  测试结束后,该公司首席执行官林辉则表示,对结果留有遗憾。“由于现场环境,我们把答题时间控制在半小时内,如果增加到一个半小时,分数还能增加 10 来分。”项目首席专家成都电子科技大学的符红光教授称,AI-MATHS 最终目标是达到 120 分到 130 分。

66372-20170608081853215-528156919.jpg

  房间门外贴有“所有设备断网段库”的标识。

  机器人断网断库,现场公证

  6 月 7 日 18 时 10 分许,一场特别的高考模拟在成都高新区天府新谷园区 10 号楼举行。

  AI-MATHS 诞生于 2014 年,是成都准星云学科技有限公司依托清华大学大数据、人工智能、自然语言识别等技术,研发的一款以自动解题技术为核心的人工智能系统。

  澎湃新闻在现场看到,AI-MATHS 是一个黑色的大机箱,单独放在一个独立房间,周围被隔离带围起。房间门外贴有“所有设备断网段库”的标识。

  所谓断网断库意味着,模仿考生封闭环境的闭卷考试;测试复杂逻辑推理能力与联想能力;断绝一切可能的外界支持,包括专家系统库。这也是人工智能技术的核心——断网断库场景下的综合逻辑推理能力。

  7 日,该公司首席执行官、清华大学苏州研究院大数据中心主任林辉介绍,断网断库小样本训练是国家 863 类人解题项目的要求。由此来验证系统是否能自主形成学习复杂逻辑推理和数理思维,锻炼系统超越人类力所能及的思维能力以及类人的举一反三联想推理能力,为跨行业应用做物美价廉的技术支撑。

66372-20170608081853231-1227601148.jpg

  2017 年 6 月 7 日,成都高新区天府新谷,媒体记者在观看准星高考机器人 AI-Maths 答北京文科数学卷。

  林辉表示,中国要抢占人工智能自然语言和综合逻辑推理的制高点,力求做到更快捷、更灵活、更广泛,可跨界迁移应用。其中,国家 863 类人解题项目是国家科技战略的一个重要卡位性要求和举措。这有了这个技术沉淀,再联网联库,应用上将如鱼得水。

66372-20170608081853200-858978922.jpg

  2017 年 6 月 7 日,成都高新区天府新谷,工作人员正在网络上搜集 2017 高考北京文科数学试题。

  此前,AI-MATHS 原本设定的目标是数学能超过 100 分。

  “某学习小组由学生和教师组成,人员构成同时满足以下三个条件:男学生人数多于女学生人数;女学生人数多于教师人数;教师人数的两倍多于男学生人数;若教师人数为4,则女学生人数最大值为多少?该小组人数的最小值为多少?”北京文科数学卷中的这一道题目 AI-MATHS 无法作答,现场人工智能专家均表示,问题应出在机器对于自然语言的理解上。

  现场,科大讯飞研究院院长、国家 863 课题组负责人之一胡国平表示,高考是很好的衡量人知识水平、理解能力、推理能力等相关智能能力水平的测试工具。机器人参加高考就是看看机器能达到一个什么样的人工智能水平,然后在更多领域去应用这些成果。

  6 月 6 日,作为“十二五”863 计划信息技术领域“基于大数据的类人智能关键技术与系统”项目的牵头单位,科大讯飞方面表示,语文、地理、历史高考机器人将于 2019、2020 年参加高考进行最后的成果测试。

66372-20170608081853340-199583619.jpg

  2017 年 6 月 7 日,成都高新区天府新谷,评卷专家正在批改准星高考机器人 AI-Maths 所答的北京文科数学卷。

  【挑战纪实】

  数学全国卷 10 分钟答完,得了 100 分

  17 时 45 分,现场工作人员获得北京卷文科数学试题。

  18 时 10 分许,公证人员进入机房查看路由器和 11 台服务器运行。之后,专家确认现场符合断网环境。

  18 时 15 分许,大厅内,技术人员通过二十多台服务器电子版试题导入服务器。

  18 时 28 分许,数学高考机器人 AI-MATHS 开始解答北京卷文科数学试题。现场 4 个大屏幕实时更新解答进度。显示屏左边是数学题目,右边显示解答步骤。

  18 时 43 分,屏幕切换故障,显示屏中断,但后台仍在解题。

  18 时 46 分,大屏幕重新显示答题进度。

  18 时 50 分,数学高考机器人 AI-MATHS 答题完毕,随即形成答卷,共用时 22 分钟。

  18 时 55 分,西财智库首席研究员、斯坦福大学高级访问学者汤继强等专家验证一个空U盘将答卷导出打印。

  19 时 02 分,AI-MATHS 的答卷交给 3 位高中数学老师评阅批改。三人分别是:成都天府七中一级教师袁婧、成都树德中学宁夏校区高级教师肖兴桂、成都七中林荫校区高级教师祁祖海。为方便计算机阅读,试卷呈现的是 LaTeX 语言,而阅卷老师因为经过了前期训练,因此能够读懂批改。

  19 时 19 分,数学高考机器人 AI-MATHS 开始解答全国二卷数学卷。

  19 时 16 分,评卷专家宣布 AI-MATHS 解答北京卷文科数学科目答题结果:选择题满分 40 分。填空题 13、14 题不能识别。解答题 16、18 题完全正确,共得 45 分。全卷总分 105 分。

  19 时 29 分,数学高考机器人 AI-MATHS 完成全国二卷数学卷。用时 10 分钟。现场爆发惊叹声。

  19 时 35 分,试卷打印完毕,移交专家批改。

  19 时 45 分,现场宣布,数学高考机器人 AI-MATHS 解答全国二卷数学卷结果:选择题得 55 分,填空题得 20 分,简答题得 25 分。全卷总分 100 分。