AI能否打造出百年教育公司?|《财富》专访
中国的民营教育类似于一片活跃的雨林,自下而上的需求旺盛,但是竞争环境多样而复杂。在这样一个集中度很低、地域和人群差异很大的市场中,教育领域创业者都在试图找到自己的立足生境,成为丛林法则下的胜出者。最近二三十年的中国诞生了一批定位清晰、市场化运营高效的教育类上市企业,包括俞敏洪的新东方和张邦鑫的好未来等等。
而近几年来,更新的一代创业者在“丛林中”的竞争手段却已经完全不同。栗浩洋的外公曾是北海舰队海军航空兵的领导,母亲是省会城市的副市级领导,他没有继续从政,而是十几岁就炒过股、摆过摊、卖过卡带、帐篷和电脑,在法院、银行、国企尝试过各种社会实践。21岁的栗浩洋开始在教育行业打拼。和当年的俞敏洪一样,他也曾经在街头贴过海报、拉过横幅,甚至因此从树上摔落到地上。但是,不同的是他今天的竞争壁垒不再是砖墙和人力优势,而是机器学习和重新结构化过的教学数据。
在第一届财富中国创新大赛中,栗浩洋作为松鼠AI的创始人获得了新媒体、娱乐和教育组的冠军。与《财富》(中文版)的对话中,他披露了很多自己创业的细节。其中提到最多的一个名词是知识点的“超纳米级拆分”。比如,把初中的知识点从课本上的300个拆分至30,000个。在AI系统辅助之下,学生的学习就可以按图索骥,如同使用GPS定位一样,很容易找寻到目标。
他用具体题目举例,一道“分数的加减法”,松鼠AI把这道题拆分成100多个知识点:推送给学霸的是带未知数的分数加减法的应用题;而学苗如果基础不好,就可能从异分母分数加减法,降到简单的分数加法;如果还是不会,就降到同分母加法,甚至不需要约分。“当我们把知识点拆到这么细的时候,我们发现没有学不会知识的孩子。”他如此解释。
松鼠AI最近宣布任命汤姆·米切尔博士为公司的首席AI官。他是美国卡内基梅隆大学计算机科学学院代理院长,机器学习和AI领域的前沿人物之一。这家成立于2014年的上海AI教育公司目前在中国300多个城市设立了1,600多个学习中心。下面是我们与栗浩洋对话中最重要的一些内容:
《财富》(中文版):你说教育是AI真正的应用场景,这背后判断的依据是什么?
栗浩洋:人工智能在某些垂直的细分领域里,将要大面积地代替人类的工作,而大家对此仍处在一种茫然状态。举例而言,安检人员、银行客服等等未来会大幅度地被系统取代。我们所在的教学行业,在接下来的十年里面,也会有系统来大幅度地代替人类的很多基本工作。这一次AI给人类职业带来的冲击,我觉得会比当年的英国工业革命更加迅猛。
教育之所以是AI真正的应用场景,是因为它具备三个特征:有限的知识库、有限的人类经验、有限的可能性。K12教育几十万个知识点、上千万道题目、几千万学生对每一个知识点的掌握度等数据,都是相对有限的集合。而老师的工作也是人类经验累积价值很明显的一个领域。这些都导向了有限的可能性,让人工智能如鱼得水。
回到大众语境,如何对一个不懂AI的学生或者家长解释你们的技术,说服他们用算法来替代人工教学?
一个学生在课外补习一个科目,老师会讲所有的知识点。而松鼠AI是“哪里不会学哪里”,只学自己的薄弱环节,这样可以节省至少一半以上的时间,让学习更加精准。此外,一对一量身定制学习方案的好处是因人施教:用7分钟就可以学会的孩子不用浪费时间去听45分钟的课;但是,作为对比,需要60分钟的孩子,也不会让他在45分钟内就匆匆结束课程。最后一点,是教学的透明性。学生掌握每一个知识点的情况,每一道题里面所涉及的思想方法和能力等都有记录。这些价值是传统教育手段无法给予的。
如果面对董事会或者投资人,被问到AI教育公司当前最大的挑战和难度,你会如何回答?
第一难点是如何建立一套真正有效的AI算法模型。我们的核心科学家用四年的时间,突破了算法的障碍。在最近两年里面,我们发表了属于自己的知识产权产品和大量国际AI会议上认可的论文。
第二个难点和中国教育现状有关。这里面包括了地区性教委不同的大纲和要求,同时还要面对多样化的出题思路。如何让这一套体系去结合中国教学实践?当时我们花了巨大的精力和成本。我亲自负责AI技术和教研的板块,经历了很多的争吵、痛苦、挣扎、绝望和辩论。目前的产品成功融合了中国的教学特点。
最后也是最重要的挑战在于寻找全球AI教育人才。今年我们在大量国际会议上演讲和曝光,也是希望能够想尽一切办法找到更好的人才。
你屡次提到要做一家基业长青的教育公司。这背后最难的是什么?
一家百年公司首先要服务于人的基本需求,比如教育、医疗、饮食、居住等等,才能够有足够大的市场和长达数百年、数千年的持续需求。其次,需要有很高的技术突破的壁垒。当教育遇上人工智能时代,我们抓住机会就可以建立非常深厚的技术壁垒,就像当年波音、高通抓住了飞机制造、移动芯片等技术的那些公司一样。我认为AI教育是百年罕遇的机遇,让我们可以去打造基业常青的公司。
一位投资人曾经指出互联网教育阵亡率高的一个共同问题:互联网技术解决两秒钟后的问题,教育解决20年后的问题,技术和需求经常被错配了。你怎么看?
教育领域考验耐力和积累能力,所以有很多老公司。日本的十大业余教育培训集团中有六家是百年公司。但是,我认为叠加上AI技术以后,教育能够融合互联网的种种优势和特点。
在平衡“快”和“深”这两点的时候,AI给我们带来了天然解决方案:首先,它可以快速吸收数百位教育专家的几十年的经验,快速地扫描定位学生的知识点,让学生短期就觉得有神奇的效果,甚至比教了两三年的老师更理解他们。
通过AI,解决了传统教育一个老师(类似于医疗领域里的老医生)需要20年成长的时间障碍;随着学生数量的激增,更多的数据反哺AI系统让它持续成长得更加有深度和智慧。所以AI教育既解决了短瞬的用户需求,又促成了长久进步。正因为如此,松鼠AI学生的续费率高达 80%。
你对外透露的核心方法是“拆分知识点”,这背后需要大量数据。它们来自于哪里?
没有一个高考状元是因为做了几千、几万道题而成为状元的。他可能只需要做其中的3%就已经可以成功。当我们的系统具备了所有的知识存量,就可以借助AI去找到这3%。这背后确实需要大量的数据,在过去几年拥有了几百万学生的数亿做题记录之后,我们的系统可以根据积累的用户画像生成无数“虚拟学生”来和松鼠AI虚拟老师通过对抗模型完成深度的训练过程,就像AlphaGo Zero的学习模式一样。
同时,我们反观历史,新闻阅读数据积累最多的是百度,但人工智能新闻分发的领先者却是当年数据拥有量少得多的今日头条。拥有人脸数据最多的公司是美图,最后人脸识别的领先者却是Face++和商汤。
人工智能的系统开发者承认了“伦理缺陷”和“数据偏见”的存在。在教育领域里是否会有同样的缺陷?
我们看到很多AI的偏见都是由于一个小范围的偏狭案例得到的一个结果。如果我们有了更多的、相对全面深入的数据,AI会具有比人类更强大的能力去完成对公正的判断。
举一个例子:表面上,AI会判断一线城市孩子的学习速度更快;五六线地区孩子的学习能力相对偏弱,需要给他们提供更简单的内容、更低的目标。但是通过AI很快就会发现,造成这样的一个结果的原因可能是因为一线城市孩子起步时获得的教育资源更多更好;通过AI教学之后,不少偏远地区孩子的学习速度会反超上来,甚至会超越大城市的孩子,因为他们通过松鼠AI迅速获得了第一流的、广泛的信息和资源,并且他们的韧性更强。
这是一种第一时间的自我纠正,也就是我们常说的“AI四大特性”中的自我进化特性。(财富中文网)