人工智能能否让你开口说英语?

2016-07-08 09:16  来源:央视网

  涂鸦画作、裸砖墙纸,每个会议室都以不同国家的名字命名,随处可见的懒人沙发,一楼二楼间悬空的巨大吊床,当然还有令人垂涎的美食,以及可供健身的体育设施,在“流利说”的办公室处处散发着浓郁的谷歌风。

  “流利说”是一款利用语音评估技术进行英语口语学习的移动应用软件,它可以像Siri一样陪用户练习英语口语,并对发音进行打分和解析,用户可以进一步学习标准发音和发音技巧。

  仅仅上线三年多,流利说用户量达到3000万,获得挚信资本、GGV、IDG在内的B轮千万美元投资,估值5亿美元,成为语言学习类APP中的黑马。

  在线教育俨然已是红海一片,2015年国家对外公布的在线教育投融资数量为199起,融资金额高达20.3亿美元,中国在线教育首次超过美国,成为全球在线教育最热的投资市场。

  具体到英语在线教育产业而言,51Talk、VIPABC、新东方在线、沪江网等为代表,市场格局已初步形成。如何在日渐多元的市场竞争中撕开市场缺口,构筑自身竞争壁垒,是每一个初入者需要考虑的问题。

  将“练习”产品化

  普林斯顿大学计算机系博士、曾在美国谷歌担任产品经理、流利说创始人王翌看来,整个英语在线教育是一个非常低效的市场,“学生投入大量时间收效甚微,老师被严重剥削,工资很少,教育公司赚了钱却也叫苦不迭,原因在于将大量成本用于营销,其中所有的价值都是不对等的。”

  以口语为入口,借助语音识别技术,将英语练习规模化、标准化、产品化成为流利说的发力点。早期的流利说更像一个应用学习工具,用户可以跟着双人对话录音,对着手机麦克风模仿录音里的发音和语调,应用将根据单个词的发音、句子里的停顿位置和声调对用户发音进行打分,并标出发音不准确的单词。

  整个评价过程完全依靠计算机算法在手机上完成,评分机制的引入是其最大的亮点。流利说使用的打分算法是基于GOP(GoodnessofPronunciation)算法,即利用事先已收集的语音发音方式,将用户的发音与已经收集的语音做一次强制对齐,把强制对齐得到的似然分数值与收集的语音做一个比较,利用这个似然比(likelihoodratio)作为发音好坏的评价。

  “我们收集了数千美国人近万小时的录音,提取音节的最小单位音素,总结统计特征与规律,搭建打分模型,根据这个模型进行发音比较。”流利说首席科学家林晖介绍道。林晖曾在谷歌担任研究科学家,负责语音识别、自然语言处理、深度学习及大数据挖掘算法研究,流利说的整套语音分析算法由他完成。

  学习类APP的商业化

  工具型产品的可替代性往往是所有产品类别里最强的。除了提供碎片化口语练习之外,无论是出于对用户沉淀或是商业变现考虑,科学系统化的教学内容终究是绕不开的环节。

  “一些环节可以通过技术将其量化,但越深入这个行业你会发现有些环节终究无法用互联网的‘轻’来取代的。”王翌直言。

  具体到每个学习个体而言,长时间的学习数据跟踪,其发音常常出现哪些问题,如何进一步提升,也可以做进一步的细化分析,未来千人千面的英语学习场景将成为可能。“随着学习的进展变化,各个努力值的变化,数据引擎会为用户制定个性化的学习路径匹配算法。”流利说首席产品官翁翔坚解释道。

  从最直接的用户说英语的语音数据,到用户在学习课程过程中的各种行为,“比如是否反复听录音,学习的路径选择顺序,每个用户在非学习情况下的社区数据也对我们分析起到了很大的作用。”曾在美国互联网大数据公司Quantcast任资深软件工程师、流利说CTO胡哲人补充道。

  然而从工具、内容到社区再到系统课程的打造,用户量虽然不少,但如何提高用户转换率,变现往往是工具类产品,尤其是重知识输出类产品最大的挑战。

作者:利鑫 编辑:陈嘉新