大数据分析带来高效英文阅读

大数据
后台-插件-广告管理-内容页头部广告(手机)

相比于“死记硬背”,“阅读”是提高英文水平的一种科学途径。然而,对于一门外语,大部分人没有充足的时间来安排阅读,因此提高阅读效率,尤其是合理筛选阅读资料非常重要。

资料显示,一般英语为母语的4岁小孩就已经知道5,000个单词,相当于大学英语六级(CET-6)水平。说明一个道理,在中国,大部分大学生毕业的时候,英文沟通能力在英语为母语国家年龄3、4岁孩子的水平,难怪大家学了10几年英语,基本的英文阅读、编写和沟通都很差。

最近,我们做了一个有趣的实验。通过自定义编写程序,对2000多部英文图书和英文词汇进行了比对,得出一个“惊喜”结论。下面以考研词汇(5500个单词)为例,分析结果如下,列出了词汇覆盖率前100的图书。以排名第一的《悲惨世界(Les Miserables)》(维克多·雨果Victor Hugo)为例,该书覆盖了考研词汇5473之多,覆盖率达到了99.84%(0.9984)。

表:英文图书-考研词汇大数据分析结果(部分)

 

总结:大数据分析确实能够辅助筛选英文读物。然而,要找到适合每个人阅读的资料,还需要定制化,不是每个人都能读的下《悲惨世界(Les Miserables)》,除了考研词汇还有很多高难度词汇,况且属于长篇小说,完整读下来,尤其重复阅读不现实。后续,我们还会从词汇有效覆盖率(以最少阅读量覆盖更多词汇)、多本图书整合等方面进一步优化大数据分析算法。感谢大家的进一步关注,谢谢!

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。