13万语素,5年真题,30秒就啥都没了吗|在冲绳的日语教室
我现在努力保持不嚎啕大哭,期待着奇迹的发生。
刚才电脑不知道怎么了,突然一个桌面全部是老照片不停闪动。
点不开所有东西。
30秒后,鼠标都消失。重启无数次,等了一晚上,无果。。。
这里有我已经工作了六十多天的一堆资料。
用过去五年96%的N2真题(有一道完形填空木有),把所有语素全部手工挑拣出来,据说专业里面叫做洗语料,语素的意思是最小单位的有意义的词,比如我,美,而且,崩溃。
这些语素加起来差不多13万个,分成7月和12月,听力词汇阅读三个部分,因为按照官网统计数据7月和12月难度不同,为了精准,就分开统计的。
这是第一遍洗语料的时候留下来的pyq珍贵图片,万一电脑修不好,这就是唯一图片了
擦干眼泪,我要坚强。
做这件事情的原因是以前一直说N2大概要N3基础上加上五千个单词,N3大概1500,所以江湖传言N2词汇量是6500吧。
我们大地雪花班好多同学报名了,一起凑热闹那就一起刷题,刷着刷着眼泪掉了下来,啊不,刷着刷着发现好象没有那么多个词。
除去一些比如男、女、会社、美味しい、食べる特别基础的词,可能不会 有一千个吧
,的感觉。
感觉只是烟花,我们需要数据支持。
就拉了一支队伍开始着手统计起来。
日语不像英文,比如yummy是没有过去式的,日语的形容词有各种变形美味しくて、美味しさ、美味しかった、美味しくない
动词也是,英文比如说eat,ate,eaten,eating 就没了吧,日语有食べる、食べない、食べて、食べた、食べられる、食べれる、食べさせる、食べさせられる、食べよう、食べろ、食べます、就算了,还可以食べたい、食べたかった,食べながら、这些也忍了,类似来る,连第一个假名都会变!
毕竟这是非常典型的黏着性语言啊,用胶水把一切粘起来成句子的。
BUT!我始终相信,回到一切的出发点再统计是很难但是最容易的一条路,所有的语素回到字典上的样子!
60天!
变回去原形。
看着pyq的记录照片真的。。。当时为啥就不备份。。。
就变出来13万个语素。
很多很多重复的。
再根据月份,词性(名词,动词,形容,帮助)分成四波,分别根据题型和综合统计从出现最多的词,到只出现过一次的词。
今天刚刚用这个app统计完第一次手工洗出来的单词频率list
高频词(五年出现两次以上并且删掉特别基础的词,比如男女公司学校次次喝喝来来去去,删掉比如人名,地名,只会在那一次考试中反复出现的比如一个商店的名字etc)
第一次初步统计结果是差不多1204个词!!!
这是江湖传说的五分之一啊。
然后电脑坏了。
宁可在windows上熬夜统计,也不想在imac上打字哭泣。
我本来想着今天晚上语法下课之后备份一下,顺便给大地雪花班的童靴们发过去大家看一看,挑出来不会的词。
然后我把上课的内容和一些最近总结的记忆办法揉起来,一个一个的做词网
比如长这样
大脑需要关联,一个一个单独的词很容易想不起来,一张一张网就不一样了,多联几个七大姑八大姨聚在一起叽叽喳喳会容易很多。
不能哭。
想想司马迁,据说史记已经写完了结果被火烧了,他从头开始写!
这六十多天,每一天都算数,经历了很多次失败的统计办法,完全知道如何最快速的洗语料了!不就是13万个原形嘛!再来就是了。
哇
反正我本来就打算不同手法洗语料洗三次对比参照之后才发表第一版的。
反正还年轻。
反正在家自肃。
一切发生的,遇见的,都是最好的安排!一定!
今日彩蛋
猜你还想看
希望明天一觉起来,电脑就好了