ES6
ES6标准,也称ES2015。在2015年6月正式批准,这是javascript语言标准从2009年首次大版本更新。
这个版本带来了很多新东西,说是新东西,估计基本读者也都见过。比如python中常用的Destructuring assignment、模块导入、generator和map与set,java中的WeakHashMap、Proxy,在coffeescript中常用的class关键字与子类、模板字符串和剩余参数与默认参数等等。处处都已经有了ES6的影子。
最近做了几件事:
- 把nltk中wordnet corpus reader的python代码看了看,依葫芦画瓢画了个纯javascript版。
- 热情地把Eloquent Javascript的项目和练习复习一遍,然后继续接着往下看。
对此,有了两个新认识:
- Python是门强大的语言。特别是前几天在python中看到async关键字之后…
- javascript是门强大的语言但并不简单,ES6让它更强大也更好用更简单
这时候发现有几个地方用ES6特性非常方便。
本文不会解释这些特性是什么,所以,如果是查资料查到这里,略过吧。
Generator
在nltk wordnet corpus中,对wordnet data文件进行逐行解析的时候,这样处理一行内容:
1 | _iter = iter(line.split()) |
显然,对每一行,首先生成一个iterator,这个iterator返回这一行用空格分隔的每一个单词。好在ES6中也支持generator/iterator了,对应如下。
1 | let token = util.getIterator(line.split(/\s+/).filter(v=>v!=='')); |
其中,getIterator
定义为一个generator函数,调用这个函数则生成对应的generator,下面的for...of
用到了array
对象本身就有一个generator函数的特性。
1 | util.getIterator = function *(array) { |
nltk中生成ngram的方法的js实现
1 | function *ngrams(sequence, n) { |
Collections
当我尝试用js实现matrix67几年前在其博客讲到的新词发现算法时,需要把一个穷举一个序列的所有分割可能。我这样实现的。
1 | function splitSet(s) { |
想得很好,通过将序列分为左右两部分递归简化处理。结果发现同一分割出现了多词。
1 | > splitSet("abc") [ 'abc', 'a bc', 'a b c', 'ab c', 'a b c' ] |
相同的结果需要排除,这时候ES6中的Set
就很方便了…
1 | let set = new Set(); |
Promise
事实上,任何能使用Promise+Generator的地方我都会用,当然ES7中有了async和await关键字。比如在youdaodict Userscript中实现调用audio API来播放有道mp3音频文件实现跨域发音的函数.
1 | function play(word) { |
一般的观点是,凡是关系到异步返回值的时候,都应该尽量使用Promise,保证回调只被执行一次、更好的错误处理、更明晰的流程结构。
Promise和Generator现在常作为将来ES7中async/await
的过渡。比如著名的co
模块,以下是一个简化co
实现
1 | function co(g) { |
简单来说,就是对generator
中每个yield
出一个promise时,检查这个promise是否已经完成,
完成就返回值。没有就在该promise上注册回调让其把完成后的值传回generator
并等待generator
再返回下一个Promise。
好绕是不是?我跑题了抱歉。
Template String
其实上面的例子已经用到这个特性了。再举个例子,Coffeescript中可以这样写正则:
1 | OPERATOR = /// ^ ( |
非常方便不是?虽然我开始是在nltk中看到了这个功能,
1 | text = 'That U.S.A. poster-print costs $12.40...' |
想了想如何在js中自己实现,忽然想到了template string这个特性。
1 | function r(strings) { |
这里用到了Tagged template strings的特性。
另外,如果是多行连续文本时也应该使用template string。
class
从本质上讲,javascript中的所有面向对象机制都是建构在原型链上的,但class这种语法糖也能比较方便。在coffeescript中我觉得那种浓烈ruby风的写法更合心意一些,class
关键字总有些不怎么顺手的地方,比如 设置类静态变量 和有争议的 mixin 。参照nltk wordnet corpus reader类的时候也简单实践了下class关键字、继承等的使用。简单使用还是挺顺手的。
1 | class Synset extends _WordNetObject { |
destructuring assign
这是,非常好用的语法糖。终于可以
1 | [a, b] = [1, 2]; |
Spread Operator
各种语法糖,处理rest parameter时省心很多,而且返回的是一个真正的Array对象。比较有意思的一个例子是,有次见有人讨论如何把Math.min
应用到数组上。他说到javascript高级程序设计上的例子:
1 | function min(array) { |
认为应该把this
绑定到null
而不是Math
,于是我才知道apply
时还是要小心不要污染全局变量空间。。。不过这个例子,我去翻了下v8的math.js和spidermonkey的Math实现,都不关this什么事,所以,我觉得,爱绑定啥都行。。。
关键在于,有了spread operator之后
1 | Math.min(...array); |
就行了。这些类似的应用场景很多的,比如打印数组中每个成员
1 | console.log(...array); |
少写多少代码:)
Arrow Function
在前面的例子中你应该已经见到过,箭头函数让书写匿名函数(lambda)变得异常方便(少打很多字),除了不能用箭头函数写一个generator这个设定有些意外。
1 | (v=>v+1)(3) |
另外,箭头函数的this是提前绑定到所在词法作用域内的(和调用者无关、apply等指定的this
都无关),有兴趣的同学大概可以去看看v8和SpiderMonkey怎么实现的。
Proxy
差点忘了这个,因为,目前,截至到本文发稿,v8并不支持标准中的新特性(--harmony_proxies
开启的是已废弃的Proxy API),所以node也不支持。firefox倒是支持非常好哈哈。
在python中,标准库中有个较defaultdict
的东西。有什么作用看看下面的例子就知道了。事实上,nltk wordnet corpus reader生成映射的时候很依赖这个功能。
1 | In [3]: from collections import defaultdict |
显然我们不想让不存在的东西报错,我们也不想每次都写个if语句判断是吧。
1 | if not dct['a']: |
如果你知道dct
中有哪些键当然也能全首先赋成字典,但是,很多情况下你并不知道有哪些键,还得依靠if来判断。defaultdict
优雅的解决了这个问题。
遗憾的是,javascript中没有这种东西。忽然想到了ES6 in Depth: Proxies中的例子,想到可以依靠这个特性自己实现一个defaultdict
。
1 | function Defaultdict() { |
目前只有firefox支持标准的Proxy API。当然V8/node中可以polyfill出来,请自行github。
用Proxy
可以结合Map
来实现Map
版本的DefaultMap哈哈。
PS: 浏览器调试工具会调用一些方法。比如,你新建一个expandedDct
之后,如果在firebug中想用.
来查看变量,会对其调用很多方法。。。结果就是expandedDct
多了很多firebug探查对象属性用到的函数名。。。我在这个问题上纠结了几乎两个小时没明白为啥多了这些奇怪的键而且一会儿有一会儿没。切切注意!!
1 | > Object.keys(expandedDct) ["a", "c", "length", "fullPath", "fileSize", "header", "body", "getSourceLink"] |
总结
以上,就是最近感觉比较有意思的一些ES6特性,就这样吧。
Have fun!