JavaScriptCore:
[WebKit-https.git] / LayoutTests / fast / js / resources / regexp-non-bmp.js
1 description(
2 'Tests that regular expressions treat non-BMP characters as two separate characters. '
3 + 'From a Unicode correctness point of view this is wrong, but it is what other browsers do. '
4 + 'And given that we store strings as UTF-16, it is also more efficient to implement. '
5 + 'Also test some other cases related to UTF-8 and UTF-16.'
6 );
7
8 var surrogatePair = String.fromCharCode(0xD800) + String.fromCharCode(0xDC00);
9
10 shouldBe('/./.exec(surrogatePair).toString().length', '1');
11 shouldBe('/\\D/.exec(surrogatePair).toString().length', '1');
12 shouldBe('/\\S/.exec(surrogatePair).toString().length', '1');
13 shouldBe('/\\W/.exec(surrogatePair).toString().length', '1');
14 shouldBe('/[^x]/.exec(surrogatePair).toString().length', '1');
15
16 debug('');
17
18 shouldBe('/.{1,2}/.exec("!!" + String.fromCharCode(0xA1)).toString().length', '2');
19 shouldBe('/./.exec("")', 'null');
20
21 debug('');
22
23 var successfullyParsed = true;