21359a4572680ba36ae2e606e0d1a491de85a189
[WebKit-https.git] / Source / JavaScriptCore / runtime / RegExpObject.cpp
1 /*
2  *  Copyright (C) 1999-2000 Harri Porten (porten@kde.org)
3  *  Copyright (C) 2003, 2007-2008, 2012, 2016 Apple Inc. All Rights Reserved.
4  *
5  *  This library is free software; you can redistribute it and/or
6  *  modify it under the terms of the GNU Lesser General Public
7  *  License as published by the Free Software Foundation; either
8  *  version 2 of the License, or (at your option) any later version.
9  *
10  *  This library is distributed in the hope that it will be useful,
11  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
12  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  *  Lesser General Public License for more details.
14  *
15  *  You should have received a copy of the GNU Lesser General Public
16  *  License along with this library; if not, write to the Free Software
17  *  Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA
18  *
19  */
20
21 #include "config.h"
22 #include "RegExpObject.h"
23
24 #include "Error.h"
25 #include "ExceptionHelpers.h"
26 #include "JSArray.h"
27 #include "JSGlobalObject.h"
28 #include "JSString.h"
29 #include "Lookup.h"
30 #include "JSCInlines.h"
31 #include "RegExpConstructor.h"
32 #include "RegExpObjectInlines.h"
33
34 namespace JSC {
35
36 STATIC_ASSERT_IS_TRIVIALLY_DESTRUCTIBLE(RegExpObject);
37
38 const ClassInfo RegExpObject::s_info = { "RegExp", &Base::s_info, nullptr, CREATE_METHOD_TABLE(RegExpObject) };
39
40 RegExpObject::RegExpObject(VM& vm, Structure* structure, RegExp* regExp)
41     : JSNonFinalObject(vm, structure)
42     , m_regExp(vm, this, regExp)
43     , m_lastIndexIsWritable(true)
44 {
45     m_lastIndex.setWithoutWriteBarrier(jsNumber(0));
46 }
47
48 void RegExpObject::finishCreation(VM& vm)
49 {
50     Base::finishCreation(vm);
51     ASSERT(inherits(info()));
52 }
53
54 void RegExpObject::visitChildren(JSCell* cell, SlotVisitor& visitor)
55 {
56     RegExpObject* thisObject = jsCast<RegExpObject*>(cell);
57     ASSERT_GC_OBJECT_INHERITS(thisObject, info());
58     Base::visitChildren(thisObject, visitor);
59     visitor.append(&thisObject->m_regExp);
60     visitor.append(&thisObject->m_lastIndex);
61 }
62
63 bool RegExpObject::getOwnPropertySlot(JSObject* object, ExecState* exec, PropertyName propertyName, PropertySlot& slot)
64 {
65     if (propertyName == exec->propertyNames().lastIndex) {
66         RegExpObject* regExp = asRegExpObject(object);
67         unsigned attributes = regExp->m_lastIndexIsWritable ? DontDelete | DontEnum : DontDelete | DontEnum | ReadOnly;
68         slot.setValue(regExp, attributes, regExp->getLastIndex());
69         return true;
70     }
71     return Base::getOwnPropertySlot(object, exec, propertyName, slot);
72 }
73
74 bool RegExpObject::deleteProperty(JSCell* cell, ExecState* exec, PropertyName propertyName)
75 {
76     if (propertyName == exec->propertyNames().lastIndex)
77         return false;
78     return Base::deleteProperty(cell, exec, propertyName);
79 }
80
81 void RegExpObject::getOwnNonIndexPropertyNames(JSObject* object, ExecState* exec, PropertyNameArray& propertyNames, EnumerationMode mode)
82 {
83     if (mode.includeDontEnumProperties())
84         propertyNames.add(exec->propertyNames().lastIndex);
85     Base::getOwnNonIndexPropertyNames(object, exec, propertyNames, mode);
86 }
87
88 void RegExpObject::getPropertyNames(JSObject* object, ExecState* exec, PropertyNameArray& propertyNames, EnumerationMode mode)
89 {
90     if (mode.includeDontEnumProperties())
91         propertyNames.add(exec->propertyNames().lastIndex);
92     Base::getPropertyNames(object, exec, propertyNames, mode);
93 }
94
95 void RegExpObject::getGenericPropertyNames(JSObject* object, ExecState* exec, PropertyNameArray& propertyNames, EnumerationMode mode)
96 {
97     if (mode.includeDontEnumProperties())
98         propertyNames.add(exec->propertyNames().lastIndex);
99     Base::getGenericPropertyNames(object, exec, propertyNames, mode);
100 }
101
102 bool RegExpObject::defineOwnProperty(JSObject* object, ExecState* exec, PropertyName propertyName, const PropertyDescriptor& descriptor, bool shouldThrow)
103 {
104     VM& vm = exec->vm();
105     auto scope = DECLARE_THROW_SCOPE(vm);
106
107     if (propertyName == vm.propertyNames->lastIndex) {
108         RegExpObject* regExp = asRegExpObject(object);
109         if (descriptor.configurablePresent() && descriptor.configurable())
110             return reject(exec, scope, shouldThrow, ASCIILiteral(UnconfigurablePropertyChangeConfigurabilityError));
111         if (descriptor.enumerablePresent() && descriptor.enumerable())
112             return reject(exec, scope, shouldThrow, ASCIILiteral(UnconfigurablePropertyChangeEnumerabilityError));
113         if (descriptor.isAccessorDescriptor())
114             return reject(exec, scope, shouldThrow, ASCIILiteral(UnconfigurablePropertyChangeAccessMechanismError));
115         if (!regExp->m_lastIndexIsWritable) {
116             if (descriptor.writablePresent() && descriptor.writable())
117                 return reject(exec, scope, shouldThrow, ASCIILiteral(UnconfigurablePropertyChangeWritabilityError));
118             if (!sameValue(exec, regExp->getLastIndex(), descriptor.value()))
119                 return reject(exec, scope, shouldThrow, ASCIILiteral(ReadonlyPropertyChangeError));
120             return true;
121         }
122         if (descriptor.value())
123             regExp->setLastIndex(exec, descriptor.value(), false);
124         if (descriptor.writablePresent() && !descriptor.writable())
125             regExp->m_lastIndexIsWritable = false;
126         return true;
127     }
128
129     return Base::defineOwnProperty(object, exec, propertyName, descriptor, shouldThrow);
130 }
131
132 static bool regExpObjectSetLastIndexStrict(ExecState* exec, EncodedJSValue thisValue, EncodedJSValue value)
133 {
134     return asRegExpObject(JSValue::decode(thisValue))->setLastIndex(exec, JSValue::decode(value), true);
135 }
136
137 static bool regExpObjectSetLastIndexNonStrict(ExecState* exec, EncodedJSValue thisValue, EncodedJSValue value)
138 {
139     return asRegExpObject(JSValue::decode(thisValue))->setLastIndex(exec, JSValue::decode(value), false);
140 }
141
142 bool RegExpObject::put(JSCell* cell, ExecState* exec, PropertyName propertyName, JSValue value, PutPropertySlot& slot)
143 {
144     RegExpObject* thisObject = jsCast<RegExpObject*>(cell);
145
146     if (UNLIKELY(isThisValueAltered(slot, thisObject)))
147         return ordinarySetSlow(exec, thisObject, propertyName, value, slot.thisValue(), slot.isStrictMode());
148
149     if (propertyName == exec->propertyNames().lastIndex) {
150         bool result = asRegExpObject(cell)->setLastIndex(exec, value, slot.isStrictMode());
151         slot.setCustomValue(asRegExpObject(cell), slot.isStrictMode()
152             ? regExpObjectSetLastIndexStrict
153             : regExpObjectSetLastIndexNonStrict);
154         return result;
155     }
156     return Base::put(cell, exec, propertyName, value, slot);
157 }
158
159 JSValue RegExpObject::exec(ExecState* exec, JSGlobalObject* globalObject, JSString* string)
160 {
161     return execInline(exec, globalObject, string);
162 }
163
164 // Shared implementation used by test and exec.
165 MatchResult RegExpObject::match(ExecState* exec, JSGlobalObject* globalObject, JSString* string)
166 {
167     return matchInline(exec, globalObject, string);
168 }
169
170 template<typename FixEndFunc>
171 JSValue collectMatches(VM& vm, ExecState* exec, JSString* string, const String& s, RegExpConstructor* constructor, RegExp* regExp, const FixEndFunc& fixEnd)
172 {
173     auto scope = DECLARE_THROW_SCOPE(vm);
174
175     MatchResult result = constructor->performMatch(vm, regExp, string, s, 0);
176     if (!result)
177         return jsNull();
178     
179     static unsigned maxSizeForDirectPath = 100000;
180     
181     JSArray* array = constructEmptyArray(exec, nullptr);
182     RETURN_IF_EXCEPTION(scope, JSValue());
183
184     auto iterate = [&] () {
185         size_t end = result.end;
186         size_t length = end - result.start;
187         array->push(exec, JSRopeString::createSubstringOfResolved(vm, string, result.start, length));
188         if (!length)
189             end = fixEnd(end);
190         result = constructor->performMatch(vm, regExp, string, s, end);
191     };
192     
193     do {
194         if (array->length() >= maxSizeForDirectPath) {
195             // First do a throw-away match to see how many matches we'll get.
196             unsigned matchCount = 0;
197             MatchResult savedResult = result;
198             do {
199                 if (array->length() + matchCount >= MAX_STORAGE_VECTOR_LENGTH) {
200                     throwOutOfMemoryError(exec, scope);
201                     return jsUndefined();
202                 }
203                 
204                 size_t end = result.end;
205                 matchCount++;
206                 if (result.empty())
207                     end = fixEnd(end);
208                 
209                 // Using RegExpConstructor::performMatch() instead of calling RegExp::match()
210                 // directly is a surprising but profitable choice: it means that when we do OOM, we
211                 // will leave the cached result in the state it ought to have had just before the
212                 // OOM! On the other hand, if this loop concludes that the result is small enough,
213                 // then the iterate() loop below will overwrite the cached result anyway.
214                 result = constructor->performMatch(vm, regExp, string, s, end);
215             } while (result);
216             
217             // OK, we have a sensible number of matches. Now we can create them for reals.
218             result = savedResult;
219             do
220                 iterate();
221             while (result);
222             
223             return array;
224         }
225         
226         iterate();
227     } while (result);
228     
229     return array;
230 }
231
232 JSValue RegExpObject::matchGlobal(ExecState* exec, JSGlobalObject* globalObject, JSString* string)
233 {
234     VM& vm = globalObject->vm();
235     auto scope = DECLARE_THROW_SCOPE(vm);
236     RegExp* regExp = this->regExp();
237
238     ASSERT(regExp->global());
239
240     setLastIndex(exec, 0);
241     RETURN_IF_EXCEPTION(scope, JSValue());
242
243     String s = string->value(exec);
244     RegExpConstructor* regExpConstructor = globalObject->regExpConstructor();
245     
246     if (regExp->unicode()) {
247         unsigned stringLength = s.length();
248         return collectMatches(
249             vm, exec, string, s, regExpConstructor, regExp,
250             [&] (size_t end) -> size_t {
251                 return advanceStringUnicode(s, stringLength, end);
252             });
253     }
254     
255     return collectMatches(
256         vm, exec, string, s, regExpConstructor, regExp,
257         [&] (size_t end) -> size_t {
258             return end + 1;
259         });
260 }
261
262 } // namespace JSC