[WebSocket] Should raise SYNTAX_ERR when message contains unpaired surrogates
[WebKit-https.git] / Source / WebCore / Modules / websockets / WebSocket.cpp
1 /*
2  * Copyright (C) 2011 Google Inc.  All rights reserved.
3  *
4  * Redistribution and use in source and binary forms, with or without
5  * modification, are permitted provided that the following conditions are
6  * met:
7  *
8  *     * Redistributions of source code must retain the above copyright
9  * notice, this list of conditions and the following disclaimer.
10  *     * Redistributions in binary form must reproduce the above
11  * copyright notice, this list of conditions and the following disclaimer
12  * in the documentation and/or other materials provided with the
13  * distribution.
14  *     * Neither the name of Google Inc. nor the names of its
15  * contributors may be used to endorse or promote products derived from
16  * this software without specific prior written permission.
17  *
18  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
19  * "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
20  * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
21  * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
22  * OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
23  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
24  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
25  * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
26  * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
27  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
28  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
29  */
30
31 #include "config.h"
32
33 #if ENABLE(WEB_SOCKETS)
34
35 #include "WebSocket.h"
36
37 #include "Blob.h"
38 #include "BlobData.h"
39 #include "CloseEvent.h"
40 #include "ContentSecurityPolicy.h"
41 #include "DOMWindow.h"
42 #include "Event.h"
43 #include "EventException.h"
44 #include "EventListener.h"
45 #include "EventNames.h"
46 #include "ExceptionCode.h"
47 #include "Logging.h"
48 #include "MessageEvent.h"
49 #include "ScriptCallStack.h"
50 #include "ScriptExecutionContext.h"
51 #include "SecurityOrigin.h"
52 #include "ThreadableWebSocketChannel.h"
53 #include "WebSocketChannel.h"
54 #include <wtf/HashSet.h>
55 #include <wtf/OwnPtr.h>
56 #include <wtf/PassOwnPtr.h>
57 #include <wtf/StdLibExtras.h>
58 #include <wtf/text/CString.h>
59 #include <wtf/text/StringBuilder.h>
60 #include <wtf/text/WTFString.h>
61
62 using namespace std;
63
64 namespace WebCore {
65
66 const size_t maxReasonSizeInBytes = 123;
67
68 static inline bool isValidProtocolCharacter(UChar character)
69 {
70     // Hybi-10 says "(Subprotocol string must consist of) characters in the range U+0021 to U+007E not including
71     // separator characters as defined in [RFC2616]."
72     const UChar minimumProtocolCharacter = '!'; // U+0021.
73     const UChar maximumProtocolCharacter = '~'; // U+007E.
74     return character >= minimumProtocolCharacter && character <= maximumProtocolCharacter
75         && character != '"' && character != '(' && character != ')' && character != ',' && character != '/'
76         && !(character >= ':' && character <= '@') // U+003A - U+0040 (':', ';', '<', '=', '>', '?', '@').
77         && !(character >= '[' && character <= ']') // U+005B - U+005D ('[', '\\', ']').
78         && character != '{' && character != '}';
79 }
80
81 static bool isValidProtocolString(const String& protocol)
82 {
83     if (protocol.isEmpty())
84         return false;
85     for (size_t i = 0; i < protocol.length(); ++i) {
86         if (!isValidProtocolCharacter(protocol[i]))
87             return false;
88     }
89     return true;
90 }
91
92 static bool isValidProtocolStringHixie76(const String& protocol)
93 {
94     if (protocol.isNull())
95         return true;
96     if (protocol.isEmpty())
97         return false;
98     const UChar* characters = protocol.characters();
99     for (size_t i = 0; i < protocol.length(); i++) {
100         if (characters[i] < 0x20 || characters[i] > 0x7E)
101             return false;
102     }
103     return true;
104 }
105
106 static String encodeProtocolString(const String& protocol)
107 {
108     StringBuilder builder;
109     for (size_t i = 0; i < protocol.length(); i++) {
110         if (protocol[i] < 0x20 || protocol[i] > 0x7E)
111             builder.append(String::format("\\u%04X", protocol[i]));
112         else if (protocol[i] == 0x5c)
113             builder.append("\\\\");
114         else
115             builder.append(protocol[i]);
116     }
117     return builder.toString();
118 }
119
120 static String joinStrings(const Vector<String>& strings, const char* separator)
121 {
122     StringBuilder builder;
123     for (size_t i = 0; i < strings.size(); ++i) {
124         if (i)
125             builder.append(separator);
126         builder.append(strings[i]);
127     }
128     return builder.toString();
129 }
130
131 static unsigned long saturateAdd(unsigned long a, unsigned long b)
132 {
133     if (numeric_limits<unsigned long>::max() - a < b)
134         return numeric_limits<unsigned long>::max();
135     return a + b;
136 }
137
138 static bool webSocketsAvailable = false;
139
140 void WebSocket::setIsAvailable(bool available)
141 {
142     webSocketsAvailable = available;
143 }
144
145 bool WebSocket::isAvailable()
146 {
147     return webSocketsAvailable;
148 }
149
150 WebSocket::WebSocket(ScriptExecutionContext* context)
151     : ActiveDOMObject(context, this)
152     , m_state(CONNECTING)
153     , m_bufferedAmount(0)
154     , m_bufferedAmountAfterClose(0)
155     , m_binaryType(BinaryTypeBlob)
156     , m_useHixie76Protocol(true)
157     , m_subprotocol("")
158     , m_extensions("")
159 {
160 }
161
162 WebSocket::~WebSocket()
163 {
164     if (m_channel)
165         m_channel->disconnect();
166 }
167
168 PassRefPtr<WebSocket> WebSocket::create(ScriptExecutionContext* context)
169 {
170     RefPtr<WebSocket> webSocket(adoptRef(new WebSocket(context)));
171     webSocket->suspendIfNeeded();
172     return webSocket.release();
173 }
174
175 void WebSocket::connect(const String& url, ExceptionCode& ec)
176 {
177     Vector<String> protocols;
178     connect(url, protocols, ec);
179 }
180
181 void WebSocket::connect(const String& url, const String& protocol, ExceptionCode& ec)
182 {
183     Vector<String> protocols;
184     protocols.append(protocol);
185     connect(url, protocols, ec);
186 }
187
188 void WebSocket::connect(const String& url, const Vector<String>& protocols, ExceptionCode& ec)
189 {
190     LOG(Network, "WebSocket %p connect to %s", this, url.utf8().data());
191     m_url = KURL(KURL(), url);
192
193     if (!m_url.isValid()) {
194         scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "Invalid url for WebSocket " + m_url.string(), scriptExecutionContext()->securityOrigin()->toString());
195         m_state = CLOSED;
196         ec = SYNTAX_ERR;
197         return;
198     }
199
200     if (!m_url.protocolIs("ws") && !m_url.protocolIs("wss")) {
201         scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "Wrong url scheme for WebSocket " + m_url.string(), scriptExecutionContext()->securityOrigin()->toString());
202         m_state = CLOSED;
203         ec = SYNTAX_ERR;
204         return;
205     }
206     if (m_url.hasFragmentIdentifier()) {
207         scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "URL has fragment component " + m_url.string(), scriptExecutionContext()->securityOrigin()->toString());
208         m_state = CLOSED;
209         ec = SYNTAX_ERR;
210         return;
211     }
212     if (!portAllowed(m_url)) {
213         scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "WebSocket port " + String::number(m_url.port()) + " blocked", scriptExecutionContext()->securityOrigin()->toString());
214         m_state = CLOSED;
215         ec = SECURITY_ERR;
216         return;
217     }
218
219     if (!scriptExecutionContext()->contentSecurityPolicy()->allowConnectFromSource(m_url)) {
220         m_state = CLOSED;
221
222         // FIXME: Should this be throwing an exception?
223         ec = SECURITY_ERR;
224         return;
225     }
226
227     m_channel = ThreadableWebSocketChannel::create(scriptExecutionContext(), this);
228     m_useHixie76Protocol = m_channel->useHixie76Protocol();
229
230     String protocolString;
231     if (m_useHixie76Protocol) {
232         if (!protocols.isEmpty()) {
233             // Emulate JavaScript's Array.toString() behavior.
234             protocolString = joinStrings(protocols, ",");
235         }
236         if (!isValidProtocolStringHixie76(protocolString)) {
237             scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "Wrong protocol for WebSocket '" + encodeProtocolString(protocolString) + "'", scriptExecutionContext()->securityOrigin()->toString());
238             m_state = CLOSED;
239             ec = SYNTAX_ERR;
240             return;
241         }
242     } else {
243         // FIXME: There is a disagreement about restriction of subprotocols between WebSocket API and hybi-10 protocol
244         // draft. The former simply says "only characters in the range U+0021 to U+007E are allowed," while the latter
245         // imposes a stricter rule: "the elements MUST be non-empty strings with characters as defined in [RFC2616],
246         // and MUST all be unique strings."
247         //
248         // Here, we throw SYNTAX_ERR if the given protocols do not meet the latter criteria. This behavior does not
249         // comply with WebSocket API specification, but it seems to be the only reasonable way to handle this conflict.
250         for (size_t i = 0; i < protocols.size(); ++i) {
251             if (!isValidProtocolString(protocols[i])) {
252                 scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "Wrong protocol for WebSocket '" + encodeProtocolString(protocols[i]) + "'", scriptExecutionContext()->securityOrigin()->toString());
253                 m_state = CLOSED;
254                 ec = SYNTAX_ERR;
255                 return;
256             }
257         }
258         HashSet<String> visited;
259         for (size_t i = 0; i < protocols.size(); ++i) {
260             if (visited.contains(protocols[i])) {
261                 scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "WebSocket protocols contain duplicates: '" + encodeProtocolString(protocols[i]) + "'", scriptExecutionContext()->securityOrigin()->toString());
262                 m_state = CLOSED;
263                 ec = SYNTAX_ERR;
264                 return;
265             }
266             visited.add(protocols[i]);
267         }
268
269         if (!protocols.isEmpty())
270             protocolString = joinStrings(protocols, ", ");
271     }
272
273     m_channel->connect(m_url, protocolString);
274     ActiveDOMObject::setPendingActivity(this);
275 }
276
277 bool WebSocket::send(const String& message, ExceptionCode& ec)
278 {
279     LOG(Network, "WebSocket %p send %s", this, message.utf8().data());
280     if (m_state == CONNECTING) {
281         ec = INVALID_STATE_ERR;
282         return false;
283     }
284     // No exception is raised if the connection was once established but has subsequently been closed.
285     if (m_state == CLOSING || m_state == CLOSED) {
286         size_t payloadSize = message.utf8().length();
287         m_bufferedAmountAfterClose = saturateAdd(m_bufferedAmountAfterClose, payloadSize);
288         m_bufferedAmountAfterClose = saturateAdd(m_bufferedAmountAfterClose, getFramingOverhead(payloadSize));
289         return false;
290     }
291     ASSERT(m_channel);
292     ThreadableWebSocketChannel::SendResult result = m_channel->send(message);
293     if (result == ThreadableWebSocketChannel::InvalidMessage) {
294         scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "Websocket message contains invalid character(s).");
295         ec = SYNTAX_ERR;
296         return false;
297     }
298     return result == ThreadableWebSocketChannel::SendSuccess;
299 }
300
301 bool WebSocket::send(ArrayBuffer* binaryData, ExceptionCode& ec)
302 {
303     LOG(Network, "WebSocket %p send arraybuffer %p", this, binaryData);
304     ASSERT(binaryData);
305     if (m_useHixie76Protocol)
306         return send("[object ArrayBuffer]", ec);
307     if (m_state == CONNECTING) {
308         ec = INVALID_STATE_ERR;
309         return false;
310     }
311     if (m_state == CLOSING || m_state == CLOSED) {
312         unsigned payloadSize = binaryData->byteLength();
313         m_bufferedAmountAfterClose = saturateAdd(m_bufferedAmountAfterClose, payloadSize);
314         m_bufferedAmountAfterClose = saturateAdd(m_bufferedAmountAfterClose, getFramingOverhead(payloadSize));
315         return false;
316     }
317     ASSERT(m_channel);
318     return m_channel->send(*binaryData) == ThreadableWebSocketChannel::SendSuccess;
319 }
320
321 bool WebSocket::send(Blob* binaryData, ExceptionCode& ec)
322 {
323     LOG(Network, "WebSocket %p send blob %s", this, binaryData->url().string().utf8().data());
324     ASSERT(binaryData);
325     if (m_useHixie76Protocol)
326         return send("[object Blob]", ec);
327     if (m_state == CONNECTING) {
328         ec = INVALID_STATE_ERR;
329         return false;
330     }
331     if (m_state == CLOSING || m_state == CLOSED) {
332         unsigned long payloadSize = static_cast<unsigned long>(binaryData->size());
333         m_bufferedAmountAfterClose = saturateAdd(m_bufferedAmountAfterClose, payloadSize);
334         m_bufferedAmountAfterClose = saturateAdd(m_bufferedAmountAfterClose, getFramingOverhead(payloadSize));
335         return false;
336     }
337     ASSERT(m_channel);
338     return m_channel->send(*binaryData) == ThreadableWebSocketChannel::SendSuccess;
339 }
340
341 void WebSocket::close(int code, const String& reason, ExceptionCode& ec)
342 {
343     if (code == WebSocketChannel::CloseEventCodeNotSpecified)
344         LOG(Network, "WebSocket %p close without code and reason", this);
345     else {
346         LOG(Network, "WebSocket %p close with code = %d, reason = %s", this, code, reason.utf8().data());
347         if (!(code == WebSocketChannel::CloseEventCodeNormalClosure || (WebSocketChannel::CloseEventCodeMinimumUserDefined <= code && code <= WebSocketChannel::CloseEventCodeMaximumUserDefined))) {
348             ec = INVALID_ACCESS_ERR;
349             return;
350         }
351         CString utf8 = reason.utf8(true);
352         if (utf8.length() > maxReasonSizeInBytes) {
353             scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "WebSocket close message is too long.");
354             ec = SYNTAX_ERR;
355             return;
356         }
357         // Checks whether reason is valid utf8.
358         if (utf8.isNull() && reason.length()) {
359             scriptExecutionContext()->addConsoleMessage(JSMessageSource, LogMessageType, ErrorMessageLevel, "WebSocket close message contains invalid character(s).");
360             ec = SYNTAX_ERR;
361             return;
362         }
363     }
364
365     if (m_state == CLOSING || m_state == CLOSED)
366         return;
367     if (m_state == CONNECTING) {
368         m_state = CLOSING;
369         m_channel->fail("WebSocket is closed before the connection is established.");
370         return;
371     }
372     m_state = CLOSING;
373     if (m_channel)
374         m_channel->close(code, reason);
375 }
376
377 const KURL& WebSocket::url() const
378 {
379     return m_url;
380 }
381
382 WebSocket::State WebSocket::readyState() const
383 {
384     return m_state;
385 }
386
387 unsigned long WebSocket::bufferedAmount() const
388 {
389     return saturateAdd(m_bufferedAmount, m_bufferedAmountAfterClose);
390 }
391
392 String WebSocket::protocol() const
393 {
394     if (m_useHixie76Protocol)
395         return String();
396     return m_subprotocol;
397 }
398
399 String WebSocket::extensions() const
400 {
401     if (m_useHixie76Protocol)
402         return String();
403     return m_extensions;
404 }
405
406 String WebSocket::binaryType() const
407 {
408     if (m_useHixie76Protocol)
409         return String();
410     switch (m_binaryType) {
411     case BinaryTypeBlob:
412         return "blob";
413     case BinaryTypeArrayBuffer:
414         return "arraybuffer";
415     }
416     ASSERT_NOT_REACHED();
417     return String();
418 }
419
420 void WebSocket::setBinaryType(const String& binaryType, ExceptionCode& ec)
421 {
422     if (m_useHixie76Protocol)
423         return;
424     if (binaryType == "blob") {
425         m_binaryType = BinaryTypeBlob;
426         return;
427     }
428     if (binaryType == "arraybuffer") {
429         m_binaryType = BinaryTypeArrayBuffer;
430         return;
431     }
432     ec = SYNTAX_ERR;
433     return;
434 }
435
436 const AtomicString& WebSocket::interfaceName() const
437 {
438     return eventNames().interfaceForWebSocket;
439 }
440
441 ScriptExecutionContext* WebSocket::scriptExecutionContext() const
442 {
443     return ActiveDOMObject::scriptExecutionContext();
444 }
445
446 void WebSocket::contextDestroyed()
447 {
448     LOG(Network, "WebSocket %p scriptExecutionContext destroyed", this);
449     ASSERT(!m_channel);
450     ASSERT(m_state == CLOSED);
451     ActiveDOMObject::contextDestroyed();
452 }
453
454 bool WebSocket::canSuspend() const
455 {
456     return !m_channel;
457 }
458
459 void WebSocket::suspend(ReasonForSuspension)
460 {
461     if (m_channel)
462         m_channel->suspend();
463 }
464
465 void WebSocket::resume()
466 {
467     if (m_channel)
468         m_channel->resume();
469 }
470
471 void WebSocket::stop()
472 {
473     bool pending = hasPendingActivity();
474     if (m_channel)
475         m_channel->disconnect();
476     m_channel = 0;
477     m_state = CLOSED;
478     ActiveDOMObject::stop();
479     if (pending)
480         ActiveDOMObject::unsetPendingActivity(this);
481 }
482
483 void WebSocket::didConnect()
484 {
485     LOG(Network, "WebSocket %p didConnect", this);
486     if (m_state != CONNECTING) {
487         didClose(0, ClosingHandshakeIncomplete, WebSocketChannel::CloseEventCodeAbnormalClosure, "");
488         return;
489     }
490     ASSERT(scriptExecutionContext());
491     m_state = OPEN;
492     m_subprotocol = m_channel->subprotocol();
493     m_extensions = m_channel->extensions();
494     dispatchEvent(Event::create(eventNames().openEvent, false, false));
495 }
496
497 void WebSocket::didReceiveMessage(const String& msg)
498 {
499     LOG(Network, "WebSocket %p didReceiveMessage %s", this, msg.utf8().data());
500     if (m_state != OPEN && m_state != CLOSING)
501         return;
502     ASSERT(scriptExecutionContext());
503     dispatchEvent(MessageEvent::create(msg));
504 }
505
506 void WebSocket::didReceiveBinaryData(PassOwnPtr<Vector<char> > binaryData)
507 {
508     switch (m_binaryType) {
509     case BinaryTypeBlob: {
510         size_t size = binaryData->size();
511         RefPtr<RawData> rawData = RawData::create();
512         binaryData->swap(*rawData->mutableData());
513         OwnPtr<BlobData> blobData = BlobData::create();
514         blobData->appendData(rawData.release(), 0, BlobDataItem::toEndOfFile);
515         RefPtr<Blob> blob = Blob::create(blobData.release(), size);
516         dispatchEvent(MessageEvent::create(blob.release()));
517         break;
518     }
519
520     case BinaryTypeArrayBuffer:
521         dispatchEvent(MessageEvent::create(ArrayBuffer::create(binaryData->data(), binaryData->size())));
522         break;
523     }
524 }
525
526 void WebSocket::didReceiveMessageError()
527 {
528     LOG(Network, "WebSocket %p didReceiveErrorMessage", this);
529     if (m_state != OPEN && m_state != CLOSING)
530         return;
531     ASSERT(scriptExecutionContext());
532     dispatchEvent(Event::create(eventNames().errorEvent, false, false));
533 }
534
535 void WebSocket::didUpdateBufferedAmount(unsigned long bufferedAmount)
536 {
537     LOG(Network, "WebSocket %p didUpdateBufferedAmount %lu", this, bufferedAmount);
538     if (m_state == CLOSED)
539         return;
540     m_bufferedAmount = bufferedAmount;
541 }
542
543 void WebSocket::didStartClosingHandshake()
544 {
545     LOG(Network, "WebSocket %p didStartClosingHandshake", this);
546     m_state = CLOSING;
547 }
548
549 void WebSocket::didClose(unsigned long unhandledBufferedAmount, ClosingHandshakeCompletionStatus closingHandshakeCompletion, unsigned short code, const String& reason)
550 {
551     LOG(Network, "WebSocket %p didClose", this);
552     if (!m_channel)
553         return;
554     bool wasClean = m_state == CLOSING && !unhandledBufferedAmount && closingHandshakeCompletion == ClosingHandshakeComplete;
555     m_state = CLOSED;
556     m_bufferedAmount = unhandledBufferedAmount;
557     ASSERT(scriptExecutionContext());
558     RefPtr<CloseEvent> event = CloseEvent::create(wasClean, code, reason);
559     dispatchEvent(event);
560     if (m_channel) {
561         m_channel->disconnect();
562         m_channel = 0;
563     }
564     if (hasPendingActivity())
565         ActiveDOMObject::unsetPendingActivity(this);
566 }
567
568 EventTargetData* WebSocket::eventTargetData()
569 {
570     return &m_eventTargetData;
571 }
572
573 EventTargetData* WebSocket::ensureEventTargetData()
574 {
575     return &m_eventTargetData;
576 }
577
578 size_t WebSocket::getFramingOverhead(size_t payloadSize)
579 {
580     static const size_t hixie76FramingOverhead = 2; // Payload is surrounded by 0x00 and 0xFF.
581     if (m_useHixie76Protocol)
582         return hixie76FramingOverhead;
583
584     static const size_t hybiBaseFramingOverhead = 2; // Every frame has at least two-byte header.
585     static const size_t hybiMaskingKeyLength = 4; // Every frame from client must have masking key.
586     static const size_t minimumPayloadSizeWithTwoByteExtendedPayloadLength = 126;
587     static const size_t minimumPayloadSizeWithEightByteExtendedPayloadLength = 0x10000;
588     size_t overhead = hybiBaseFramingOverhead + hybiMaskingKeyLength;
589     if (payloadSize >= minimumPayloadSizeWithEightByteExtendedPayloadLength)
590         overhead += 8;
591     else if (payloadSize >= minimumPayloadSizeWithTwoByteExtendedPayloadLength)
592         overhead += 2;
593     return overhead;
594 }
595
596 }  // namespace WebCore
597
598 #endif