Modernize some aspects of text codecs, eliminate WebKit use of strcasecmp
[WebKit-https.git] / Source / WTF / wtf / text / LineEnding.cpp
1 /*
2  * Copyright (C) 2005-2017 Apple Inc. All rights reserved.
3  * Copyright (C) 2010 Google Inc. All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions are
7  * met:
8  *
9  *     * Redistributions of source code must retain the above copyright
10  * notice, this list of conditions and the following disclaimer.
11  *     * Redistributions in binary form must reproduce the above
12  * copyright notice, this list of conditions and the following disclaimer
13  * in the documentation and/or other materials provided with the
14  * distribution.
15  *     * Neither the name of Google Inc. nor the names of its
16  * contributors may be used to endorse or promote products derived from
17  * this software without specific prior written permission.
18  *
19  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
20  * "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
21  * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
22  * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
23  * OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
24  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
25  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
26  * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
27  * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
28  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
29  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
30  */
31
32 #include "config.h"
33 #include "LineEnding.h"
34
35 #include <wtf/Vector.h>
36
37 namespace WTF {
38
39 Vector<uint8_t> normalizeLineEndingsToLF(Vector<uint8_t>&& vector)
40 {
41     auto q = vector.data();
42     for (auto p = vector.data(), end = p + vector.size(); p != end; ) {
43         auto character = *p++;
44         if (character == '\r') {
45             // Turn CRLF and CR into LF.
46             if (p != end && *p == '\n')
47                 ++p;
48             *q++ = '\n';
49         } else {
50             // Leave other characters alone.
51             *q++ = character;
52         }
53     }
54     vector.shrink(q - vector.data());
55     return WTFMove(vector);
56 }
57
58 Vector<uint8_t> normalizeLineEndingsToCRLF(Vector<uint8_t>&& source)
59 {
60     size_t resultLength = 0;
61     for (auto p = source.data(), end = p + source.size(); p != end; ) {
62         auto character = *p++;
63         if (character == '\r') {
64             // Turn CR or CRLF into CRLF;
65             if (p != end && *p == '\n')
66                 ++p;
67             resultLength += 2;
68         } else if (character == '\n') {
69             // Turn LF into CRLF.
70             resultLength += 2;
71         } else {
72             // Leave other characters alone.
73             resultLength += 1;
74         }
75     }
76
77     if (resultLength == source.size())
78         return WTFMove(source);
79
80     Vector<uint8_t> result(resultLength);
81     auto q = result.data();
82     for (auto p = source.data(), end = p + source.size(); p != end; ) {
83         auto character = *p++;
84         if (character == '\r') {
85             // Turn CR or CRLF into CRLF;
86             if (p != end && *p == '\n')
87                 ++p;
88             *q++ = '\r';
89             *q++ = '\n';
90         } else if (character == '\n') {
91             // Turn LF into CRLF.
92             *q++ = '\r';
93             *q++ = '\n';
94         } else {
95             // Leave other characters alone.
96             *q++ = character;
97         }
98     }
99     ASSERT(q == result.data() + resultLength);
100     return result;
101 }
102
103 Vector<uint8_t> normalizeLineEndingsToNative(Vector<uint8_t>&& from)
104 {
105 #if OS(WINDOWS)
106     return normalizeLineEndingsToCRLF(WTFMove(from));
107 #else
108     return normalizeLineEndingsToLF(WTFMove(from));
109 #endif
110 }
111
112 } // namespace WTF