073115b30c288f9ae3b0d60dd2c83daa04f00d6e
[WebKit-https.git] / Source / WebCore / rendering / RenderText.cpp
1 /*
2  * (C) 1999 Lars Knoll (knoll@kde.org)
3  * (C) 2000 Dirk Mueller (mueller@kde.org)
4  * Copyright (C) 2004-2007, 2013-2015 Apple Inc. All rights reserved.
5  * Copyright (C) 2006 Andrew Wellington (proton@wiretapped.net)
6  * Copyright (C) 2006 Graham Dennis (graham.dennis@gmail.com)
7  *
8  * This library is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Library General Public
10  * License as published by the Free Software Foundation; either
11  * version 2 of the License, or (at your option) any later version.
12  *
13  * This library is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Library General Public License for more details.
17  *
18  * You should have received a copy of the GNU Library General Public License
19  * along with this library; see the file COPYING.LIB.  If not, write to
20  * the Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor,
21  * Boston, MA 02110-1301, USA.
22  *
23  */
24
25 #include "config.h"
26 #include "RenderText.h"
27
28 #include "AXObjectCache.h"
29 #include "BreakLines.h"
30 #include "BreakingContext.h"
31 #include "CharacterProperties.h"
32 #include "DocumentMarker.h"
33 #include "DocumentMarkerController.h"
34 #include "EllipsisBox.h"
35 #include "FloatQuad.h"
36 #include "Frame.h"
37 #include "FrameView.h"
38 #include "Hyphenation.h"
39 #include "InlineTextBox.h"
40 #include "Range.h"
41 #include "RenderBlock.h"
42 #include "RenderCombineText.h"
43 #include "RenderInline.h"
44 #include "RenderLayer.h"
45 #include "RenderView.h"
46 #include "RenderedDocumentMarker.h"
47 #include "Settings.h"
48 #include "SimpleLineLayoutFunctions.h"
49 #include "Text.h"
50 #include <wtf/text/TextBreakIterator.h>
51 #include "TextResourceDecoder.h"
52 #include "VisiblePosition.h"
53 #include <wtf/NeverDestroyed.h>
54 #include <wtf/text/StringBuffer.h>
55 #include <wtf/text/StringBuilder.h>
56 #include <wtf/unicode/CharacterNames.h>
57
58 #if PLATFORM(IOS)
59 #include "Document.h"
60 #include "EditorClient.h"
61 #include "LogicalSelectionOffsetCaches.h"
62 #include "Page.h"
63 #include "SelectionRect.h"
64 #endif
65
66 using namespace WTF;
67 using namespace Unicode;
68
69 namespace WebCore {
70
71 struct SameSizeAsRenderText : public RenderObject {
72     uint32_t bitfields : 16;
73 #if ENABLE(TEXT_AUTOSIZING)
74     float candidateTextSize;
75 #endif
76     float widths[4];
77     String text;
78     void* pointers[2];
79 };
80
81 COMPILE_ASSERT(sizeof(RenderText) == sizeof(SameSizeAsRenderText), RenderText_should_stay_small);
82
83 class SecureTextTimer final : private TimerBase {
84     WTF_MAKE_FAST_ALLOCATED;
85 public:
86     explicit SecureTextTimer(RenderText&);
87     void restart(unsigned offsetAfterLastTypedCharacter);
88
89     unsigned takeOffsetAfterLastTypedCharacter();
90
91 private:
92     void fired() override;
93     RenderText& m_renderer;
94     unsigned m_offsetAfterLastTypedCharacter { 0 };
95 };
96
97 typedef HashMap<RenderText*, std::unique_ptr<SecureTextTimer>> SecureTextTimerMap;
98
99 static SecureTextTimerMap& secureTextTimers()
100 {
101     static NeverDestroyed<SecureTextTimerMap> map;
102     return map.get();
103 }
104
105 inline SecureTextTimer::SecureTextTimer(RenderText& renderer)
106     : m_renderer(renderer)
107 {
108 }
109
110 inline void SecureTextTimer::restart(unsigned offsetAfterLastTypedCharacter)
111 {
112     m_offsetAfterLastTypedCharacter = offsetAfterLastTypedCharacter;
113     startOneShot(1_s * m_renderer.settings().passwordEchoDurationInSeconds());
114 }
115
116 inline unsigned SecureTextTimer::takeOffsetAfterLastTypedCharacter()
117 {
118     unsigned offset = m_offsetAfterLastTypedCharacter;
119     m_offsetAfterLastTypedCharacter = 0;
120     return offset;
121 }
122
123 void SecureTextTimer::fired()
124 {
125     ASSERT(secureTextTimers().get(&m_renderer) == this);
126     m_offsetAfterLastTypedCharacter = 0;
127     m_renderer.setText(m_renderer.text(), true /* forcing setting text as it may be masked later */);
128 }
129
130 static HashMap<const RenderText*, String>& originalTextMap()
131 {
132     static NeverDestroyed<HashMap<const RenderText*, String>> map;
133     return map;
134 }
135
136 void makeCapitalized(String* string, UChar previous)
137 {
138     // FIXME: Need to change this to use u_strToTitle instead of u_totitle and to consider locale.
139
140     if (string->isNull())
141         return;
142
143     unsigned length = string->length();
144     const StringImpl& stringImpl = *string->impl();
145
146     if (length >= std::numeric_limits<unsigned>::max())
147         CRASH();
148
149     StringBuffer<UChar> stringWithPrevious(length + 1);
150     stringWithPrevious[0] = previous == noBreakSpace ? ' ' : previous;
151     for (unsigned i = 1; i < length + 1; i++) {
152         // Replace &nbsp with a real space since ICU no longer treats &nbsp as a word separator.
153         if (stringImpl[i - 1] == noBreakSpace)
154             stringWithPrevious[i] = ' ';
155         else
156             stringWithPrevious[i] = stringImpl[i - 1];
157     }
158
159     UBreakIterator* boundary = wordBreakIterator(StringView(stringWithPrevious.characters(), length + 1));
160     if (!boundary)
161         return;
162
163     StringBuilder result;
164     result.reserveCapacity(length);
165
166     int32_t endOfWord;
167     int32_t startOfWord = ubrk_first(boundary);
168     for (endOfWord = ubrk_next(boundary); endOfWord != UBRK_DONE; startOfWord = endOfWord, endOfWord = ubrk_next(boundary)) {
169         if (startOfWord) // Ignore first char of previous string
170             result.append(stringImpl[startOfWord - 1] == noBreakSpace ? noBreakSpace : u_totitle(stringWithPrevious[startOfWord]));
171         for (int i = startOfWord + 1; i < endOfWord; i++)
172             result.append(stringImpl[i - 1]);
173     }
174
175     *string = result.toString();
176 }
177
178 inline RenderText::RenderText(Node& node, const String& text)
179     : RenderObject(node)
180     , m_hasTab(false)
181     , m_linesDirty(false)
182     , m_containsReversedText(false)
183     , m_isAllASCII(text.containsOnlyASCII())
184     , m_knownToHaveNoOverflowAndNoFallbackFonts(false)
185     , m_useBackslashAsYenSymbol(false)
186     , m_originalTextDiffersFromRendered(false)
187 #if ENABLE(TEXT_AUTOSIZING)
188     , m_candidateComputedTextSize(0)
189 #endif
190     , m_minWidth(-1)
191     , m_maxWidth(-1)
192     , m_beginMinWidth(0)
193     , m_endMinWidth(0)
194     , m_text(text)
195 {
196     ASSERT(!m_text.isNull());
197     setIsText();
198     m_canUseSimpleFontCodePath = computeCanUseSimpleFontCodePath();
199     view().frameView().incrementVisuallyNonEmptyCharacterCount(textLength());
200 }
201
202 RenderText::RenderText(Text& textNode, const String& text)
203     : RenderText(static_cast<Node&>(textNode), text)
204 {
205 }
206
207 RenderText::RenderText(Document& document, const String& text)
208     : RenderText(static_cast<Node&>(document), text)
209 {
210 }
211
212 RenderText::~RenderText()
213 {
214     // Do not add any code here. Add it to willBeDestroyed() instead.
215     ASSERT(!originalTextMap().contains(this));
216 }
217
218 const char* RenderText::renderName() const
219 {
220     return "RenderText";
221 }
222
223 Text* RenderText::textNode() const
224 {
225     return downcast<Text>(RenderObject::node());
226 }
227
228 bool RenderText::isTextFragment() const
229 {
230     return false;
231 }
232
233 bool RenderText::computeUseBackslashAsYenSymbol() const
234 {
235     const RenderStyle& style = this->style();
236     const auto& fontDescription = style.fontDescription();
237     if (style.fontCascade().useBackslashAsYenSymbol())
238         return true;
239     if (fontDescription.isSpecifiedFont())
240         return false;
241     const TextEncoding* encoding = document().decoder() ? &document().decoder()->encoding() : 0;
242     if (encoding && encoding->backslashAsCurrencySymbol() != '\\')
243         return true;
244     return false;
245 }
246
247 void RenderText::styleDidChange(StyleDifference diff, const RenderStyle* oldStyle)
248 {
249     // There is no need to ever schedule repaints from a style change of a text run, since
250     // we already did this for the parent of the text run.
251     // We do have to schedule layouts, though, since a style change can force us to
252     // need to relayout.
253     if (diff == StyleDifferenceLayout) {
254         setNeedsLayoutAndPrefWidthsRecalc();
255         m_knownToHaveNoOverflowAndNoFallbackFonts = false;
256     }
257
258     const RenderStyle& newStyle = style();
259     bool needsResetText = false;
260     if (!oldStyle) {
261         m_useBackslashAsYenSymbol = computeUseBackslashAsYenSymbol();
262         needsResetText = m_useBackslashAsYenSymbol;
263         // It should really be computed in the c'tor, but during construction we don't have parent yet -and RenderText style == parent()->style()
264         m_canUseSimplifiedTextMeasuring = computeCanUseSimplifiedTextMeasuring();
265     } else if (oldStyle->fontCascade().useBackslashAsYenSymbol() != newStyle.fontCascade().useBackslashAsYenSymbol()) {
266         m_useBackslashAsYenSymbol = computeUseBackslashAsYenSymbol();
267         needsResetText = true;
268     }
269
270     ETextTransform oldTransform = oldStyle ? oldStyle->textTransform() : TTNONE;
271     ETextSecurity oldSecurity = oldStyle ? oldStyle->textSecurity() : TSNONE;
272     if (needsResetText || oldTransform != newStyle.textTransform() || oldSecurity != newStyle.textSecurity())
273         RenderText::setText(originalText(), true);
274 }
275
276 void RenderText::removeAndDestroyTextBoxes()
277 {
278     if (!renderTreeBeingDestroyed())
279         m_lineBoxes.removeAllFromParent(*this);
280 #if !ASSERT_WITH_SECURITY_IMPLICATION_DISABLED
281     else
282         m_lineBoxes.invalidateParentChildLists();
283 #endif
284     m_lineBoxes.deleteAll();
285 }
286
287 void RenderText::willBeDestroyed()
288 {
289     secureTextTimers().remove(this);
290
291     removeAndDestroyTextBoxes();
292
293     if (m_originalTextDiffersFromRendered)
294         originalTextMap().remove(this);
295
296     RenderObject::willBeDestroyed();
297 }
298
299 void RenderText::deleteLineBoxesBeforeSimpleLineLayout()
300 {
301     m_lineBoxes.deleteAll();
302 }
303
304 String RenderText::originalText() const
305 {
306     return m_originalTextDiffersFromRendered ? originalTextMap().get(this) : m_text;
307 }
308
309 void RenderText::absoluteRects(Vector<IntRect>& rects, const LayoutPoint& accumulatedOffset) const
310 {
311     if (auto* layout = simpleLineLayout()) {
312         rects.appendVector(SimpleLineLayout::collectAbsoluteRects(*this, *layout, accumulatedOffset));
313         return;
314     }
315     rects.appendVector(m_lineBoxes.absoluteRects(accumulatedOffset));
316 }
317
318 Vector<IntRect> RenderText::absoluteRectsForRange(unsigned start, unsigned end, bool useSelectionHeight, bool* wasFixed) const
319 {
320     const_cast<RenderText&>(*this).ensureLineBoxes();
321
322     // Work around signed/unsigned issues. This function takes unsigneds, and is often passed UINT_MAX
323     // to mean "all the way to the end". InlineTextBox coordinates are unsigneds, so changing this 
324     // function to take ints causes various internal mismatches. But selectionRect takes ints, and 
325     // passing UINT_MAX to it causes trouble. Ideally we'd change selectionRect to take unsigneds, but 
326     // that would cause many ripple effects, so for now we'll just clamp our unsigned parameters to INT_MAX.
327     ASSERT(end == UINT_MAX || end <= INT_MAX);
328     ASSERT(start <= INT_MAX);
329     start = std::min(start, static_cast<unsigned>(INT_MAX));
330     end = std::min(end, static_cast<unsigned>(INT_MAX));
331     
332     return m_lineBoxes.absoluteRectsForRange(*this, start, end, useSelectionHeight, wasFixed);
333 }
334
335 #if PLATFORM(IOS)
336 // This function is similar in spirit to addLineBoxRects, but returns rectangles
337 // which are annotated with additional state which helps the iPhone draw selections in its unique way.
338 // Full annotations are added in this class.
339 void RenderText::collectSelectionRects(Vector<SelectionRect>& rects, unsigned start, unsigned end)
340 {
341     // FIXME: Work around signed/unsigned issues. This function takes unsigneds, and is often passed UINT_MAX
342     // to mean "all the way to the end". InlineTextBox coordinates are unsigneds, so changing this 
343     // function to take ints causes various internal mismatches. But selectionRect takes ints, and 
344     // passing UINT_MAX to it causes trouble. Ideally we'd change selectionRect to take unsigneds, but 
345     // that would cause many ripple effects, so for now we'll just clamp our unsigned parameters to INT_MAX.
346     ASSERT(end == std::numeric_limits<unsigned>::max() || end <= std::numeric_limits<int>::max());
347     ASSERT(start <= std::numeric_limits<int>::max());
348     start = std::min(start, static_cast<unsigned>(std::numeric_limits<int>::max()));
349     end = std::min(end, static_cast<unsigned>(std::numeric_limits<int>::max()));
350
351     for (InlineTextBox* box = firstTextBox(); box; box = box->nextTextBox()) {
352         LayoutRect rect;
353         // Note, box->end() returns the index of the last character, not the index past it.
354         if (start <= box->start() && box->end() < end)
355             rect = box->localSelectionRect(start, end);
356         else {
357             unsigned realEnd = std::min(box->end() + 1, end);
358             rect = box->localSelectionRect(start, realEnd);
359             if (rect.isEmpty())
360                 continue;
361         }
362
363         if (box->root().isFirstAfterPageBreak()) {
364             if (box->isHorizontal())
365                 rect.shiftYEdgeTo(box->root().lineTopWithLeading());
366             else
367                 rect.shiftXEdgeTo(box->root().lineTopWithLeading());
368         }
369
370         RenderBlock* containingBlock = this->containingBlock();
371         // Map rect, extended left to leftOffset, and right to rightOffset, through transforms to get minX and maxX.
372         LogicalSelectionOffsetCaches cache(*containingBlock);
373         LayoutUnit leftOffset = containingBlock->logicalLeftSelectionOffset(*containingBlock, box->logicalTop(), cache);
374         LayoutUnit rightOffset = containingBlock->logicalRightSelectionOffset(*containingBlock, box->logicalTop(), cache);
375         LayoutRect extentsRect = rect;
376         if (box->isHorizontal()) {
377             extentsRect.setX(leftOffset);
378             extentsRect.setWidth(rightOffset - leftOffset);
379         } else {
380             extentsRect.setY(leftOffset);
381             extentsRect.setHeight(rightOffset - leftOffset);
382         }
383         extentsRect = localToAbsoluteQuad(FloatRect(extentsRect)).enclosingBoundingBox();
384         if (!box->isHorizontal())
385             extentsRect = extentsRect.transposedRect();
386         bool isFirstOnLine = !box->previousOnLineExists();
387         bool isLastOnLine = !box->nextOnLineExists();
388         if (containingBlock->isRubyBase() || containingBlock->isRubyText())
389             isLastOnLine = !containingBlock->containingBlock()->inlineBoxWrapper()->nextOnLineExists();
390
391         bool containsStart = box->start() <= start && box->end() + 1 >= start;
392         bool containsEnd = box->start() <= end && box->end() + 1 >= end;
393
394         bool isFixed = false;
395         IntRect absRect = localToAbsoluteQuad(FloatRect(rect), UseTransforms, &isFixed).enclosingBoundingBox();
396         bool boxIsHorizontal = !box->isSVGInlineTextBox() ? box->isHorizontal() : !style().isVerticalWritingMode();
397         // If the containing block is an inline element, we want to check the inlineBoxWrapper orientation
398         // to determine the orientation of the block. In this case we also use the inlineBoxWrapper to
399         // determine if the element is the last on the line.
400         if (containingBlock->inlineBoxWrapper()) {
401             if (containingBlock->inlineBoxWrapper()->isHorizontal() != boxIsHorizontal) {
402                 boxIsHorizontal = containingBlock->inlineBoxWrapper()->isHorizontal();
403                 isLastOnLine = !containingBlock->inlineBoxWrapper()->nextOnLineExists();
404             }
405         }
406
407         rects.append(SelectionRect(absRect, box->direction(), extentsRect.x(), extentsRect.maxX(), extentsRect.maxY(), 0, box->isLineBreak(), isFirstOnLine, isLastOnLine, containsStart, containsEnd, boxIsHorizontal, isFixed, containingBlock->isRubyText(), view().pageNumberForBlockProgressionOffset(absRect.x())));
408     }
409 }
410 #endif
411
412 Vector<FloatQuad> RenderText::absoluteQuadsClippedToEllipsis() const
413 {
414     if (auto* layout = simpleLineLayout()) {
415         ASSERT(style().textOverflow() != TextOverflowEllipsis);
416         return SimpleLineLayout::collectAbsoluteQuads(*this, *layout, nullptr);
417     }
418     return m_lineBoxes.absoluteQuads(*this, nullptr, RenderTextLineBoxes::ClipToEllipsis);
419 }
420
421 void RenderText::absoluteQuads(Vector<FloatQuad>& quads, bool* wasFixed) const
422 {
423     if (auto* layout = simpleLineLayout()) {
424         quads.appendVector(SimpleLineLayout::collectAbsoluteQuads(*this, *layout, wasFixed));
425         return;
426     }
427     quads.appendVector(m_lineBoxes.absoluteQuads(*this, wasFixed, RenderTextLineBoxes::NoClipping));
428 }
429
430 Vector<FloatQuad> RenderText::absoluteQuadsForRange(unsigned start, unsigned end, bool useSelectionHeight, bool* wasFixed) const
431 {
432     // Work around signed/unsigned issues. This function takes unsigneds, and is often passed UINT_MAX
433     // to mean "all the way to the end". InlineTextBox coordinates are unsigneds, so changing this
434     // function to take ints causes various internal mismatches. But selectionRect takes ints, and
435     // passing UINT_MAX to it causes trouble. Ideally we'd change selectionRect to take unsigneds, but
436     // that would cause many ripple effects, so for now we'll just clamp our unsigned parameters to INT_MAX.
437     ASSERT(end == UINT_MAX || end <= INT_MAX);
438     ASSERT(start <= INT_MAX);
439     start = std::min(start, static_cast<unsigned>(INT_MAX));
440     end = std::min(end, static_cast<unsigned>(INT_MAX));
441     if (simpleLineLayout() && !useSelectionHeight)
442         return collectAbsoluteQuadsForRange(*this, start, end, *simpleLineLayout(), wasFixed);
443     const_cast<RenderText&>(*this).ensureLineBoxes();
444     return m_lineBoxes.absoluteQuadsForRange(*this, start, end, useSelectionHeight, wasFixed);
445 }
446
447 Position RenderText::positionForPoint(const LayoutPoint& point)
448 {
449     if (simpleLineLayout() && parent()->firstChild() == parent()->lastChild()) {
450         auto position = Position(textNode(), SimpleLineLayout::textOffsetForPoint(point, *this, *simpleLineLayout()));
451         ASSERT(position == positionForPoint(point, nullptr).deepEquivalent());
452         return position;
453     }
454     return positionForPoint(point, nullptr).deepEquivalent();
455 }
456
457 VisiblePosition RenderText::positionForPoint(const LayoutPoint& point, const RenderRegion*)
458 {
459     ensureLineBoxes();
460     return m_lineBoxes.positionForPoint(*this, point);
461 }
462
463 LayoutRect RenderText::localCaretRect(InlineBox* inlineBox, unsigned caretOffset, LayoutUnit* extraWidthToEndOfLine)
464 {
465     if (!inlineBox)
466         return LayoutRect();
467
468     auto& box = downcast<InlineTextBox>(*inlineBox);
469     float left = box.positionForOffset(caretOffset);
470     return box.root().computeCaretRect(left, caretWidth, extraWidthToEndOfLine);
471 }
472
473 ALWAYS_INLINE float RenderText::widthFromCache(const FontCascade& f, unsigned start, unsigned len, float xPos, HashSet<const Font*>* fallbackFonts, GlyphOverflow* glyphOverflow, const RenderStyle& style) const
474 {
475     if (style.hasTextCombine() && is<RenderCombineText>(*this)) {
476         const RenderCombineText& combineText = downcast<RenderCombineText>(*this);
477         if (combineText.isCombined())
478             return combineText.combinedTextWidth(f);
479     }
480
481     if (f.isFixedPitch() && f.fontDescription().variantSettings().isAllNormal() && m_isAllASCII && (!glyphOverflow || !glyphOverflow->computeBounds)) {
482         float monospaceCharacterWidth = f.spaceWidth();
483         float w = 0;
484         bool isSpace;
485         ASSERT(m_text);
486         StringImpl& text = *m_text.impl();
487         for (unsigned i = start; i < start + len; i++) {
488             char c = text[i];
489             if (c <= ' ') {
490                 if (c == ' ' || c == '\n') {
491                     w += monospaceCharacterWidth;
492                     isSpace = true;
493                 } else if (c == '\t') {
494                     if (style.collapseWhiteSpace()) {
495                         w += monospaceCharacterWidth;
496                         isSpace = true;
497                     } else {
498                         w += f.tabWidth(style.tabSize(), xPos + w);
499                         isSpace = false;
500                     }
501                 } else
502                     isSpace = false;
503             } else {
504                 w += monospaceCharacterWidth;
505                 isSpace = false;
506             }
507             if (isSpace && i > start)
508                 w += f.wordSpacing();
509         }
510         return w;
511     }
512
513     TextRun run = RenderBlock::constructTextRun(*this, start, len, style);
514     run.setCharactersLength(textLength() - start);
515     ASSERT(run.charactersLength() >= run.length());
516
517     run.setCharacterScanForCodePath(!canUseSimpleFontCodePath());
518     run.setTabSize(!style.collapseWhiteSpace(), style.tabSize());
519     run.setXPos(xPos);
520     return f.width(run, fallbackFonts, glyphOverflow);
521 }
522
523 inline bool isHangablePunctuationAtLineStart(UChar c)
524 {
525     return U_GET_GC_MASK(c) & (U_GC_PS_MASK | U_GC_PI_MASK | U_GC_PF_MASK);
526 }
527
528 inline bool isHangablePunctuationAtLineEnd(UChar c)
529 {
530     return U_GET_GC_MASK(c) & (U_GC_PE_MASK | U_GC_PI_MASK | U_GC_PF_MASK);
531 }
532
533 float RenderText::hangablePunctuationStartWidth(unsigned index) const
534 {
535     unsigned len = textLength();
536     if (!len || index >= len)
537         return 0;
538
539     ASSERT(m_text);
540     StringImpl& text = *m_text.impl();
541     
542     if (!isHangablePunctuationAtLineStart(text[index]))
543         return 0;
544
545     const RenderStyle& style = this->style();
546     const FontCascade& font = style.fontCascade();
547         
548     return widthFromCache(font, index, 1, 0, 0, 0, style);
549 }
550
551 float RenderText::hangablePunctuationEndWidth(unsigned index) const
552 {
553     unsigned len = textLength();
554     if (!len || index >= len)
555         return 0;
556     
557     ASSERT(m_text);
558     StringImpl& text = *m_text.impl();
559
560     if (!isHangablePunctuationAtLineEnd(text[index]))
561         return 0;
562     
563     const RenderStyle& style = this->style();
564     const FontCascade& font = style.fontCascade();
565     
566     return widthFromCache(font, index, 1, 0, 0, 0, style);
567 }
568
569 bool RenderText::isHangableStopOrComma(UChar c) const
570 {
571     return c == 0x002C || c == 0x002E || c == 0x060C || c == 0x06D4 || c == 0x3001
572         || c == 0x3002 || c == 0xFF0C || c == 0xFF0E || c == 0xFE50 || c == 0xFE51
573         || c == 0xFE52 || c == 0xFF61 || c == 0xFF64;
574 }
575
576 unsigned RenderText::firstCharacterIndexStrippingSpaces() const
577 {
578     if (!style().collapseWhiteSpace())
579         return 0;
580     
581     ASSERT(m_text);
582     StringImpl& text = *m_text.impl();
583     
584     unsigned i = 0;
585     for ( ; i < textLength(); ++i) {
586         if (text[i] != ' ' && (text[i] != '\n' || style().preserveNewline()) && text[i] != '\t')
587             break;
588     }
589     return i;
590 }
591
592 unsigned RenderText::lastCharacterIndexStrippingSpaces() const
593 {
594     if (!textLength())
595         return 0;
596
597     if (!style().collapseWhiteSpace())
598         return textLength() - 1;
599     
600     ASSERT(m_text);
601     StringImpl& text = *m_text.impl();
602     
603     int i = textLength() - 1;
604     for ( ; i  >= 0; --i) {
605         if (text[i] != ' ' && (text[i] != '\n' || style().preserveNewline()) && text[i] != '\t')
606             break;
607     }
608     return i;
609 }
610
611 void RenderText::trimmedPrefWidths(float leadWidth,
612                                    float& beginMinW, bool& beginWS,
613                                    float& endMinW, bool& endWS,
614                                    bool& hasBreakableChar, bool& hasBreak,
615                                    float& beginMaxW, float& endMaxW,
616                                    float& minW, float& maxW, bool& stripFrontSpaces)
617 {
618     const RenderStyle& style = this->style();
619     bool collapseWhiteSpace = style.collapseWhiteSpace();
620     if (!collapseWhiteSpace)
621         stripFrontSpaces = false;
622
623     if (m_hasTab || preferredLogicalWidthsDirty())
624         computePreferredLogicalWidths(leadWidth);
625
626     beginWS = !stripFrontSpaces && m_hasBeginWS;
627     endWS = m_hasEndWS;
628
629     unsigned len = textLength();
630
631     if (!len || (stripFrontSpaces && text()->containsOnlyWhitespace())) {
632         beginMinW = 0;
633         endMinW = 0;
634         beginMaxW = 0;
635         endMaxW = 0;
636         minW = 0;
637         maxW = 0;
638         hasBreak = false;
639         return;
640     }
641
642     minW = m_minWidth;
643     maxW = m_maxWidth;
644
645     beginMinW = m_beginMinWidth;
646     endMinW = m_endMinWidth;
647
648     hasBreakableChar = m_hasBreakableChar;
649     hasBreak = m_hasBreak;
650
651     ASSERT(m_text);
652     StringImpl& text = *m_text.impl();
653     if (text[0] == space || (text[0] == newlineCharacter && !style.preserveNewline()) || text[0] == '\t') {
654         const FontCascade& font = style.fontCascade(); // FIXME: This ignores first-line.
655         if (stripFrontSpaces) {
656             float spaceWidth = font.width(RenderBlock::constructTextRun(&space, 1, style));
657             maxW -= spaceWidth;
658         } else
659             maxW += font.wordSpacing();
660     }
661
662     stripFrontSpaces = collapseWhiteSpace && m_hasEndWS;
663
664     if (!style.autoWrap() || minW > maxW)
665         minW = maxW;
666
667     // Compute our max widths by scanning the string for newlines.
668     if (hasBreak) {
669         const FontCascade& f = style.fontCascade(); // FIXME: This ignores first-line.
670         bool firstLine = true;
671         beginMaxW = maxW;
672         endMaxW = maxW;
673         for (unsigned i = 0; i < len; i++) {
674             unsigned linelen = 0;
675             while (i + linelen < len && text[i + linelen] != '\n')
676                 linelen++;
677
678             if (linelen) {
679                 endMaxW = widthFromCache(f, i, linelen, leadWidth + endMaxW, 0, 0, style);
680                 if (firstLine) {
681                     firstLine = false;
682                     leadWidth = 0;
683                     beginMaxW = endMaxW;
684                 }
685                 i += linelen;
686             } else if (firstLine) {
687                 beginMaxW = 0;
688                 firstLine = false;
689                 leadWidth = 0;
690             }
691
692             if (i == len - 1)
693                 // A <pre> run that ends with a newline, as in, e.g.,
694                 // <pre>Some text\n\n<span>More text</pre>
695                 endMaxW = 0;
696         }
697     }
698 }
699
700 static inline bool isSpaceAccordingToStyle(UChar c, const RenderStyle& style)
701 {
702     return c == ' ' || (c == noBreakSpace && style.nbspMode() == SPACE);
703 }
704
705 float RenderText::minLogicalWidth() const
706 {
707     if (preferredLogicalWidthsDirty())
708         const_cast<RenderText*>(this)->computePreferredLogicalWidths(0);
709         
710     return m_minWidth;
711 }
712
713 float RenderText::maxLogicalWidth() const
714 {
715     if (preferredLogicalWidthsDirty())
716         const_cast<RenderText*>(this)->computePreferredLogicalWidths(0);
717         
718     return m_maxWidth;
719 }
720
721 LineBreakIteratorMode mapLineBreakToIteratorMode(LineBreak lineBreak)
722 {
723     switch (lineBreak) {
724     case LineBreakAuto:
725     case LineBreakAfterWhiteSpace:
726         return LineBreakIteratorMode::Default;
727     case LineBreakLoose:
728         return LineBreakIteratorMode::Loose;
729     case LineBreakNormal:
730         return LineBreakIteratorMode::Normal;
731     case LineBreakStrict:
732         return LineBreakIteratorMode::Strict;
733     }
734     ASSERT_NOT_REACHED();
735     return LineBreakIteratorMode::Default;
736 }
737
738 void RenderText::computePreferredLogicalWidths(float leadWidth)
739 {
740     HashSet<const Font*> fallbackFonts;
741     GlyphOverflow glyphOverflow;
742     computePreferredLogicalWidths(leadWidth, fallbackFonts, glyphOverflow);
743     if (fallbackFonts.isEmpty() && !glyphOverflow.left && !glyphOverflow.right && !glyphOverflow.top && !glyphOverflow.bottom)
744         m_knownToHaveNoOverflowAndNoFallbackFonts = true;
745 }
746
747 static inline float hyphenWidth(RenderText& renderer, const FontCascade& font)
748 {
749     const RenderStyle& style = renderer.style();
750     auto textRun = RenderBlock::constructTextRun(style.hyphenString().string(), style);
751     return font.width(textRun);
752 }
753
754 static float maxWordFragmentWidth(RenderText& renderer, const RenderStyle& style, const FontCascade& font, StringView word, unsigned minimumPrefixLength, unsigned minimumSuffixLength, unsigned& suffixStart, HashSet<const Font*>& fallbackFonts, GlyphOverflow& glyphOverflow)
755 {
756     suffixStart = 0;
757     if (word.length() <= minimumSuffixLength)
758         return 0;
759
760     Vector<int, 8> hyphenLocations;
761     ASSERT(word.length() >= minimumSuffixLength);
762     unsigned hyphenLocation = word.length() - minimumSuffixLength;
763     while ((hyphenLocation = lastHyphenLocation(word, hyphenLocation, style.locale())) >= std::max(minimumPrefixLength, 1U))
764         hyphenLocations.append(hyphenLocation);
765
766     if (hyphenLocations.isEmpty())
767         return 0;
768
769     hyphenLocations.reverse();
770
771     // FIXME: Breaking the string at these places in the middle of words is completely broken with complex text.
772     float minimumFragmentWidthToConsider = font.pixelSize() * 5 / 4 + hyphenWidth(renderer, font);
773     float maxFragmentWidth = 0;
774     for (size_t k = 0; k < hyphenLocations.size(); ++k) {
775         int fragmentLength = hyphenLocations[k] - suffixStart;
776         StringBuilder fragmentWithHyphen;
777         fragmentWithHyphen.append(word.substring(suffixStart, fragmentLength));
778         fragmentWithHyphen.append(style.hyphenString());
779
780         TextRun run = RenderBlock::constructTextRun(fragmentWithHyphen.toString(), style);
781         run.setCharactersLength(fragmentWithHyphen.length());
782         run.setCharacterScanForCodePath(!renderer.canUseSimpleFontCodePath());
783         float fragmentWidth = font.width(run, &fallbackFonts, &glyphOverflow);
784
785         // Narrow prefixes are ignored. See tryHyphenating in RenderBlockLineLayout.cpp.
786         if (fragmentWidth <= minimumFragmentWidthToConsider)
787             continue;
788
789         suffixStart += fragmentLength;
790         maxFragmentWidth = std::max(maxFragmentWidth, fragmentWidth);
791     }
792
793     return maxFragmentWidth;
794 }
795
796 void RenderText::computePreferredLogicalWidths(float leadWidth, HashSet<const Font*>& fallbackFonts, GlyphOverflow& glyphOverflow)
797 {
798     ASSERT(m_hasTab || preferredLogicalWidthsDirty() || !m_knownToHaveNoOverflowAndNoFallbackFonts);
799
800     m_minWidth = 0;
801     m_beginMinWidth = 0;
802     m_endMinWidth = 0;
803     m_maxWidth = 0;
804
805     float currMaxWidth = 0;
806     m_hasBreakableChar = false;
807     m_hasBreak = false;
808     m_hasTab = false;
809     m_hasBeginWS = false;
810     m_hasEndWS = false;
811
812     const RenderStyle& style = this->style();
813     const FontCascade& font = style.fontCascade(); // FIXME: This ignores first-line.
814     float wordSpacing = font.wordSpacing();
815     unsigned len = textLength();
816     auto iteratorMode = mapLineBreakToIteratorMode(style.lineBreak());
817     LazyLineBreakIterator breakIterator(m_text, style.locale(), iteratorMode);
818     bool needsWordSpacing = false;
819     bool ignoringSpaces = false;
820     bool isSpace = false;
821     bool firstWord = true;
822     bool firstLine = true;
823     std::optional<unsigned> nextBreakable;
824     unsigned lastWordBoundary = 0;
825
826     WordTrailingSpace wordTrailingSpace(style);
827     // If automatic hyphenation is allowed, we keep track of the width of the widest word (or word
828     // fragment) encountered so far, and only try hyphenating words that are wider.
829     float maxWordWidth = std::numeric_limits<float>::max();
830     unsigned minimumPrefixLength = 0;
831     unsigned minimumSuffixLength = 0;
832     if (style.hyphens() == HyphensAuto && canHyphenate(style.locale())) {
833         maxWordWidth = 0;
834
835         // Map 'hyphenate-limit-{before,after}: auto;' to 2.
836         auto before = style.hyphenationLimitBefore();
837         minimumPrefixLength = before < 0 ? 2 : before;
838
839         auto after = style.hyphenationLimitAfter();
840         minimumSuffixLength = after < 0 ? 2 : after;
841     }
842
843     std::optional<int> firstGlyphLeftOverflow;
844
845     bool breakNBSP = style.autoWrap() && style.nbspMode() == SPACE;
846     
847     // Note the deliberate omission of word-wrap and overflow-wrap from this breakAll check. Those
848     // do not affect minimum preferred sizes. Note that break-word is a non-standard value for
849     // word-break, but we support it as though it means break-all.
850     bool breakAll = (style.wordBreak() == BreakAllWordBreak || style.wordBreak() == BreakWordBreak) && style.autoWrap();
851     bool keepAllWords = style.wordBreak() == KeepAllWordBreak;
852     bool canUseLineBreakShortcut = iteratorMode == LineBreakIteratorMode::Default;
853
854     for (unsigned i = 0; i < len; i++) {
855         UChar c = uncheckedCharacterAt(i);
856
857         bool previousCharacterIsSpace = isSpace;
858
859         bool isNewline = false;
860         if (c == '\n') {
861             if (style.preserveNewline()) {
862                 m_hasBreak = true;
863                 isNewline = true;
864                 isSpace = false;
865             } else
866                 isSpace = true;
867         } else if (c == '\t') {
868             if (!style.collapseWhiteSpace()) {
869                 m_hasTab = true;
870                 isSpace = false;
871             } else
872                 isSpace = true;
873         } else
874             isSpace = c == ' ';
875
876         if ((isSpace || isNewline) && !i)
877             m_hasBeginWS = true;
878         if ((isSpace || isNewline) && i == len - 1)
879             m_hasEndWS = true;
880
881         ignoringSpaces |= style.collapseWhiteSpace() && previousCharacterIsSpace && isSpace;
882         ignoringSpaces &= isSpace;
883
884         // Ignore spaces and soft hyphens
885         if (ignoringSpaces) {
886             ASSERT(lastWordBoundary == i);
887             lastWordBoundary++;
888             continue;
889         } else if (c == softHyphen && style.hyphens() != HyphensNone) {
890             ASSERT(i >= lastWordBoundary);
891             currMaxWidth += widthFromCache(font, lastWordBoundary, i - lastWordBoundary, leadWidth + currMaxWidth, &fallbackFonts, &glyphOverflow, style);
892             if (!firstGlyphLeftOverflow)
893                 firstGlyphLeftOverflow = glyphOverflow.left;
894             lastWordBoundary = i + 1;
895             continue;
896         }
897
898         bool hasBreak = breakAll || isBreakable(breakIterator, i, nextBreakable, breakNBSP, canUseLineBreakShortcut, keepAllWords);
899         bool betweenWords = true;
900         unsigned j = i;
901         while (c != '\n' && !isSpaceAccordingToStyle(c, style) && c != '\t' && (c != softHyphen || style.hyphens() == HyphensNone)) {
902             j++;
903             if (j == len)
904                 break;
905             c = uncheckedCharacterAt(j);
906             if (isBreakable(breakIterator, j, nextBreakable, breakNBSP, canUseLineBreakShortcut, keepAllWords) && characterAt(j - 1) != softHyphen)
907                 break;
908             if (breakAll) {
909                 betweenWords = false;
910                 break;
911             }
912         }
913
914         unsigned wordLen = j - i;
915         if (wordLen) {
916             float currMinWidth = 0;
917             bool isSpace = (j < len) && isSpaceAccordingToStyle(c, style);
918             float w;
919             std::optional<float> wordTrailingSpaceWidth;
920             if (isSpace)
921                 wordTrailingSpaceWidth = wordTrailingSpace.width(fallbackFonts);
922             if (wordTrailingSpaceWidth)
923                 w = widthFromCache(font, i, wordLen + 1, leadWidth + currMaxWidth, &fallbackFonts, &glyphOverflow, style) - wordTrailingSpaceWidth.value();
924             else {
925                 w = widthFromCache(font, i, wordLen, leadWidth + currMaxWidth, &fallbackFonts, &glyphOverflow, style);
926                 if (c == softHyphen && style.hyphens() != HyphensNone)
927                     currMinWidth = hyphenWidth(*this, font);
928             }
929
930             if (w > maxWordWidth) {
931                 unsigned suffixStart;
932                 float maxFragmentWidth = maxWordFragmentWidth(*this, style, font, StringView(m_text).substring(i, wordLen), minimumPrefixLength, minimumSuffixLength, suffixStart, fallbackFonts, glyphOverflow);
933
934                 if (suffixStart) {
935                     float suffixWidth;
936                     std::optional<float> wordTrailingSpaceWidth;
937                     if (isSpace)
938                         wordTrailingSpaceWidth = wordTrailingSpace.width(fallbackFonts);
939                     if (wordTrailingSpaceWidth)
940                         suffixWidth = widthFromCache(font, i + suffixStart, wordLen - suffixStart + 1, leadWidth + currMaxWidth, 0, 0, style) - wordTrailingSpaceWidth.value();
941                     else
942                         suffixWidth = widthFromCache(font, i + suffixStart, wordLen - suffixStart, leadWidth + currMaxWidth, 0, 0, style);
943
944                     maxFragmentWidth = std::max(maxFragmentWidth, suffixWidth);
945
946                     currMinWidth += maxFragmentWidth - w;
947                     maxWordWidth = std::max(maxWordWidth, maxFragmentWidth);
948                 } else
949                     maxWordWidth = w;
950             }
951
952             if (!firstGlyphLeftOverflow)
953                 firstGlyphLeftOverflow = glyphOverflow.left;
954             currMinWidth += w;
955             if (betweenWords) {
956                 if (lastWordBoundary == i)
957                     currMaxWidth += w;
958                 else {
959                     ASSERT(j >= lastWordBoundary);
960                     currMaxWidth += widthFromCache(font, lastWordBoundary, j - lastWordBoundary, leadWidth + currMaxWidth, &fallbackFonts, &glyphOverflow, style);
961                 }
962                 lastWordBoundary = j;
963             }
964
965             bool isCollapsibleWhiteSpace = (j < len) && style.isCollapsibleWhiteSpace(c);
966             if (j < len && style.autoWrap())
967                 m_hasBreakableChar = true;
968
969             // Add in wordSpacing to our currMaxWidth, but not if this is the last word on a line or the
970             // last word in the run.
971             if ((isSpace || isCollapsibleWhiteSpace) && !containsOnlyWhitespace(j, len-j))
972                 currMaxWidth += wordSpacing;
973
974             if (firstWord) {
975                 firstWord = false;
976                 // If the first character in the run is breakable, then we consider ourselves to have a beginning
977                 // minimum width of 0, since a break could occur right before our run starts, preventing us from ever
978                 // being appended to a previous text run when considering the total minimum width of the containing block.
979                 if (hasBreak)
980                     m_hasBreakableChar = true;
981                 m_beginMinWidth = hasBreak ? 0 : currMinWidth;
982             }
983             m_endMinWidth = currMinWidth;
984
985             m_minWidth = std::max(currMinWidth, m_minWidth);
986
987             i += wordLen - 1;
988         } else {
989             // Nowrap can never be broken, so don't bother setting the
990             // breakable character boolean. Pre can only be broken if we encounter a newline.
991             if (style.autoWrap() || isNewline)
992                 m_hasBreakableChar = true;
993
994             if (isNewline) { // Only set if preserveNewline was true and we saw a newline.
995                 if (firstLine) {
996                     firstLine = false;
997                     leadWidth = 0;
998                     if (!style.autoWrap())
999                         m_beginMinWidth = currMaxWidth;
1000                 }
1001
1002                 if (currMaxWidth > m_maxWidth)
1003                     m_maxWidth = currMaxWidth;
1004                 currMaxWidth = 0;
1005             } else {
1006                 TextRun run = RenderBlock::constructTextRun(*this, i, 1, style);
1007                 run.setCharactersLength(len - i);
1008                 ASSERT(run.charactersLength() >= run.length());
1009                 run.setTabSize(!style.collapseWhiteSpace(), style.tabSize());
1010                 run.setXPos(leadWidth + currMaxWidth);
1011
1012                 currMaxWidth += font.width(run, &fallbackFonts);
1013                 glyphOverflow.right = 0;
1014                 needsWordSpacing = isSpace && !previousCharacterIsSpace && i == len - 1;
1015             }
1016             ASSERT(lastWordBoundary == i);
1017             lastWordBoundary++;
1018         }
1019     }
1020
1021     glyphOverflow.left = firstGlyphLeftOverflow.value_or(glyphOverflow.left);
1022
1023     if ((needsWordSpacing && len > 1) || (ignoringSpaces && !firstWord))
1024         currMaxWidth += wordSpacing;
1025
1026     m_maxWidth = std::max(currMaxWidth, m_maxWidth);
1027
1028     if (!style.autoWrap())
1029         m_minWidth = m_maxWidth;
1030
1031     if (style.whiteSpace() == PRE) {
1032         if (firstLine)
1033             m_beginMinWidth = m_maxWidth;
1034         m_endMinWidth = currMaxWidth;
1035     }
1036
1037     setPreferredLogicalWidthsDirty(false);
1038 }
1039
1040 bool RenderText::isAllCollapsibleWhitespace() const
1041 {
1042     const RenderStyle& style = this->style();
1043     unsigned length = textLength();
1044     if (is8Bit()) {
1045         for (unsigned i = 0; i < length; ++i) {
1046             if (!style.isCollapsibleWhiteSpace(characters8()[i]))
1047                 return false;
1048         }
1049         return true;
1050     }
1051     for (unsigned i = 0; i < length; ++i) {
1052         if (!style.isCollapsibleWhiteSpace(characters16()[i]))
1053             return false;
1054     }
1055     return true;
1056 }
1057     
1058 bool RenderText::containsOnlyWhitespace(unsigned from, unsigned len) const
1059 {
1060     ASSERT(m_text);
1061     StringImpl& text = *m_text.impl();
1062     unsigned currPos;
1063     for (currPos = from;
1064          currPos < from + len && (text[currPos] == '\n' || text[currPos] == ' ' || text[currPos] == '\t');
1065          currPos++) { }
1066     return currPos >= (from + len);
1067 }
1068
1069 Vector<std::pair<unsigned, unsigned>> RenderText::draggedContentRangesBetweenOffsets(unsigned startOffset, unsigned endOffset) const
1070 {
1071     if (!textNode())
1072         return { };
1073
1074     auto markers = document().markers().markersFor(textNode(), DocumentMarker::DraggedContent);
1075     if (markers.isEmpty())
1076         return { };
1077
1078     Vector<std::pair<unsigned, unsigned>> draggedContentRanges;
1079     for (auto* marker : markers) {
1080         unsigned markerStart = std::max(marker->startOffset(), startOffset);
1081         unsigned markerEnd = std::min(marker->endOffset(), endOffset);
1082         if (markerStart >= markerEnd || markerStart > endOffset || markerEnd < startOffset)
1083             continue;
1084
1085         std::pair<unsigned, unsigned> draggedContentRange;
1086         draggedContentRange.first = markerStart;
1087         draggedContentRange.second = markerEnd;
1088         draggedContentRanges.append(draggedContentRange);
1089     }
1090     return draggedContentRanges;
1091 }
1092
1093 IntPoint RenderText::firstRunLocation() const
1094 {
1095     if (auto* layout = simpleLineLayout())
1096         return SimpleLineLayout::computeFirstRunLocation(*this, *layout);
1097
1098     return m_lineBoxes.firstRunLocation();
1099 }
1100
1101 void RenderText::setSelectionState(SelectionState state)
1102 {
1103     if (state != SelectionNone)
1104         ensureLineBoxes();
1105
1106     RenderObject::setSelectionState(state);
1107
1108     if (canUpdateSelectionOnRootLineBoxes())
1109         m_lineBoxes.setSelectionState(*this, state);
1110
1111     // The containing block can be null in case of an orphaned tree.
1112     RenderBlock* containingBlock = this->containingBlock();
1113     if (containingBlock && !containingBlock->isRenderView())
1114         containingBlock->setSelectionState(state);
1115 }
1116
1117 void RenderText::setTextWithOffset(const String& text, unsigned offset, unsigned len, bool force)
1118 {
1119     if (!force && m_text == text)
1120         return;
1121
1122     int delta = text.length() - textLength();
1123     unsigned end = len ? offset + len - 1 : offset;
1124
1125     m_linesDirty = simpleLineLayout() || m_lineBoxes.dirtyRange(*this, offset, end, delta);
1126
1127     setText(text, force || m_linesDirty);
1128 }
1129
1130 static inline bool isInlineFlowOrEmptyText(const RenderObject& renderer)
1131 {
1132     if (is<RenderInline>(renderer))
1133         return true;
1134     if (!is<RenderText>(renderer))
1135         return false;
1136     StringImpl* text = downcast<RenderText>(renderer).text();
1137     if (!text)
1138         return true;
1139     return !text->length();
1140 }
1141
1142 UChar RenderText::previousCharacter() const
1143 {
1144     // find previous text renderer if one exists
1145     const RenderObject* previousText = this;
1146     while ((previousText = previousText->previousInPreOrder()))
1147         if (!isInlineFlowOrEmptyText(*previousText))
1148             break;
1149     UChar prev = ' ';
1150     if (is<RenderText>(previousText)) {
1151         if (StringImpl* previousString = downcast<RenderText>(*previousText).text())
1152             prev = (*previousString)[previousString->length() - 1];
1153     }
1154     return prev;
1155 }
1156
1157 LayoutUnit RenderText::topOfFirstText() const
1158 {
1159     return firstTextBox()->root().lineTop();
1160 }
1161
1162 void applyTextTransform(const RenderStyle& style, String& text, UChar previousCharacter)
1163 {
1164     switch (style.textTransform()) {
1165     case TTNONE:
1166         break;
1167     case CAPITALIZE:
1168         makeCapitalized(&text, previousCharacter);
1169         break;
1170     case UPPERCASE:
1171         text = text.convertToUppercaseWithLocale(style.locale());
1172         break;
1173     case LOWERCASE:
1174         text = text.convertToLowercaseWithLocale(style.locale());
1175         break;
1176     }
1177 }
1178
1179 void RenderText::setRenderedText(const String& text)
1180 {
1181     ASSERT(!text.isNull());
1182
1183     String originalText = this->originalText();
1184
1185     m_text = text;
1186
1187     if (m_useBackslashAsYenSymbol)
1188         m_text.replace('\\', yenSign);
1189
1190     ASSERT(m_text);
1191
1192     applyTextTransform(style(), m_text, previousCharacter());
1193
1194     switch (style().textSecurity()) {
1195     case TSNONE:
1196         break;
1197 #if !PLATFORM(IOS)
1198     // We use the same characters here as for list markers.
1199     // See the listMarkerText function in RenderListMarker.cpp.
1200     case TSCIRCLE:
1201         secureText(whiteBullet);
1202         break;
1203     case TSDISC:
1204         secureText(bullet);
1205         break;
1206     case TSSQUARE:
1207         secureText(blackSquare);
1208         break;
1209 #else
1210     // FIXME: Why this quirk on iOS?
1211     case TSCIRCLE:
1212     case TSDISC:
1213     case TSSQUARE:
1214         secureText(blackCircle);
1215         break;
1216 #endif
1217     }
1218
1219     ASSERT(!m_text.isNull());
1220
1221     m_isAllASCII = m_text.containsOnlyASCII();
1222     m_canUseSimpleFontCodePath = computeCanUseSimpleFontCodePath();
1223     m_canUseSimplifiedTextMeasuring = computeCanUseSimplifiedTextMeasuring();
1224     
1225     if (m_text != originalText) {
1226         originalTextMap().set(this, originalText);
1227         m_originalTextDiffersFromRendered = true;
1228     } else if (m_originalTextDiffersFromRendered) {
1229         originalTextMap().remove(this);
1230         m_originalTextDiffersFromRendered = false;
1231     }
1232 }
1233
1234 void RenderText::secureText(UChar maskingCharacter)
1235 {
1236     // This hides the text by replacing all the characters with the masking character.
1237     // Offsets within the hidden text have to match offsets within the original text
1238     // to handle things like carets and selection, so this won't work right if any
1239     // of the characters are surrogate pairs or combining marks. Thus, this function
1240     // does not attempt to handle either of those.
1241
1242     unsigned length = textLength();
1243     if (!length)
1244         return;
1245
1246     UChar characterToReveal = 0;
1247     unsigned revealedCharactersOffset = 0;
1248
1249     if (SecureTextTimer* timer = secureTextTimers().get(this)) {
1250         // We take the offset out of the timer to make this one-shot. We count on this being called only once.
1251         // If it's called a second time we assume the text is different and a character should not be revealed.
1252         revealedCharactersOffset = timer->takeOffsetAfterLastTypedCharacter();
1253         if (revealedCharactersOffset && revealedCharactersOffset <= length)
1254             characterToReveal = m_text[--revealedCharactersOffset];
1255     }
1256
1257     UChar* characters;
1258     m_text = String::createUninitialized(length, characters);
1259
1260     for (unsigned i = 0; i < length; ++i)
1261         characters[i] = maskingCharacter;
1262     if (characterToReveal)
1263         characters[revealedCharactersOffset] = characterToReveal;
1264 }
1265
1266 bool RenderText::computeCanUseSimplifiedTextMeasuring() const
1267 {
1268     if (!m_canUseSimpleFontCodePath)
1269         return false;
1270     
1271     auto& font = style().fontCascade();
1272     if (font.wordSpacing() || font.letterSpacing())
1273         return false;
1274
1275     // Additional check on the font codepath.
1276     TextRun run(m_text);
1277     run.setCharacterScanForCodePath(false);
1278     if (font.codePath(run) != FontCascade::Simple)
1279         return false;
1280
1281     auto whitespaceIsCollapsed = style().collapseWhiteSpace();
1282     for (unsigned i = 0; i < m_text.length(); ++i) {
1283         if ((!whitespaceIsCollapsed && m_text[i] == '\t') || m_text[i] == noBreakSpace || m_text[i] >= HiraganaLetterSmallA)
1284             return false;
1285     }
1286     return true;
1287 }
1288
1289 void RenderText::setText(const String& text, bool force)
1290 {
1291     ASSERT(!text.isNull());
1292
1293     if (!force && text == originalText())
1294         return;
1295
1296     m_text = text;
1297     if (m_originalTextDiffersFromRendered) {
1298         originalTextMap().remove(this);
1299         m_originalTextDiffersFromRendered = false;
1300     }
1301
1302     setRenderedText(text);
1303
1304     setNeedsLayoutAndPrefWidthsRecalc();
1305     m_knownToHaveNoOverflowAndNoFallbackFonts = false;
1306
1307     if (is<RenderBlockFlow>(*parent()))
1308         downcast<RenderBlockFlow>(*parent()).invalidateLineLayoutPath();
1309     
1310     if (AXObjectCache* cache = document().existingAXObjectCache())
1311         cache->deferTextChangedIfNeeded(textNode());
1312 }
1313
1314 String RenderText::textWithoutConvertingBackslashToYenSymbol() const
1315 {
1316     if (!m_useBackslashAsYenSymbol || style().textSecurity() != TSNONE)
1317         return text();
1318
1319     String text = originalText();
1320     applyTextTransform(style(), text, previousCharacter());
1321     return text;
1322 }
1323
1324 void RenderText::dirtyLineBoxes(bool fullLayout)
1325 {
1326     if (fullLayout)
1327         m_lineBoxes.deleteAll();
1328     else if (!m_linesDirty)
1329         m_lineBoxes.dirtyAll();
1330     m_linesDirty = false;
1331 }
1332
1333 std::unique_ptr<InlineTextBox> RenderText::createTextBox()
1334 {
1335     return std::make_unique<InlineTextBox>(*this);
1336 }
1337
1338 void RenderText::positionLineBox(InlineTextBox& textBox)
1339 {
1340     if (!textBox.len())
1341         return;
1342     m_containsReversedText |= !textBox.isLeftToRightDirection();
1343 }
1344
1345 void RenderText::ensureLineBoxes()
1346 {
1347     if (!is<RenderBlockFlow>(*parent()))
1348         return;
1349     downcast<RenderBlockFlow>(*parent()).ensureLineBoxes();
1350 }
1351
1352 const SimpleLineLayout::Layout* RenderText::simpleLineLayout() const
1353 {
1354     if (!is<RenderBlockFlow>(*parent()))
1355         return nullptr;
1356     return downcast<RenderBlockFlow>(*parent()).simpleLineLayout();
1357 }
1358
1359 float RenderText::width(unsigned from, unsigned len, float xPos, bool firstLine, HashSet<const Font*>* fallbackFonts, GlyphOverflow* glyphOverflow) const
1360 {
1361     if (from >= textLength())
1362         return 0;
1363
1364     if (from + len > textLength())
1365         len = textLength() - from;
1366
1367     const RenderStyle& lineStyle = firstLine ? firstLineStyle() : style();
1368     return width(from, len, lineStyle.fontCascade(), xPos, fallbackFonts, glyphOverflow);
1369 }
1370
1371 float RenderText::width(unsigned from, unsigned len, const FontCascade& f, float xPos, HashSet<const Font*>* fallbackFonts, GlyphOverflow* glyphOverflow) const
1372 {
1373     ASSERT(from + len <= textLength());
1374     if (!textLength())
1375         return 0;
1376
1377     const RenderStyle& style = this->style();
1378     float w;
1379     if (&f == &style.fontCascade()) {
1380         if (!style.preserveNewline() && !from && len == textLength() && (!glyphOverflow || !glyphOverflow->computeBounds)) {
1381             if (fallbackFonts) {
1382                 ASSERT(glyphOverflow);
1383                 if (preferredLogicalWidthsDirty() || !m_knownToHaveNoOverflowAndNoFallbackFonts) {
1384                     const_cast<RenderText*>(this)->computePreferredLogicalWidths(0, *fallbackFonts, *glyphOverflow);
1385                     if (fallbackFonts->isEmpty() && !glyphOverflow->left && !glyphOverflow->right && !glyphOverflow->top && !glyphOverflow->bottom)
1386                         m_knownToHaveNoOverflowAndNoFallbackFonts = true;
1387                 }
1388                 w = m_maxWidth;
1389             } else
1390                 w = maxLogicalWidth();
1391         } else
1392             w = widthFromCache(f, from, len, xPos, fallbackFonts, glyphOverflow, style);
1393     } else {
1394         TextRun run = RenderBlock::constructTextRun(*this, from, len, style);
1395         run.setCharactersLength(textLength() - from);
1396         ASSERT(run.charactersLength() >= run.length());
1397
1398         run.setCharacterScanForCodePath(!canUseSimpleFontCodePath());
1399         run.setTabSize(!style.collapseWhiteSpace(), style.tabSize());
1400         run.setXPos(xPos);
1401         w = f.width(run, fallbackFonts, glyphOverflow);
1402     }
1403
1404     return w;
1405 }
1406
1407 IntRect RenderText::linesBoundingBox() const
1408 {
1409     if (auto* layout = simpleLineLayout())
1410         return SimpleLineLayout::computeBoundingBox(*this, *layout);
1411
1412     return m_lineBoxes.boundingBox(*this);
1413 }
1414
1415 LayoutRect RenderText::linesVisualOverflowBoundingBox() const
1416 {
1417     ASSERT(!simpleLineLayout());
1418     return m_lineBoxes.visualOverflowBoundingBox(*this);
1419 }
1420
1421 LayoutRect RenderText::clippedOverflowRectForRepaint(const RenderLayerModelObject* repaintContainer) const
1422 {
1423     RenderObject* rendererToRepaint = containingBlock();
1424
1425     // Do not cross self-painting layer boundaries.
1426     RenderObject& enclosingLayerRenderer = enclosingLayer()->renderer();
1427     if (&enclosingLayerRenderer != rendererToRepaint && !rendererToRepaint->isDescendantOf(&enclosingLayerRenderer))
1428         rendererToRepaint = &enclosingLayerRenderer;
1429
1430     // The renderer we chose to repaint may be an ancestor of repaintContainer, but we need to do a repaintContainer-relative repaint.
1431     if (repaintContainer && repaintContainer != rendererToRepaint && !rendererToRepaint->isDescendantOf(repaintContainer))
1432         return repaintContainer->clippedOverflowRectForRepaint(repaintContainer);
1433
1434     return rendererToRepaint->clippedOverflowRectForRepaint(repaintContainer);
1435 }
1436
1437 LayoutRect RenderText::collectSelectionRectsForLineBoxes(const RenderLayerModelObject* repaintContainer, bool clipToVisibleContent, Vector<LayoutRect>* rects)
1438 {
1439     ASSERT(!needsLayout());
1440     ASSERT(!simpleLineLayout());
1441
1442     if (selectionState() == SelectionNone)
1443         return LayoutRect();
1444     if (!containingBlock())
1445         return LayoutRect();
1446
1447     // Now calculate startPos and endPos for painting selection.
1448     // We include a selection while endPos > 0
1449     unsigned startPos, endPos;
1450     if (selectionState() == SelectionInside) {
1451         // We are fully selected.
1452         startPos = 0;
1453         endPos = textLength();
1454     } else {
1455         selectionStartEnd(startPos, endPos);
1456         if (selectionState() == SelectionStart)
1457             endPos = textLength();
1458         else if (selectionState() == SelectionEnd)
1459             startPos = 0;
1460     }
1461
1462     if (startPos == endPos)
1463         return IntRect();
1464
1465     LayoutRect resultRect;
1466     if (!rects)
1467         resultRect = m_lineBoxes.selectionRectForRange(startPos, endPos);
1468     else {
1469         m_lineBoxes.collectSelectionRectsForRange(startPos, endPos, *rects);
1470         for (auto& rect : *rects) {
1471             resultRect.unite(rect);
1472             rect = localToContainerQuad(FloatRect(rect), repaintContainer).enclosingBoundingBox();
1473         }
1474     }
1475
1476     if (clipToVisibleContent)
1477         return computeRectForRepaint(resultRect, repaintContainer);
1478     return localToContainerQuad(FloatRect(resultRect), repaintContainer).enclosingBoundingBox();
1479 }
1480
1481 LayoutRect RenderText::collectSelectionRectsForLineBoxes(const RenderLayerModelObject* repaintContainer, bool clipToVisibleContent, Vector<LayoutRect>& rects)
1482 {
1483     return collectSelectionRectsForLineBoxes(repaintContainer, clipToVisibleContent, &rects);
1484 }
1485
1486 LayoutRect RenderText::selectionRectForRepaint(const RenderLayerModelObject* repaintContainer, bool clipToVisibleContent)
1487 {
1488     return collectSelectionRectsForLineBoxes(repaintContainer, clipToVisibleContent, nullptr);
1489 }
1490
1491 int RenderText::caretMinOffset() const
1492 {
1493     if (auto* layout = simpleLineLayout())
1494         return SimpleLineLayout::findCaretMinimumOffset(*this, *layout);
1495     return m_lineBoxes.caretMinOffset();
1496 }
1497
1498 int RenderText::caretMaxOffset() const
1499 {
1500     if (auto* layout = simpleLineLayout())
1501         return SimpleLineLayout::findCaretMaximumOffset(*this, *layout);
1502     return m_lineBoxes.caretMaxOffset(*this);
1503 }
1504
1505 unsigned RenderText::countRenderedCharacterOffsetsUntil(unsigned offset) const
1506 {
1507     ASSERT(!simpleLineLayout());
1508     return m_lineBoxes.countCharacterOffsetsUntil(offset);
1509 }
1510
1511 bool RenderText::containsRenderedCharacterOffset(unsigned offset) const
1512 {
1513     ASSERT(!simpleLineLayout());
1514     return m_lineBoxes.containsOffset(*this, offset, RenderTextLineBoxes::CharacterOffset);
1515 }
1516
1517 bool RenderText::containsCaretOffset(unsigned offset) const
1518 {
1519     if (auto* layout = simpleLineLayout())
1520         return SimpleLineLayout::containsCaretOffset(*this, *layout, offset);
1521     return m_lineBoxes.containsOffset(*this, offset, RenderTextLineBoxes::CaretOffset);
1522 }
1523
1524 bool RenderText::hasRenderedText() const
1525 {
1526     if (auto* layout = simpleLineLayout())
1527         return SimpleLineLayout::isTextRendered(*this, *layout);
1528     return m_lineBoxes.hasRenderedText();
1529 }
1530
1531 int RenderText::previousOffset(int current) const
1532 {
1533     if (isAllASCII() || m_text.is8Bit())
1534         return current - 1;
1535
1536     StringImpl* textImpl = m_text.impl();
1537     CachedTextBreakIterator iterator(StringView(textImpl->characters16(), textImpl->length()), TextBreakIterator::Mode::Caret, nullAtom);
1538     auto result = iterator.preceding(current).value_or(current - 1);
1539     return result;
1540 }
1541
1542 #if PLATFORM(COCOA) || PLATFORM(GTK)
1543
1544 const UChar hangulChoseongStart = 0x1100;
1545 const UChar hangulChoseongEnd = 0x115F;
1546 const UChar hangulJungseongStart = 0x1160;
1547 const UChar hangulJungseongEnd = 0x11A2;
1548 const UChar hangulJongseongStart = 0x11A8;
1549 const UChar hangulJongseongEnd = 0x11F9;
1550 const UChar hangulSyllableStart = 0xAC00;
1551 const UChar hangulSyllableEnd = 0xD7AF;
1552 const UChar hangulJongseongCount = 28;
1553
1554 enum class HangulState { L, V, T, LV, LVT, Break };
1555
1556 static inline bool isHangulLVT(UChar character)
1557 {
1558     return (character - hangulSyllableStart) % hangulJongseongCount;
1559 }
1560
1561 static inline bool isMark(UChar32 character)
1562 {
1563     return U_GET_GC_MASK(character) & U_GC_M_MASK;
1564 }
1565
1566 static inline bool isRegionalIndicator(UChar32 character)
1567 {
1568     // National flag emoji each consists of a pair of regional indicator symbols.
1569     return 0x1F1E6 <= character && character <= 0x1F1FF;
1570 }
1571
1572 static inline bool isInArmenianToLimbuRange(UChar32 character)
1573 {
1574     return character >= 0x0530 && character < 0x1950;
1575 }
1576
1577 #endif
1578
1579 int RenderText::previousOffsetForBackwardDeletion(int current) const
1580 {
1581     ASSERT(!m_text.isNull());
1582     StringImpl& text = *m_text.impl();
1583
1584     // FIXME: Unclear why this has so much handrolled code rather than using UBreakIterator.
1585     // Also unclear why this is so different from advanceByCombiningCharacterSequence.
1586
1587     // FIXME: Seems like this fancier case could be used on all platforms now, no
1588     // need for the #else case below.
1589 #if PLATFORM(COCOA) || PLATFORM(GTK)
1590     bool sawRegionalIndicator = false;
1591     bool sawEmojiGroupCandidate = false;
1592     bool sawEmojiFitzpatrickModifier = false;
1593     
1594     while (current > 0) {
1595         UChar32 character;
1596         U16_PREV(text, 0, current, character);
1597
1598         if (sawEmojiGroupCandidate) {
1599             sawEmojiGroupCandidate = false;
1600             if (character == zeroWidthJoiner)
1601                 continue;
1602             // We could have two emoji group candidates without a joiner in between.
1603             // Those should not be treated as a group.
1604             U16_FWD_1_UNSAFE(text, current);
1605             break;
1606         }
1607
1608         if (sawEmojiFitzpatrickModifier) {
1609             if (isEmojiFitzpatrickModifier(character)) {
1610                 // Don't treat two emoji modifiers in a row as a group.
1611                 U16_FWD_1_UNSAFE(text, current);
1612                 break;
1613             }
1614             if (!isVariationSelector(character))
1615                 break;
1616         }
1617
1618         if (sawRegionalIndicator) {
1619             // We don't check if the pair of regional indicator symbols before current position can actually be combined
1620             // into a flag, and just delete it. This may not agree with how the pair is rendered in edge cases,
1621             // but is good enough in practice.
1622             if (isRegionalIndicator(character))
1623                 break;
1624             // Don't delete a preceding character that isn't a regional indicator symbol.
1625             U16_FWD_1_UNSAFE(text, current);
1626         }
1627
1628         // We don't combine characters in Armenian ... Limbu range for backward deletion.
1629         if (isInArmenianToLimbuRange(character))
1630             break;
1631
1632         if (isRegionalIndicator(character)) {
1633             sawRegionalIndicator = true;
1634             continue;
1635         }
1636         
1637         if (isEmojiFitzpatrickModifier(character)) {
1638             sawEmojiFitzpatrickModifier = true;
1639             continue;
1640         }
1641
1642         if (isEmojiGroupCandidate(character)) {
1643             sawEmojiGroupCandidate = true;
1644             continue;
1645         }
1646
1647         // FIXME: Why are FF9E and FF9F special cased here?
1648         if (!isMark(character) && character != 0xFF9E && character != 0xFF9F)
1649             break;
1650     }
1651
1652     if (current <= 0)
1653         return current;
1654
1655     // Hangul
1656     UChar character = text[current];
1657     if ((character >= hangulChoseongStart && character <= hangulJongseongEnd) || (character >= hangulSyllableStart && character <= hangulSyllableEnd)) {
1658         HangulState state;
1659
1660         if (character < hangulJungseongStart)
1661             state = HangulState::L;
1662         else if (character < hangulJongseongStart)
1663             state = HangulState::V;
1664         else if (character < hangulSyllableStart)
1665             state = HangulState::T;
1666         else
1667             state = isHangulLVT(character) ? HangulState::LVT : HangulState::LV;
1668
1669         while (current > 0 && (character = text[current - 1]) >= hangulChoseongStart && character <= hangulSyllableEnd && (character <= hangulJongseongEnd || character >= hangulSyllableStart)) {
1670             switch (state) {
1671             case HangulState::V:
1672                 if (character <= hangulChoseongEnd)
1673                     state = HangulState::L;
1674                 else if (character >= hangulSyllableStart && character <= hangulSyllableEnd && !isHangulLVT(character))
1675                     state = HangulState::LV;
1676                 else if (character > hangulJungseongEnd)
1677                     state = HangulState::Break;
1678                 break;
1679             case HangulState::T:
1680                 if (character >= hangulJungseongStart && character <= hangulJungseongEnd)
1681                     state = HangulState::V;
1682                 else if (character >= hangulSyllableStart && character <= hangulSyllableEnd)
1683                     state = isHangulLVT(character) ? HangulState::LVT : HangulState::LV;
1684                 else if (character < hangulJungseongStart)
1685                     state = HangulState::Break;
1686                 break;
1687             default:
1688                 state = (character < hangulJungseongStart) ? HangulState::L : HangulState::Break;
1689                 break;
1690             }
1691             if (state == HangulState::Break)
1692                 break;
1693             --current;
1694         }
1695     }
1696
1697     return current;
1698 #else
1699     U16_BACK_1(text, 0, current);
1700     return current;
1701 #endif
1702 }
1703
1704 int RenderText::nextOffset(int current) const
1705 {
1706     if (isAllASCII() || m_text.is8Bit())
1707         return current + 1;
1708
1709     StringImpl* textImpl = m_text.impl();
1710     CachedTextBreakIterator iterator(StringView(textImpl->characters16(), textImpl->length()), TextBreakIterator::Mode::Caret, nullAtom);
1711     auto result = iterator.following(current).value_or(current + 1);
1712     return result;
1713 }
1714
1715 bool RenderText::computeCanUseSimpleFontCodePath() const
1716 {
1717     if (isAllASCII() || m_text.is8Bit())
1718         return true;
1719     return FontCascade::characterRangeCodePath(characters16(), length()) == FontCascade::Simple;
1720 }
1721
1722 void RenderText::momentarilyRevealLastTypedCharacter(unsigned offsetAfterLastTypedCharacter)
1723 {
1724     if (style().textSecurity() == TSNONE)
1725         return;
1726     auto& secureTextTimer = secureTextTimers().add(this, nullptr).iterator->value;
1727     if (!secureTextTimer)
1728         secureTextTimer = std::make_unique<SecureTextTimer>(*this);
1729     secureTextTimer->restart(offsetAfterLastTypedCharacter);
1730 }
1731
1732 StringView RenderText::stringView(unsigned start, std::optional<unsigned> stop) const
1733 {
1734     unsigned destination = stop.value_or(textLength());
1735     ASSERT(start <= length());
1736     ASSERT(destination <= length());
1737     ASSERT(start <= destination);
1738     if (is8Bit())
1739         return StringView(characters8() + start, destination - start);
1740     return StringView(characters16() + start, destination - start);
1741 }
1742
1743 } // namespace WebCore