938dc2c59f8573a76e0dc41f5a8ae94fb46d991a
[WebKit-https.git] / WebCore / platform / win / UniscribeController.cpp
1 /*
2  * Copyright (C) 2007 Apple Inc.  All rights reserved.
3  *
4  * Redistribution and use in source and binary forms, with or without
5  * modification, are permitted provided that the following conditions
6  * are met:
7  *
8  * 1.  Redistributions of source code must retain the above copyright
9  *     notice, this list of conditions and the following disclaimer. 
10  * 2.  Redistributions in binary form must reproduce the above copyright
11  *     notice, this list of conditions and the following disclaimer in the
12  *     documentation and/or other materials provided with the distribution. 
13  * 3.  Neither the name of Apple Computer, Inc. ("Apple") nor the names of
14  *     its contributors may be used to endorse or promote products derived
15  *     from this software without specific prior written permission. 
16  *
17  * THIS SOFTWARE IS PROVIDED BY APPLE AND ITS CONTRIBUTORS "AS IS" AND ANY
18  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
19  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
20  * DISCLAIMED. IN NO EVENT SHALL APPLE OR ITS CONTRIBUTORS BE LIABLE FOR ANY
21  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
22  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
23  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
24  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
25  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
26  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
27  */
28
29 #include "config.h"
30 #include "UniscribeController.h"
31 #include "Font.h"
32 #include "SimpleFontData.h"
33 #include <wtf/MathExtras.h>
34
35 namespace WebCore {
36
37 // FIXME: Rearchitect this to be more like WidthIterator in Font.cpp.  Have an advance() method
38 // that does stuff in that method instead of doing everything in the constructor.  Have advance()
39 // take the GlyphBuffer as an arg so that we don't have to populate the glyph buffer when
40 // measuring.
41 UniscribeController::UniscribeController(const Font* font, const TextRun& run)
42 : m_font(*font)
43 , m_run(run)
44 , m_end(run.length())
45 , m_currentCharacter(0)
46 , m_runWidthSoFar(0)
47 , m_computingOffsetPosition(false)
48 , m_includePartialGlyphs(false)
49 , m_offsetX(0)
50 , m_offsetPosition(0)
51 {
52     m_padding = m_run.padding();
53     if (!m_padding)
54         m_padPerSpace = 0;
55     else {
56         float numSpaces = 0;
57         for (int s = 0; s < m_run.length(); s++)
58             if (Font::treatAsSpace(m_run[s]))
59                 numSpaces++;
60
61         if (numSpaces == 0)
62             m_padPerSpace = 0;
63         else
64             m_padPerSpace = ceilf(m_run.padding() / numSpaces);
65     }
66
67     // Null out our uniscribe structs
68     resetControlAndState();
69 }
70
71 int UniscribeController::offsetForPosition(int x, bool includePartialGlyphs)
72 {
73     m_computingOffsetPosition = true;
74     m_includePartialGlyphs = includePartialGlyphs;
75     m_offsetX = x;
76     m_offsetPosition = 0;
77     advance(m_run.length());
78     if (m_computingOffsetPosition) {
79         // The point is to the left or to the right of the entire run.
80         if (m_offsetX >= m_runWidthSoFar && m_run.ltr() || m_offsetX < 0 && m_run.rtl())
81             m_offsetPosition = m_end;
82     }
83     m_computingOffsetPosition = false;
84     return m_offsetPosition;
85 }
86
87 void UniscribeController::advance(unsigned offset, GlyphBuffer* glyphBuffer)
88 {
89     // FIXME: We really want to be using a newer version of Uniscribe that supports the new OpenType
90     // functions.  Those functions would allow us to turn off kerning and ligatures.  Without being able
91     // to do that, we will have buggy line breaking and metrics when simple and complex text are close
92     // together (the complex code path will narrow the text because of kerning and ligatures and then
93     // when bidi processing splits into multiple runs, the simple portions will get wider and cause us to
94     // spill off the edge of a line).
95     if (static_cast<int>(offset) > m_end)
96         offset = m_end;
97
98     // Itemize the string.
99     const UChar* cp = m_run.data(m_currentCharacter);
100     int length = offset - m_currentCharacter;
101     if (length <= 0)
102         return;
103
104     // We break up itemization of the string by fontData and (if needed) the use of small caps.
105
106     // FIXME: It's inconsistent that we use logical order when itemizing, since this
107     // does not match normal RTL.
108
109     // FIXME: This function should decode surrogate pairs. Currently it makes little difference that
110     // it does not because the font cache on Windows does not support non-BMP characters.
111     Vector<UChar, 256> smallCapsBuffer;
112     if (m_font.isSmallCaps())
113         smallCapsBuffer.resize(length);
114
115     unsigned indexOfFontTransition = m_run.rtl() ? length - 1 : 0;
116     const UChar* curr = m_run.rtl() ? cp + length  - 1 : cp;
117     const UChar* end = m_run.rtl() ? cp - 1 : cp + length;
118
119     const SimpleFontData* fontData;
120     const SimpleFontData* nextFontData = m_font.glyphDataForCharacter(*curr, false).fontData;
121
122     UChar newC;
123
124     bool isSmallCaps;
125     bool nextIsSmallCaps = m_font.isSmallCaps() && !(U_GET_GC_MASK(*curr) & U_GC_M_MASK) && (newC = u_toupper(*curr)) != *curr;
126
127     if (nextIsSmallCaps)
128         smallCapsBuffer[curr - cp] = newC;
129
130     while (true) {
131         curr = m_run.rtl() ? curr - 1 : curr + 1;
132         if (curr == end)
133             break;
134
135         fontData = nextFontData;
136         isSmallCaps = nextIsSmallCaps;
137         int index = curr - cp;
138         UChar c = *curr;
139
140         bool forceSmallCaps = isSmallCaps && (U_GET_GC_MASK(c) & U_GC_M_MASK);
141         nextFontData = m_font.glyphDataForCharacter(*curr, false, forceSmallCaps).fontData;
142         if (m_font.isSmallCaps()) {
143             nextIsSmallCaps = forceSmallCaps || (newC = u_toupper(c)) != c;
144             if (nextIsSmallCaps)
145                 smallCapsBuffer[index] = forceSmallCaps ? c : newC;
146         }
147
148         if (nextFontData != fontData || nextIsSmallCaps != isSmallCaps) {
149             int itemStart = m_run.rtl() ? index : indexOfFontTransition;
150             int itemLength = m_run.rtl() ? indexOfFontTransition - index : index - indexOfFontTransition;
151             itemizeShapeAndPlace((isSmallCaps ? smallCapsBuffer.data() : cp) + itemStart, itemLength, fontData, glyphBuffer);
152             indexOfFontTransition = index;
153         }
154     }
155     
156     int itemLength = m_run.rtl() ? indexOfFontTransition + 1 : length - indexOfFontTransition;
157     if (itemLength) {
158         int itemStart = m_run.rtl() ? 0 : indexOfFontTransition;
159         itemizeShapeAndPlace((nextIsSmallCaps ? smallCapsBuffer.data() : cp) + itemStart, itemLength, nextFontData, glyphBuffer);
160     }
161 }
162
163 void UniscribeController::itemizeShapeAndPlace(const UChar* cp, unsigned length, const SimpleFontData* fontData, GlyphBuffer* glyphBuffer)
164 {
165     // ScriptItemize (in Windows XP versions prior to SP2) can overflow by 1.  This is why there is an extra empty item
166     // hanging out at the end of the array
167     m_items.resize(6);
168     int numItems = 0;
169     while (ScriptItemize(cp, length, m_items.size() - 1, &m_control, &m_state, m_items.data(), &numItems) == E_OUTOFMEMORY) {
170         m_items.resize(m_items.size() * 2);
171         resetControlAndState();
172     }
173     m_items.resize(numItems + 1);
174
175     if (m_run.rtl()) {
176         for (int i = m_items.size() - 2; i >= 0; i--) {
177             if (!shapeAndPlaceItem(cp, i, fontData, glyphBuffer))
178                 return;
179         }
180     } else {
181         for (unsigned i = 0; i < m_items.size() - 1; i++) {
182             if (!shapeAndPlaceItem(cp, i, fontData, glyphBuffer))
183                 return;
184         }
185     }
186
187     m_currentCharacter += length;
188 }
189
190 void UniscribeController::resetControlAndState()
191 {
192     memset(&m_control, 0, sizeof(SCRIPT_CONTROL));
193     memset(&m_state, 0, sizeof(SCRIPT_STATE));
194
195     // Set up the correct direction for the run.
196     m_state.uBidiLevel = m_run.rtl();
197     
198     // Lock the correct directional override.
199     m_state.fOverrideDirection = m_run.directionalOverride();
200 }
201
202 bool UniscribeController::shapeAndPlaceItem(const UChar* cp, unsigned i, const SimpleFontData* fontData, GlyphBuffer* glyphBuffer)
203 {
204     // Determine the string for this item.
205     const UChar* str = cp + m_items[i].iCharPos;
206     int len = m_items[i+1].iCharPos - m_items[i].iCharPos;
207     SCRIPT_ITEM item = m_items[i];
208
209     // Set up buffers to hold the results of shaping the item.
210     Vector<WORD> glyphs;
211     Vector<WORD> clusters;
212     Vector<SCRIPT_VISATTR> visualAttributes;
213     clusters.resize(len);
214      
215     // Shape the item.
216     // The recommended size for the glyph buffer is 1.5 * the character length + 16 in the uniscribe docs.
217     // Apparently this is a good size to avoid having to make repeated calls to ScriptShape.
218     glyphs.resize(1.5 * len + 16);
219     visualAttributes.resize(glyphs.size());
220
221     if (!shape(str, len, item, fontData, glyphs, clusters, visualAttributes))
222         return true;
223
224     // We now have a collection of glyphs.
225     Vector<GOFFSET> offsets;
226     Vector<int> advances;
227     offsets.resize(glyphs.size());
228     advances.resize(glyphs.size());
229     int glyphCount = 0;
230     HRESULT placeResult = ScriptPlace(0, fontData->scriptCache(), glyphs.data(), glyphs.size(), visualAttributes.data(),
231                                       &item.a, advances.data(), offsets.data(), 0);
232     if (placeResult == E_PENDING) {
233         // The script cache isn't primed with enough info yet.  We need to select our HFONT into
234         // a DC and pass the DC in to ScriptPlace.
235         HDC hdc = GetDC(0);
236         HFONT hfont = fontData->platformData().hfont();
237         HFONT oldFont = (HFONT)SelectObject(hdc, hfont);
238         placeResult = ScriptPlace(hdc, fontData->scriptCache(), glyphs.data(), glyphs.size(), visualAttributes.data(),
239                                   &item.a, advances.data(), offsets.data(), 0);
240         SelectObject(hdc, oldFont);
241         ReleaseDC(0, hdc);
242     }
243     
244     if (FAILED(placeResult) || glyphs.isEmpty())
245         return true;
246
247     // Convert all chars that should be treated as spaces to use the space glyph.
248     // We also create a map that allows us to quickly go from space glyphs or rounding
249     // hack glyphs back to their corresponding characters.
250     Vector<int> spaceCharacters(glyphs.size());
251     spaceCharacters.fill(-1);
252     Vector<int> roundingHackCharacters(glyphs.size());
253     roundingHackCharacters.fill(-1);
254     Vector<int> roundingHackWordBoundaries(glyphs.size());
255     roundingHackWordBoundaries.fill(-1);
256
257     const float cLogicalScale = fontData->m_font.useGDI() ? 1.0f : 32.0f;
258     unsigned logicalSpaceWidth = fontData->m_spaceWidth * cLogicalScale;
259     float roundedSpaceWidth = roundf(fontData->m_spaceWidth);
260
261     for (int k = 0; k < len; k++) {
262         UChar ch = *(str + k);
263         if (Font::treatAsSpace(ch)) {
264             // Substitute in the space glyph at the appropriate place in the glyphs
265             // array.
266             glyphs[clusters[k]] = fontData->m_spaceGlyph;
267             advances[clusters[k]] = logicalSpaceWidth;
268             spaceCharacters[clusters[k]] = m_currentCharacter + k + item.iCharPos;
269         }
270
271         if (Font::isRoundingHackCharacter(ch))
272             roundingHackCharacters[clusters[k]] = m_currentCharacter + k + item.iCharPos;
273
274         int boundary = k + m_currentCharacter + item.iCharPos;
275         if (boundary < m_run.length() &&
276             Font::isRoundingHackCharacter(*(str + k + 1)))
277             roundingHackWordBoundaries[clusters[k]] = boundary;
278     }
279
280     // Populate our glyph buffer with this information.
281     bool hasExtraSpacing = m_font.letterSpacing() || m_font.wordSpacing() || m_padding;
282     
283     float leftEdge = m_runWidthSoFar;
284
285     for (unsigned k = 0; k < glyphs.size(); k++) {
286         Glyph glyph = glyphs[k];
287         float advance = advances[k] / cLogicalScale;
288         float offsetX = offsets[k].du / cLogicalScale;
289         float offsetY = offsets[k].dv / cLogicalScale;
290
291         // Match AppKit's rules for the integer vs. non-integer rendering modes.
292         float roundedAdvance = roundf(advance);
293         if (!m_font.isPrinterFont() && !fontData->isSystemFont()) {
294             advance = roundedAdvance;
295             offsetX = roundf(offsetX);
296             offsetY = roundf(offsetY);
297         }
298        
299         // We special case spaces in two ways when applying word rounding.
300         // First, we round spaces to an adjusted width in all fonts.
301         // Second, in fixed-pitch fonts we ensure that all glyphs that
302         // match the width of the space glyph have the same width as the space glyph.
303         if (roundedAdvance == roundedSpaceWidth && (fontData->m_treatAsFixedPitch || glyph == fontData->m_spaceGlyph) &&
304             m_run.applyWordRounding())
305             advance = fontData->m_adjustedSpaceWidth;
306
307         if (hasExtraSpacing) {
308             // If we're a glyph with an advance, go ahead and add in letter-spacing.
309             // That way we weed out zero width lurkers.  This behavior matches the fast text code path.
310             if (advance && m_font.letterSpacing())
311                 advance += m_font.letterSpacing();
312
313             // Handle justification and word-spacing.
314             if (glyph == fontData->m_spaceGlyph) {
315                 // Account for padding. WebCore uses space padding to justify text.
316                 // We distribute the specified padding over the available spaces in the run.
317                 if (m_padding) {
318                     // Use leftover padding if not evenly divisible by number of spaces.
319                     if (m_padding < m_padPerSpace) {
320                         advance += m_padding;
321                         m_padding = 0;
322                     } else {
323                         advance += m_padPerSpace;
324                         m_padding -= m_padPerSpace;
325                     }
326                 }
327
328                 // Account for word-spacing.
329                 int characterIndex = spaceCharacters[k];
330                 if (characterIndex > 0 && !Font::treatAsSpace(*m_run.data(characterIndex - 1)) && m_font.wordSpacing())
331                     advance += m_font.wordSpacing();
332             }
333         }
334
335         // Deal with the float/integer impedance mismatch between CG and WebCore. "Words" (characters 
336         // followed by a character defined by isRoundingHackCharacter()) are always an integer width.
337         // We adjust the width of the last character of a "word" to ensure an integer width.
338         // Force characters that are used to determine word boundaries for the rounding hack
339         // to be integer width, so the following words will start on an integer boundary.
340         int roundingHackIndex = roundingHackCharacters[k];
341         if (m_run.applyWordRounding() && roundingHackIndex != -1)
342             advance = ceilf(advance);
343
344         // Check to see if the next character is a "rounding hack character", if so, adjust the
345         // width so that the total run width will be on an integer boundary.
346         int position = m_currentCharacter + len;
347         bool lastGlyph = (k == glyphs.size() - 1) && (m_run.rtl() ? i == 0 : i == m_items.size() - 2) && (position >= m_end);
348         if ((m_run.applyWordRounding() && roundingHackWordBoundaries[k] != -1) ||
349             (m_run.applyRunRounding() && lastGlyph)) { 
350             float totalWidth = m_runWidthSoFar + advance;
351             advance += ceilf(totalWidth) - totalWidth;
352         }
353
354         m_runWidthSoFar += advance;
355
356         // FIXME: We need to take the GOFFSETS for combining glyphs and store them in the glyph buffer
357         // as well, so that when the time comes to draw those glyphs, we can apply the appropriate
358         // translation.
359         if (glyphBuffer) {
360             FloatSize size(offsetX, offsetY);
361             glyphBuffer->add(glyph, fontData, advance, &size);
362         }
363
364         // Mutate the glyph array to contain our altered advances.
365         if (m_computingOffsetPosition)
366             advances[k] = advance;
367     }
368
369     while (m_computingOffsetPosition && m_offsetX >= leftEdge && m_offsetX < m_runWidthSoFar) {
370         // The position is somewhere inside this run.
371         int trailing = 0;
372         ScriptXtoCP(m_offsetX - leftEdge, clusters.size(), glyphs.size(), clusters.data(), visualAttributes.data(),
373                     advances.data(), &item.a, &m_offsetPosition, &trailing);
374         if (trailing && m_includePartialGlyphs && m_offsetPosition < len - 1) {
375             m_offsetPosition += m_currentCharacter + m_items[i].iCharPos;
376             m_offsetX += m_run.rtl() ? -trailing : trailing;
377         } else {
378             m_computingOffsetPosition = false;
379             m_offsetPosition += m_currentCharacter + m_items[i].iCharPos;
380             if (trailing && m_includePartialGlyphs)
381                m_offsetPosition++;
382             return false;
383         }
384     }
385
386     return true;
387 }
388
389 bool UniscribeController::shape(const UChar* str, int len, SCRIPT_ITEM item, const SimpleFontData* fontData,
390                                 Vector<WORD>& glyphs, Vector<WORD>& clusters,
391                                 Vector<SCRIPT_VISATTR>& visualAttributes)
392 {
393     HDC hdc = 0;
394     HFONT oldFont = 0;
395     HRESULT shapeResult = E_PENDING;
396     int glyphCount = 0;
397     do {
398         shapeResult = ScriptShape(hdc, fontData->scriptCache(), str, len, glyphs.size(), &item.a,
399                                   glyphs.data(), clusters.data(), visualAttributes.data(), &glyphCount);
400         if (shapeResult == E_PENDING) {
401             // The script cache isn't primed with enough info yet.  We need to select our HFONT into
402             // a DC and pass the DC in to ScriptShape.
403             ASSERT(!hdc);
404             hdc = GetDC(0);
405             HFONT hfont = fontData->platformData().hfont();
406             oldFont = (HFONT)SelectObject(hdc, hfont);
407         } else if (shapeResult == E_OUTOFMEMORY) {
408             // Need to resize our buffers.
409             glyphs.resize(glyphs.size() * 2);
410             visualAttributes.resize(glyphs.size());
411         }
412     } while (shapeResult == E_PENDING || shapeResult == E_OUTOFMEMORY);
413
414     if (hdc) {
415         SelectObject(hdc, oldFont);
416         ReleaseDC(0, hdc);
417     }
418
419     if (FAILED(shapeResult))
420         return false;
421     
422     // FIXME: We need to do better than this.  Falling back on the entire item is not good enough.
423     // We may still have missing glyphs even if we succeeded.  We need to treat missing glyphs as
424     // a failure so that we will fall back to another font.
425     bool containsMissingGlyphs = false;
426     SCRIPT_FONTPROPERTIES* fontProperties = fontData->scriptFontProperties();
427     for (int i = 0; i < glyphCount; i++) {
428         WORD glyph = glyphs[i];
429         if (glyph == fontProperties->wgDefault) {
430             containsMissingGlyphs = true;
431             break;
432         }
433     }
434
435     if (containsMissingGlyphs)
436         return false;
437
438     glyphs.resize(glyphCount);
439     visualAttributes.resize(glyphCount);
440
441     return true;
442 }
443
444 }