Replace WTF::move with WTFMove
[WebKit-https.git] / Source / WebCore / html / parser / HTMLPreloadScanner.cpp
index cf9af2f..4f15ef9 100644 (file)
@@ -1,5 +1,5 @@
 /*
- * Copyright (C) 2008 Apple Inc. All Rights Reserved.
+ * Copyright (C) 2008, 2014 Apple Inc. All Rights Reserved.
  * Copyright (C) 2009 Torch Mobile, Inc. http://www.torchmobile.com/
  * Copyright (C) 2010 Google Inc. All Rights Reserved.
  *
 
 #include "HTMLNames.h"
 #include "HTMLParserIdioms.h"
-#include "HTMLParserOptions.h"
+#include "HTMLSrcsetParser.h"
 #include "HTMLTokenizer.h"
 #include "InputTypeNames.h"
 #include "LinkRelAttribute.h"
-#include "MediaList.h"
-#include "MediaQueryEvaluator.h"
-#include <wtf/Functional.h>
+#include "SourceSizeList.h"
 #include <wtf/MainThread.h>
 
 namespace WebCore {
 
 using namespace HTMLNames;
 
-static bool isStartTag(const HTMLToken& token)
+TokenPreloadScanner::TagId TokenPreloadScanner::tagIdFor(const HTMLToken::DataVector& data)
 {
-    return token.type() == HTMLToken::StartTag;
+    AtomicString tagName(data);
+    if (tagName == iframeTag)
+        return TagId::Iframe;
+    if (tagName == imgTag)
+        return TagId::Img;
+    if (tagName == inputTag)
+        return TagId::Input;
+    if (tagName == linkTag)
+        return TagId::Link;
+    if (tagName == scriptTag)
+        return TagId::Script;
+    if (tagName == styleTag)
+        return TagId::Style;
+    if (tagName == baseTag)
+        return TagId::Base;
+    if (tagName == templateTag)
+        return TagId::Template;
+    if (tagName == metaTag)
+        return TagId::Meta;
+    return TagId::Unknown;
 }
 
-static bool isStartOrEndTag(const HTMLToken& token)
+String TokenPreloadScanner::initiatorFor(TagId tagId)
 {
-    return token.type() == HTMLToken::EndTag || isStartTag(token);
+    switch (tagId) {
+    case TagId::Iframe:
+        return "iframe";
+    case TagId::Img:
+        return "img";
+    case TagId::Input:
+        return "input";
+    case TagId::Link:
+        return "link";
+    case TagId::Script:
+        return "script";
+    case TagId::Unknown:
+    case TagId::Style:
+    case TagId::Base:
+    case TagId::Template:
+    case TagId::Meta:
+        ASSERT_NOT_REACHED();
+        return "unknown";
+    }
+    ASSERT_NOT_REACHED();
+    return "unknown";
 }
 
-class StartTagScanner {
+class TokenPreloadScanner::StartTagScanner {
 public:
-    explicit StartTagScanner(const AtomicString& tagName, const HTMLToken::AttributeList& attributes)
-        : m_tagName(tagName)
+    explicit StartTagScanner(TagId tagId, float deviceScaleFactor = 1.0)
+        : m_tagId(tagId)
         , m_linkIsStyleSheet(false)
-        , m_linkMediaAttributeIsScreen(true)
+        , m_metaIsViewport(false)
         , m_inputIsImage(false)
+        , m_deviceScaleFactor(deviceScaleFactor)
     {
-        processAttributes(attributes);
     }
 
-    void processAttributes(const HTMLToken::AttributeList& attributes)
+    void processAttributes(const HTMLToken::AttributeList& attributes, Document& document)
     {
-        if (m_tagName != imgTag
-            && m_tagName != inputTag
-            && m_tagName != linkTag
-            && m_tagName != scriptTag)
+        ASSERT(isMainThread());
+        if (m_tagId >= TagId::Unknown)
             return;
 
-        for (HTMLToken::AttributeList::const_iterator iter = attributes.begin();
-             iter != attributes.end(); ++iter) {
-            AtomicString attributeName(iter->name);
-            String attributeValue = StringImpl::create8BitIfPossible(iter->value);
-
-            if (attributeName == charsetAttr)
-                m_charset = attributeValue;
+        for (auto& attribute : attributes) {
+            AtomicString attributeName(attribute.name);
+            String attributeValue = StringImpl::create8BitIfPossible(attribute.value);
+            processAttribute(attributeName, attributeValue);
+        }
 
-            if (m_tagName == scriptTag || m_tagName == imgTag) {
-                if (attributeName == srcAttr)
-                    setUrlToLoad(attributeValue);
-                else if (attributeName == crossoriginAttr && !attributeValue.isNull())
-                    m_crossOriginMode = stripLeadingAndTrailingHTMLSpaces(attributeValue);
-            } else if (m_tagName == linkTag) {
-                if (attributeName == hrefAttr)
-                    setUrlToLoad(attributeValue);
-                else if (attributeName == relAttr)
-                    m_linkIsStyleSheet = relAttributeIsStyleSheet(attributeValue);
-                else if (attributeName == mediaAttr)
-                    m_linkMediaAttributeIsScreen = linkMediaAttributeIsScreen(attributeValue);
-            } else if (m_tagName == inputTag) {
-                if (attributeName == srcAttr)
-                    setUrlToLoad(attributeValue);
-                else if (attributeName == typeAttr)
-                    m_inputIsImage = equalIgnoringCase(attributeValue, InputTypeNames::image());
-            }
+        // Resolve between src and srcSet if we have them and the tag is img.
+        if (m_tagId == TagId::Img && !m_srcSetAttribute.isEmpty()) {
+            float sourceSize = 0;
+            sourceSize = parseSizesAttribute(m_sizesAttribute, document.renderView(), document.frame());
+            ImageCandidate imageCandidate = bestFitSourceForImageAttributes(m_deviceScaleFactor, m_urlToLoad, m_srcSetAttribute, sourceSize);
+            setUrlToLoad(imageCandidate.string.toString(), true);
         }
+
+        if (m_metaIsViewport && !m_metaContent.isNull())
+            document.processViewport(m_metaContent, ViewportArguments::ViewportMeta);
     }
 
-    static bool relAttributeIsStyleSheet(const String& attributeValue)
+    std::unique_ptr<PreloadRequest> createPreloadRequest(const URL& predictedBaseURL)
+    {
+        if (!shouldPreload())
+            return nullptr;
+
+        auto request = std::make_unique<PreloadRequest>(initiatorFor(m_tagId), m_urlToLoad, predictedBaseURL, resourceType(), m_mediaAttribute);
+
+        request->setCrossOriginModeAllowsCookies(crossOriginModeAllowsCookies());
+        request->setCharset(charset());
+        return request;
+    }
+
+    static bool match(const AtomicString& name, const QualifiedName& qName)
+    {
+        ASSERT(isMainThread());
+        return qName.localName() == name;
+    }
+
+private:
+    void processImageAndScriptAttribute(const AtomicString& attributeName, const String& attributeValue)
     {
-        LinkRelAttribute rel(attributeValue);
-        return rel.m_isStyleSheet && !rel.m_isAlternate && rel.m_iconType == InvalidIcon && !rel.m_isDNSPrefetch;
+        if (match(attributeName, srcAttr))
+            setUrlToLoad(attributeValue);
+        else if (match(attributeName, crossoriginAttr) && !attributeValue.isNull())
+            m_crossOriginMode = stripLeadingAndTrailingHTMLSpaces(attributeValue);
+        else if (match(attributeName, charsetAttr))
+            m_charset = attributeValue;
+    }
+
+    void processAttribute(const AtomicString& attributeName, const String& attributeValue)
+    {
+        switch (m_tagId) {
+        case TagId::Iframe:
+            if (match(attributeName, srcAttr))
+                setUrlToLoad(attributeValue);
+            break;
+        case TagId::Img:
+            if (match(attributeName, srcsetAttr) && m_srcSetAttribute.isNull()) {
+                m_srcSetAttribute = attributeValue;
+                break;
+            }
+            if (match(attributeName, sizesAttr) && m_sizesAttribute.isNull()) {
+                m_sizesAttribute = attributeValue;
+                break;
+            }
+            processImageAndScriptAttribute(attributeName, attributeValue);
+            break;
+        case TagId::Script:
+            processImageAndScriptAttribute(attributeName, attributeValue);
+            break;
+        case TagId::Link:
+            if (match(attributeName, hrefAttr))
+                setUrlToLoad(attributeValue);
+            else if (match(attributeName, relAttr))
+                m_linkIsStyleSheet = relAttributeIsStyleSheet(attributeValue);
+            else if (match(attributeName, mediaAttr))
+                m_mediaAttribute = attributeValue;
+            else if (match(attributeName, charsetAttr))
+                m_charset = attributeValue;
+            break;
+        case TagId::Input:
+            if (match(attributeName, srcAttr))
+                setUrlToLoad(attributeValue);
+            else if (match(attributeName, typeAttr))
+                m_inputIsImage = equalIgnoringCase(attributeValue, InputTypeNames::image());
+            break;
+        case TagId::Meta:
+            if (match(attributeName, contentAttr))
+                m_metaContent = attributeValue;
+            else if (match(attributeName, nameAttr))
+                m_metaIsViewport = equalIgnoringCase(attributeValue, "viewport");
+            break;
+        case TagId::Base:
+        case TagId::Style:
+        case TagId::Template:
+        case TagId::Unknown:
+            break;
+        }
     }
 
-    static bool linkMediaAttributeIsScreen(const String& attributeValue)
+    static bool relAttributeIsStyleSheet(const String& attributeValue)
     {
-        if (attributeValue.isEmpty())
-            return true;
-        RefPtr<MediaQuerySet> mediaQueries = MediaQuerySet::createAllowingDescriptionSyntax(attributeValue);
-    
-        // Only preload screen media stylesheets. Used this way, the evaluator evaluates to true for any 
-        // rules containing complex queries (full evaluation is possible but it requires a frame and a style selector which
-        // may be problematic here).
-        MediaQueryEvaluator mediaQueryEvaluator("screen");
-        return mediaQueryEvaluator.eval(mediaQueries.get());
+        LinkRelAttribute parsedAttribute { attributeValue };
+        return parsedAttribute.isStyleSheet && !parsedAttribute.isAlternate && parsedAttribute.iconType == InvalidIcon && !parsedAttribute.isDNSPrefetch;
     }
 
-    void setUrlToLoad(const String& attributeValue)
+    void setUrlToLoad(const String& value, bool allowReplacement = false)
     {
         // We only respect the first src/href, per HTML5:
         // http://www.whatwg.org/specs/web-apps/current-work/multipage/tokenization.html#attribute-name-state
-        if (!m_urlToLoad.isEmpty())
+        if (!allowReplacement && !m_urlToLoad.isEmpty())
+            return;
+        String url = stripLeadingAndTrailingHTMLSpaces(value);
+        if (url.isEmpty())
             return;
-        m_urlToLoad = stripLeadingAndTrailingHTMLSpaces(attributeValue);
+        m_urlToLoad = url;
     }
 
     const String& charset() const
     {
-        // FIXME: Its not clear that this if is needed, the loader probably ignores charset for image requests anyway.
-        if (m_tagName == imgTag)
-            return emptyString();
         return m_charset;
     }
 
     CachedResource::Type resourceType() const
     {
-        if (m_tagName == scriptTag)
+        switch (m_tagId) {
+        case TagId::Iframe:
+            return CachedResource::MainResource;
+        case TagId::Script:
             return CachedResource::Script;
-        if (m_tagName == imgTag || (m_tagName == inputTag && m_inputIsImage))
+        case TagId::Img:
+        case TagId::Input:
+            ASSERT(m_tagId != TagId::Input || m_inputIsImage);
             return CachedResource::ImageResource;
-        if (m_tagName == linkTag && m_linkIsStyleSheet && m_linkMediaAttributeIsScreen)
+        case TagId::Link:
+            ASSERT(m_linkIsStyleSheet);
             return CachedResource::CSSStyleSheet;
+        case TagId::Meta:
+        case TagId::Unknown:
+        case TagId::Style:
+        case TagId::Base:
+        case TagId::Template:
+            break;
+        }
         ASSERT_NOT_REACHED();
         return CachedResource::RawResource;
     }
@@ -154,154 +258,153 @@ public:
         if (m_urlToLoad.isEmpty())
             return false;
 
-        if (m_tagName == linkTag && (!m_linkIsStyleSheet || !m_linkMediaAttributeIsScreen))
+        if (protocolIs(m_urlToLoad, "data") || protocolIs(m_urlToLoad, "about"))
             return false;
 
-        if (m_tagName == inputTag && !m_inputIsImage)
+        if (m_tagId == TagId::Link && !m_linkIsStyleSheet)
             return false;
-        return true;
-    }
 
-    PassOwnPtr<PreloadRequest> createPreloadRequest(const KURL& predictedBaseURL)
-    {
-        if (!shouldPreload())
-            return nullptr;
+        if (m_tagId == TagId::Input && !m_inputIsImage)
+            return false;
 
-        OwnPtr<PreloadRequest> request = PreloadRequest::create(m_tagName, m_urlToLoad, predictedBaseURL, resourceType());
-        request->setCrossOriginModeAllowsCookies(crossOriginModeAllowsCookies());
-        request->setCharset(charset());
-        return request.release();
+        return true;
     }
 
-    const AtomicString& tagName() const { return m_tagName; }
-
-private:
-
     bool crossOriginModeAllowsCookies()
     {
         return m_crossOriginMode.isNull() || equalIgnoringCase(m_crossOriginMode, "use-credentials");
     }
 
-    AtomicString m_tagName;
+    TagId m_tagId;
     String m_urlToLoad;
+    String m_srcSetAttribute;
+    String m_sizesAttribute;
     String m_charset;
     String m_crossOriginMode;
     bool m_linkIsStyleSheet;
-    bool m_linkMediaAttributeIsScreen;
+    String m_mediaAttribute;
+    String m_metaContent;
+    bool m_metaIsViewport;
     bool m_inputIsImage;
+    float m_deviceScaleFactor;
 };
 
-HTMLPreloadScanner::HTMLPreloadScanner(const HTMLParserOptions& options, const KURL& documentURL)
-    : m_tokenizer(HTMLTokenizer::create(options))
-    , m_inStyle(false)
-    , m_documentURL(documentURL)
-#if ENABLE(TEMPLATE_ELEMENT)
-    , m_templateCount(0)
-#endif
+TokenPreloadScanner::TokenPreloadScanner(const URL& documentURL, float deviceScaleFactor)
+    : m_documentURL(documentURL)
+    , m_deviceScaleFactor(deviceScaleFactor)
 {
 }
 
-void HTMLPreloadScanner::appendToEnd(const SegmentedString& source)
+void TokenPreloadScanner::scan(const HTMLToken& token, Vector<std::unique_ptr<PreloadRequest>>& requests, Document& document)
 {
-    m_source.append(source);
-}
+    switch (token.type()) {
+    case HTMLToken::Character:
+        if (!m_inStyle)
+            return;
+        m_cssScanner.scan(token.characters(), requests);
+        return;
 
-// This function exists for convenience on the main thread and is not used by the background-thread preload scanner.
-void HTMLPreloadScanner::scan(HTMLResourcePreloader* preloader, const KURL& startingBaseElementURL)
-{
-    ASSERT(isMainThread()); // HTMLTokenizer::updateStateFor only works on the main thread.
-    // When we start scanning, our best prediction of the baseElementURL is the real one!
-    if (!startingBaseElementURL.isEmpty())
-        m_predictedBaseElementURL = startingBaseElementURL;
-
-    Vector<OwnPtr<PreloadRequest> > requests;
-    // Note: m_token is only used from this function and for the main thread.
-    // All other functions are passed a token.
-    while (m_tokenizer->nextToken(m_source, m_token)) {
-        if (isStartTag(m_token))
-            m_tokenizer->updateStateFor(AtomicString(m_token.name()));
-        processToken(m_token, requests);
-        m_token.clear();
+    case HTMLToken::EndTag: {
+        TagId tagId = tagIdFor(token.name());
+#if ENABLE(TEMPLATE_ELEMENT)
+        if (tagId == TagId::Template) {
+            if (m_templateCount)
+                --m_templateCount;
+            return;
+        }
+#endif
+        if (tagId == TagId::Style) {
+            if (m_inStyle)
+                m_cssScanner.reset();
+            m_inStyle = false;
+        }
+        return;
     }
-    for (size_t i = 0; i < requests.size(); i++)
-        preloader->preload(requests[i].release());
-}
 
+    case HTMLToken::StartTag: {
 #if ENABLE(TEMPLATE_ELEMENT)
-bool HTMLPreloadScanner::processPossibleTemplateTag(const AtomicString& tagName, const HTMLToken& token)
-{
-    if (isStartOrEndTag(token) && tagName == templateTag) {
-        if (isStartTag(token))
-            m_templateCount++;
-        else
-            m_templateCount--;
-        return true; // Twas our token.
+        if (m_templateCount)
+            return;
+#endif
+        TagId tagId = tagIdFor(token.name());
+#if ENABLE(TEMPLATE_ELEMENT)
+        if (tagId == TagId::Template) {
+            ++m_templateCount;
+            return;
+        }
+#endif
+        if (tagId == TagId::Style) {
+            m_inStyle = true;
+            return;
+        }
+        if (tagId == TagId::Base) {
+            // The first <base> element is the one that wins.
+            if (!m_predictedBaseElementURL.isEmpty())
+                return;
+            updatePredictedBaseURL(token);
+            return;
+        }
+
+        StartTagScanner scanner(tagId, m_deviceScaleFactor);
+        scanner.processAttributes(token.attributes(), document);
+        if (auto request = scanner.createPreloadRequest(m_predictedBaseElementURL))
+            requests.append(WTFMove(request));
+        return;
+    }
+
+    default:
+        return;
     }
-    // If we're in a template we "consume" all tokens.
-    return m_templateCount > 0;
 }
-#endif
 
-bool HTMLPreloadScanner::processPossibleStyleTag(const AtomicString& tagName, const HTMLToken& token)
+void TokenPreloadScanner::updatePredictedBaseURL(const HTMLToken& token)
 {
-    ASSERT(isStartOrEndTag(token));
-    if (tagName == styleTag) {
-        m_inStyle = isStartTag(token);
-        if (!m_inStyle)
-            m_cssScanner.reset();
-        return true;
-    }
-    return false;
+    ASSERT(m_predictedBaseElementURL.isEmpty());
+    if (auto* hrefAttribute = findAttribute(token.attributes(), hrefAttr.localName().string()))
+        m_predictedBaseElementURL = URL(m_documentURL, stripLeadingAndTrailingHTMLSpaces(StringImpl::create8BitIfPossible(hrefAttribute->value))).isolatedCopy();
 }
 
-bool HTMLPreloadScanner::processPossibleBaseTag(const AtomicString& tagName, const HTMLToken& token)
+HTMLPreloadScanner::HTMLPreloadScanner(const HTMLParserOptions& options, const URL& documentURL, float deviceScaleFactor)
+    : m_scanner(documentURL, deviceScaleFactor)
+    , m_tokenizer(options)
 {
-    ASSERT(isStartTag(token));
-    if (tagName == baseTag) {
-        // The first <base> element is the one that wins.
-        if (!m_predictedBaseElementURL.isEmpty())
-            return true;
-
-        for (HTMLToken::AttributeList::const_iterator iter = token.attributes().begin(); iter != token.attributes().end(); ++iter) {
-            AtomicString attributeName(iter->name);
-            if (attributeName == hrefAttr) {
-                String hrefValue = StringImpl::create8BitIfPossible(iter->value);
-                m_predictedBaseElementURL = KURL(m_documentURL, stripLeadingAndTrailingHTMLSpaces(hrefValue));
-                break;
-            }
-        }
-        return true;
-    }
-    return false;
 }
 
-void HTMLPreloadScanner::processToken(const HTMLToken& token, Vector<OwnPtr<PreloadRequest> >& requests)
+void HTMLPreloadScanner::appendToEnd(const SegmentedString& source)
 {
-    // <style> is the only place we search for urls in non-start/end-tag tokens.
-    if (m_inStyle) {
-        if (token.type() != HTMLToken::Character)
-            return;
-        return m_cssScanner.scan(token, requests);
+    m_source.append(source);
+}
+
+void HTMLPreloadScanner::scan(HTMLResourcePreloader& preloader, Document& document)
+{
+    ASSERT(isMainThread()); // HTMLTokenizer::updateStateFor only works on the main thread.
+
+    const URL& startingBaseElementURL = document.baseElementURL();
+
+    // When we start scanning, our best prediction of the baseElementURL is the real one!
+    if (!startingBaseElementURL.isEmpty())
+        m_scanner.setPredictedBaseElementURL(startingBaseElementURL);
+
+    PreloadRequestStream requests;
+
+    while (auto token = m_tokenizer.nextToken(m_source)) {
+        if (token->type() == HTMLToken::StartTag)
+            m_tokenizer.updateStateFor(AtomicString(token->name()));
+        m_scanner.scan(*token, requests, document);
     }
-    if (!isStartOrEndTag(token))
-        return;
 
-    AtomicString tagName(token.name());
-#if ENABLE(TEMPLATE_ELEMENT)
-    if (processPossibleTemplateTag(tagName, token))
-        return;
-#endif
-    if (processPossibleStyleTag(tagName, token))
-        return;
-    if (!isStartTag(token))
-        return;
-    if (processPossibleBaseTag(tagName, token))
-        return;
+    preloader.preload(WTFMove(requests));
+}
 
-    StartTagScanner scanner(tagName, token.attributes());
-    OwnPtr<PreloadRequest> request =  scanner.createPreloadRequest(m_predictedBaseElementURL);
-    if (request)
-        requests.append(request.release());
+bool testPreloadScannerViewportSupport(Document* document)
+{
+    ASSERT(document);
+    HTMLParserOptions options(*document);
+    HTMLPreloadScanner scanner(options, document->url());
+    HTMLResourcePreloader preloader(*document);
+    scanner.appendToEnd(String("<meta name=viewport content='width=400'>"));
+    scanner.scan(preloader, *document);
+    return (document->viewportArguments().width == 400);
 }
 
 }