d1190b9bfbea1b03f938a1eb6a6edec31eea3760
[WebKit-https.git] / Source / WebCore / loader / DocumentLoader.cpp
1 /*
2  * Copyright (C) 2006, 2007, 2008 Apple Inc. All rights reserved.
3  * Copyright (C) 2011 Google Inc. All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  *
9  * 1.  Redistributions of source code must retain the above copyright
10  *     notice, this list of conditions and the following disclaimer. 
11  * 2.  Redistributions in binary form must reproduce the above copyright
12  *     notice, this list of conditions and the following disclaimer in the
13  *     documentation and/or other materials provided with the distribution. 
14  * 3.  Neither the name of Apple Computer, Inc. ("Apple") nor the names of
15  *     its contributors may be used to endorse or promote products derived
16  *     from this software without specific prior written permission. 
17  *
18  * THIS SOFTWARE IS PROVIDED BY APPLE AND ITS CONTRIBUTORS "AS IS" AND ANY
19  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
20  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
21  * DISCLAIMED. IN NO EVENT SHALL APPLE OR ITS CONTRIBUTORS BE LIABLE FOR ANY
22  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
23  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
24  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
25  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
26  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
27  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
28  */
29
30 #include "config.h"
31 #include "DocumentLoader.h"
32
33 #include "ApplicationCacheHost.h"
34 #include "ArchiveResourceCollection.h"
35 #include "CachedPage.h"
36 #include "CachedResourceLoader.h"
37 #include "DOMWindow.h"
38 #include "Document.h"
39 #include "DocumentParser.h"
40 #include "DocumentWriter.h"
41 #include "Event.h"
42 #include "FormState.h"
43 #include "Frame.h"
44 #include "FrameLoader.h"
45 #include "FrameLoaderClient.h"
46 #include "FrameTree.h"
47 #include "HTMLFormElement.h"
48 #include "HTMLFrameOwnerElement.h"
49 #include "HistoryItem.h"
50 #include "InspectorInstrumentation.h"
51 #include "Logging.h"
52 #include "MemoryCache.h"
53 #include "Page.h"
54 #include "ProgressTracker.h"
55 #include "ResourceBuffer.h"
56 #include "SchemeRegistry.h"
57 #include "SecurityPolicy.h"
58 #include "Settings.h"
59 #include "SubresourceLoader.h"
60 #include "TextResourceDecoder.h"
61 #include "WebCoreMemoryInstrumentation.h"
62 #include <wtf/Assertions.h>
63 #include <wtf/MemoryInstrumentationHashMap.h>
64 #include <wtf/MemoryInstrumentationHashSet.h>
65 #include <wtf/MemoryInstrumentationVector.h>
66 #include <wtf/text/CString.h>
67 #include <wtf/text/WTFString.h>
68 #include <wtf/unicode/Unicode.h>
69
70 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
71 #include "ArchiveFactory.h"
72 #endif
73
74 #if USE(CONTENT_FILTERING)
75 #include "ContentFilter.h"
76 #endif
77
78 namespace WebCore {
79
80 static void cancelAll(const ResourceLoaderSet& loaders)
81 {
82     Vector<RefPtr<ResourceLoader> > loadersCopy;
83     copyToVector(loaders, loadersCopy);
84     size_t size = loadersCopy.size();
85     for (size_t i = 0; i < size; ++i)
86         loadersCopy[i]->cancel();
87 }
88
89 static void setAllDefersLoading(const ResourceLoaderSet& loaders, bool defers)
90 {
91     Vector<RefPtr<ResourceLoader> > loadersCopy;
92     copyToVector(loaders, loadersCopy);
93     size_t size = loadersCopy.size();
94     for (size_t i = 0; i < size; ++i)
95         loadersCopy[i]->setDefersLoading(defers);
96 }
97
98 DocumentLoader::DocumentLoader(const ResourceRequest& req, const SubstituteData& substituteData)
99     : m_deferMainResourceDataLoad(true)
100     , m_frame(0)
101     , m_cachedResourceLoader(CachedResourceLoader::create(this))
102     , m_writer(m_frame)
103     , m_originalRequest(req)
104     , m_substituteData(substituteData)
105     , m_originalRequestCopy(req)
106     , m_request(req)
107     , m_originalSubstituteDataWasValid(substituteData.isValid())
108     , m_committed(false)
109     , m_isStopping(false)
110     , m_gotFirstByte(false)
111     , m_isClientRedirect(false)
112     , m_isLoadingMultipartContent(false)
113     , m_wasOnloadHandled(false)
114     , m_stopRecordingResponses(false)
115     , m_substituteResourceDeliveryTimer(this, &DocumentLoader::substituteResourceDeliveryTimerFired)
116     , m_didCreateGlobalHistoryEntry(false)
117     , m_loadingMainResource(false)
118     , m_timeOfLastDataReceived(0.0)
119     , m_identifierForLoadWithoutResourceLoader(0)
120     , m_dataLoadTimer(this, &DocumentLoader::handleSubstituteDataLoadNow)
121     , m_waitingForContentPolicy(false)
122     , m_applicationCacheHost(adoptPtr(new ApplicationCacheHost(this)))
123 {
124 }
125
126 FrameLoader* DocumentLoader::frameLoader() const
127 {
128     if (!m_frame)
129         return 0;
130     return m_frame->loader();
131 }
132
133 ResourceLoader* DocumentLoader::mainResourceLoader() const
134 {
135     return m_mainResource ? m_mainResource->loader() : 0;
136 }
137
138 DocumentLoader::~DocumentLoader()
139 {
140     ASSERT(!m_frame || frameLoader()->activeDocumentLoader() != this || !isLoading());
141     if (m_iconLoadDecisionCallback)
142         m_iconLoadDecisionCallback->invalidate();
143     if (m_iconDataCallback)
144         m_iconDataCallback->invalidate();
145     m_cachedResourceLoader->clearDocumentLoader();
146     
147     if (m_mainResource) {
148         m_mainResource->removeClient(this);
149         m_mainResource = 0;
150     }
151 }
152
153 PassRefPtr<ResourceBuffer> DocumentLoader::mainResourceData() const
154 {
155     if (m_substituteData.isValid())
156         return ResourceBuffer::create(m_substituteData.content()->data(), m_substituteData.content()->size());
157     if (m_mainResource)
158         return m_mainResource->resourceBuffer();
159     return 0;
160 }
161
162 Document* DocumentLoader::document() const
163 {
164     if (m_frame && m_frame->loader()->documentLoader() == this)
165         return m_frame->document();
166     return 0;
167 }
168
169 const ResourceRequest& DocumentLoader::originalRequest() const
170 {
171     return m_originalRequest;
172 }
173
174 const ResourceRequest& DocumentLoader::originalRequestCopy() const
175 {
176     return m_originalRequestCopy;
177 }
178
179 const ResourceRequest& DocumentLoader::request() const
180 {
181     return m_request;
182 }
183
184 ResourceRequest& DocumentLoader::request()
185 {
186     return m_request;
187 }
188
189 const KURL& DocumentLoader::url() const
190 {
191     return request().url();
192 }
193
194 void DocumentLoader::replaceRequestURLForSameDocumentNavigation(const KURL& url)
195 {
196     m_originalRequestCopy.setURL(url);
197     m_request.setURL(url);
198 }
199
200 void DocumentLoader::setRequest(const ResourceRequest& req)
201 {
202     // Replacing an unreachable URL with alternate content looks like a server-side
203     // redirect at this point, but we can replace a committed dataSource.
204     bool handlingUnreachableURL = false;
205
206     handlingUnreachableURL = m_substituteData.isValid() && !m_substituteData.failingURL().isEmpty();
207
208     if (handlingUnreachableURL)
209         m_committed = false;
210
211     // We should never be getting a redirect callback after the data
212     // source is committed, except in the unreachable URL case. It 
213     // would be a WebFoundation bug if it sent a redirect callback after commit.
214     ASSERT(!m_committed);
215
216     m_request = req;
217 }
218
219 void DocumentLoader::setMainDocumentError(const ResourceError& error)
220 {
221     m_mainDocumentError = error;    
222     frameLoader()->client()->setMainDocumentError(this, error);
223 }
224
225 void DocumentLoader::mainReceivedError(const ResourceError& error)
226 {
227     ASSERT(!error.isNull());
228     if (m_applicationCacheHost->maybeLoadFallbackForMainError(request(), error))
229         return;
230
231     if (m_identifierForLoadWithoutResourceLoader) {
232         ASSERT(!mainResourceLoader());
233         frameLoader()->client()->dispatchDidFailLoading(this, m_identifierForLoadWithoutResourceLoader, error);
234     }
235
236     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
237     // See <rdar://problem/6304600> for more details.
238 #if !USE(CF)
239     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
240 #endif
241
242     m_applicationCacheHost->failedLoadingMainResource();
243
244     if (!frameLoader())
245         return;
246     setMainDocumentError(error);
247     clearMainResourceLoader();
248     frameLoader()->receivedMainResourceError(error);
249 }
250
251 // Cancels the data source's pending loads.  Conceptually, a data source only loads
252 // one document at a time, but one document may have many related resources. 
253 // stopLoading will stop all loads initiated by the data source, 
254 // but not loads initiated by child frames' data sources -- that's the WebFrame's job.
255 void DocumentLoader::stopLoading()
256 {
257     RefPtr<Frame> protectFrame(m_frame);
258     RefPtr<DocumentLoader> protectLoader(this);
259
260     // In some rare cases, calling FrameLoader::stopLoading could cause isLoading() to return false.
261     // (This can happen when there's a single XMLHttpRequest currently loading and stopLoading causes it
262     // to stop loading. Because of this, we need to save it so we don't return early.
263     bool loading = isLoading();
264     
265     if (m_committed) {
266         // Attempt to stop the frame if the document loader is loading, or if it is done loading but
267         // still  parsing. Failure to do so can cause a world leak.
268         Document* doc = m_frame->document();
269         
270         if (loading || doc->parsing())
271             m_frame->loader()->stopLoading(UnloadEventPolicyNone);
272     }
273
274     // Always cancel multipart loaders
275     cancelAll(m_multipartSubresourceLoaders);
276
277     // Appcache uses ResourceHandle directly, DocumentLoader doesn't count these loads.
278     m_applicationCacheHost->stopLoadingInFrame(m_frame);
279     
280 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
281     clearArchiveResources();
282 #endif
283
284     if (!loading) {
285         // If something above restarted loading we might run into mysterious crashes like 
286         // https://bugs.webkit.org/show_bug.cgi?id=62764 and <rdar://problem/9328684>
287         ASSERT(!isLoading());
288         return;
289     }
290
291     // We might run in to infinite recursion if we're stopping loading as the result of 
292     // detaching from the frame, so break out of that recursion here.
293     // See <rdar://problem/9673866> for more details.
294     if (m_isStopping)
295         return;
296
297     m_isStopping = true;
298
299     FrameLoader* frameLoader = DocumentLoader::frameLoader();
300     
301     if (isLoadingMainResource())
302         // Stop the main resource loader and let it send the cancelled message.
303         cancelMainResourceLoad(frameLoader->cancelledError(m_request));
304     else if (!m_subresourceLoaders.isEmpty())
305         // The main resource loader already finished loading. Set the cancelled error on the 
306         // document and let the subresourceLoaders send individual cancelled messages below.
307         setMainDocumentError(frameLoader->cancelledError(m_request));
308     else
309         // If there are no resource loaders, we need to manufacture a cancelled message.
310         // (A back/forward navigation has no resource loaders because its resources are cached.)
311         mainReceivedError(frameLoader->cancelledError(m_request));
312     
313     stopLoadingSubresources();
314     stopLoadingPlugIns();
315     
316     m_isStopping = false;
317 }
318
319 void DocumentLoader::commitIfReady()
320 {
321     if (!m_committed) {
322         m_committed = true;
323         frameLoader()->commitProvisionalLoad();
324     }
325 }
326
327 bool DocumentLoader::isLoading() const
328 {
329     // FIXME: This should always be enabled, but it seems to cause
330     // http/tests/security/feed-urls-from-remote.html to timeout on Mac WK1
331     // see http://webkit.org/b/110554 and http://webkit.org/b/110401
332 #if ENABLE(THREADED_HTML_PARSER)
333     if (document() && document()->hasActiveParser())
334         return true;
335 #endif
336     return isLoadingMainResource() || !m_subresourceLoaders.isEmpty() || !m_plugInStreamLoaders.isEmpty();
337 }
338
339 void DocumentLoader::notifyFinished(CachedResource* resource)
340 {
341     ASSERT_UNUSED(resource, m_mainResource == resource);
342     ASSERT(m_mainResource);
343     if (!m_mainResource->errorOccurred() && !m_mainResource->wasCanceled()) {
344         finishedLoading(m_mainResource->loadFinishTime());
345         return;
346     }
347
348     // FIXME: we should fix the design to eliminate the need for a platform ifdef here
349 #if !PLATFORM(CHROMIUM)
350     if (m_request.cachePolicy() == ReturnCacheDataDontLoad && !m_mainResource->wasCanceled()) {
351         frameLoader()->retryAfterFailedCacheOnlyMainResourceLoad();
352         return;
353     }
354 #endif
355
356     mainReceivedError(m_mainResource->resourceError());
357 }
358
359 void DocumentLoader::finishedLoading(double finishTime)
360 {
361     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
362     // See <rdar://problem/6304600> for more details.
363 #if !USE(CF)
364     ASSERT(!m_frame->page()->defersLoading() || InspectorInstrumentation::isDebuggerPaused(m_frame));
365 #endif
366
367     RefPtr<DocumentLoader> protect(this);
368
369     if (m_identifierForLoadWithoutResourceLoader) {
370         frameLoader()->notifier()->dispatchDidFinishLoading(this, m_identifierForLoadWithoutResourceLoader, finishTime);
371         m_identifierForLoadWithoutResourceLoader = 0;
372     }
373
374 #if USE(CONTENT_FILTERING)
375     if (m_contentFilter && m_contentFilter->needsMoreData()) {
376         m_contentFilter->finishedAddingData();
377         int length;
378         const char* data = m_contentFilter->getReplacementData(length);
379         if (data)
380             dataReceived(m_mainResource.get(), data, length);
381     }
382 #endif
383
384     maybeFinishLoadingMultipartContent();
385
386     double responseEndTime = finishTime;
387     if (!responseEndTime)
388         responseEndTime = m_timeOfLastDataReceived;
389     if (!responseEndTime)
390         responseEndTime = monotonicallyIncreasingTime();
391     timing()->setResponseEnd(responseEndTime);
392
393     commitIfReady();
394     if (!frameLoader())
395         return;
396
397     if (!maybeCreateArchive()) {
398         // If this is an empty document, it will not have actually been created yet. Commit dummy data so that
399         // DocumentWriter::begin() gets called and creates the Document.
400         if (!m_gotFirstByte)
401             commitData(0, 0);
402         frameLoader()->client()->finishedLoading(this);
403     }
404
405     m_writer.end();
406     if (!m_mainDocumentError.isNull())
407         return;
408     clearMainResourceLoader();
409     if (!frameLoader()->stateMachine()->creatingInitialEmptyDocument())
410         frameLoader()->checkLoadComplete();
411
412     // If the document specified an application cache manifest, it violates the author's intent if we store it in the memory cache
413     // and deny the appcache the chance to intercept it in the future, so remove from the memory cache.
414     if (m_frame) {
415         if (m_mainResource && m_frame->document()->hasManifest())
416             memoryCache()->remove(m_mainResource.get());
417     }
418     m_applicationCacheHost->finishedLoadingMainResource();
419 }
420
421 bool DocumentLoader::isPostOrRedirectAfterPost(const ResourceRequest& newRequest, const ResourceResponse& redirectResponse)
422 {
423     if (newRequest.httpMethod() == "POST")
424         return true;
425
426     int status = redirectResponse.httpStatusCode();
427     if (((status >= 301 && status <= 303) || status == 307)
428         && m_originalRequest.httpMethod() == "POST")
429         return true;
430
431     return false;
432 }
433
434 void DocumentLoader::handleSubstituteDataLoadNow(DocumentLoaderTimer*)
435 {
436     KURL url = m_substituteData.responseURL();
437     if (url.isEmpty())
438         url = m_request.url();
439     ResourceResponse response(url, m_substituteData.mimeType(), m_substituteData.content()->size(), m_substituteData.textEncoding(), "");
440     responseReceived(0, response);
441 }
442
443 void DocumentLoader::startDataLoadTimer()
444 {
445     m_dataLoadTimer.startOneShot(0);
446
447 #if HAVE(RUNLOOP_TIMER)
448     if (SchedulePairHashSet* scheduledPairs = m_frame->page()->scheduledRunLoopPairs())
449         m_dataLoadTimer.schedule(*scheduledPairs);
450 #endif
451 }
452
453 void DocumentLoader::handleSubstituteDataLoadSoon()
454 {
455     if (deferMainResourceDataLoad())
456         startDataLoadTimer();
457     else
458         handleSubstituteDataLoadNow(0);
459 }
460
461 void DocumentLoader::redirectReceived(CachedResource* resource, ResourceRequest& request, const ResourceResponse& redirectResponse)
462 {
463     ASSERT_UNUSED(resource, resource == m_mainResource);
464     willSendRequest(request, redirectResponse);
465 }
466
467 void DocumentLoader::willSendRequest(ResourceRequest& newRequest, const ResourceResponse& redirectResponse)
468 {
469     // Note that there are no asserts here as there are for the other callbacks. This is due to the
470     // fact that this "callback" is sent when starting every load, and the state of callback
471     // deferrals plays less of a part in this function in preventing the bad behavior deferring 
472     // callbacks is meant to prevent.
473     ASSERT(!newRequest.isNull());
474
475     if (!frameLoader()->checkIfFormActionAllowedByCSP(newRequest.url())) {
476         cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
477         return;
478     }
479
480     ASSERT(timing()->fetchStart());
481     if (!redirectResponse.isNull()) {
482         // If the redirecting url is not allowed to display content from the target origin,
483         // then block the redirect.
484         RefPtr<SecurityOrigin> redirectingOrigin = SecurityOrigin::create(redirectResponse.url());
485         if (!redirectingOrigin->canDisplay(newRequest.url())) {
486             FrameLoader::reportLocalLoadFailed(m_frame, newRequest.url().string());
487             cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
488             return;
489         }
490         timing()->addRedirect(redirectResponse.url(), newRequest.url());
491     }
492
493     // Update cookie policy base URL as URL changes, except for subframes, which use the
494     // URL of the main frame which doesn't change when we redirect.
495     if (frameLoader()->isLoadingMainFrame())
496         newRequest.setFirstPartyForCookies(newRequest.url());
497
498     // If we're fielding a redirect in response to a POST, force a load from origin, since
499     // this is a common site technique to return to a page viewing some data that the POST
500     // just modified.
501     // Also, POST requests always load from origin, but this does not affect subresources.
502     if (newRequest.cachePolicy() == UseProtocolCachePolicy && isPostOrRedirectAfterPost(newRequest, redirectResponse))
503         newRequest.setCachePolicy(ReloadIgnoringCacheData);
504
505     Frame* top = m_frame->tree()->top();
506     if (top != m_frame) {
507         if (!frameLoader()->mixedContentChecker()->canDisplayInsecureContent(top->document()->securityOrigin(), newRequest.url())) {
508             cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
509             return;
510         }
511     }
512
513     setRequest(newRequest);
514
515     if (!redirectResponse.isNull()) {
516         // We checked application cache for initial URL, now we need to check it for redirected one.
517         ASSERT(!m_substituteData.isValid());
518         m_applicationCacheHost->maybeLoadMainResourceForRedirect(newRequest, m_substituteData);
519         if (m_substituteData.isValid())
520             m_identifierForLoadWithoutResourceLoader = mainResourceLoader()->identifier();
521     }
522
523     // FIXME: Ideally we'd stop the I/O until we hear back from the navigation policy delegate
524     // listener. But there's no way to do that in practice. So instead we cancel later if the
525     // listener tells us to. In practice that means the navigation policy needs to be decided
526     // synchronously for these redirect cases.
527     if (!redirectResponse.isNull())
528         frameLoader()->policyChecker()->checkNavigationPolicy(newRequest, callContinueAfterNavigationPolicy, this);
529 }
530
531 void DocumentLoader::callContinueAfterNavigationPolicy(void* argument, const ResourceRequest& request, PassRefPtr<FormState>, bool shouldContinue)
532 {
533     static_cast<DocumentLoader*>(argument)->continueAfterNavigationPolicy(request, shouldContinue);
534 }
535
536 void DocumentLoader::continueAfterNavigationPolicy(const ResourceRequest&, bool shouldContinue)
537 {
538     if (!shouldContinue)
539         stopLoadingForPolicyChange();
540     else if (m_substituteData.isValid()) {
541         // A redirect resulted in loading substitute data.
542         ASSERT(timing()->redirectCount());
543
544         // We need to remove our reference to the CachedResource in favor of a SubstituteData load.
545         // This will probably trigger the cancellation of the CachedResource's underlying ResourceLoader, though there is a
546         // small chance that the resource is being loaded by a different Frame, preventing the ResourceLoader from being cancelled.
547         // If the ResourceLoader is indeed cancelled, it would normally send resource load callbacks.
548         // However, from an API perspective, this isn't a cancellation. Therefore, sever our relationship with the network load,
549         // but prevent the ResourceLoader from sending ResourceLoadNotifier callbacks.
550         RefPtr<ResourceLoader> resourceLoader = mainResourceLoader();
551         ASSERT(resourceLoader->shouldSendResourceLoadCallbacks());
552         resourceLoader->setSendCallbackPolicy(DoNotSendCallbacks);
553         if (m_mainResource) {
554             m_mainResource->removeClient(this);
555             m_mainResource = 0;
556         }
557         resourceLoader->setSendCallbackPolicy(SendCallbacks);
558         handleSubstituteDataLoadSoon();
559     }
560 }
561
562 void DocumentLoader::responseReceived(CachedResource* resource, const ResourceResponse& response)
563 {
564     ASSERT_UNUSED(resource, m_mainResource == resource);
565     RefPtr<DocumentLoader> protect(this);
566     bool willLoadFallback = m_applicationCacheHost->maybeLoadFallbackForMainResponse(request(), response);
567
568     // The memory cache doesn't understand the application cache or its caching rules. So if a main resource is served
569     // from the application cache, ensure we don't save the result for future use.
570     bool shouldRemoveResourceFromCache = willLoadFallback;
571 #if PLATFORM(CHROMIUM)
572     // chromium's ApplicationCacheHost implementation always returns true for maybeLoadFallbackForMainResponse(). However, all responses loaded
573     // from appcache will have a non-zero appCacheID().
574     if (response.appCacheID())
575         shouldRemoveResourceFromCache = true;
576 #endif
577     if (shouldRemoveResourceFromCache)
578         memoryCache()->remove(m_mainResource.get());
579
580     if (willLoadFallback)
581         return;
582
583     DEFINE_STATIC_LOCAL(AtomicString, xFrameOptionHeader, ("x-frame-options", AtomicString::ConstructFromLiteral));
584     HTTPHeaderMap::const_iterator it = response.httpHeaderFields().find(xFrameOptionHeader);
585     if (it != response.httpHeaderFields().end()) {
586         String content = it->value;
587         ASSERT(m_mainResource);
588         unsigned long identifier = m_identifierForLoadWithoutResourceLoader ? m_identifierForLoadWithoutResourceLoader : m_mainResource->identifier();
589         ASSERT(identifier);
590         if (frameLoader()->shouldInterruptLoadForXFrameOptions(content, response.url(), identifier)) {
591             InspectorInstrumentation::continueAfterXFrameOptionsDenied(m_frame, this, identifier, response);
592             String message = "Refused to display '" + response.url().elidedString() + "' in a frame because it set 'X-Frame-Options' to '" + content + "'.";
593             frame()->document()->addConsoleMessage(SecurityMessageSource, ErrorMessageLevel, message, identifier);
594             if (HTMLFrameOwnerElement* ownerElement = frame()->ownerElement())
595                 ownerElement->dispatchEvent(Event::create(eventNames().loadEvent, false, false));
596             cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
597             return;
598         }
599     }
600
601     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
602     // See <rdar://problem/6304600> for more details.
603 #if !USE(CF)
604     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
605 #endif
606
607     if (m_isLoadingMultipartContent) {
608         setupForReplace();
609         m_mainResource->clear();
610     } else if (response.isMultipart()) {
611         FeatureObserver::observe(m_frame->document(), FeatureObserver::MultipartMainResource);
612         m_isLoadingMultipartContent = true;
613     }
614
615     setResponse(response);
616
617     if (m_identifierForLoadWithoutResourceLoader)
618         frameLoader()->notifier()->dispatchDidReceiveResponse(this, m_identifierForLoadWithoutResourceLoader, m_response, 0);
619
620     ASSERT(!m_waitingForContentPolicy);
621     m_waitingForContentPolicy = true;
622
623     // Always show content with valid substitute data.
624     if (m_substituteData.isValid()) {
625         continueAfterContentPolicy(PolicyUse);
626         return;
627     }
628
629 #if ENABLE(FTPDIR)
630     // Respect the hidden FTP Directory Listing pref so it can be tested even if the policy delegate might otherwise disallow it
631     Settings* settings = m_frame->settings();
632     if (settings && settings->forceFTPDirectoryListings() && m_response.mimeType() == "application/x-ftp-directory") {
633         continueAfterContentPolicy(PolicyUse);
634         return;
635     }
636 #endif
637
638 #if USE(CONTENT_FILTERING)
639     if (response.url().protocolIs("https") && ContentFilter::isEnabled())
640         m_contentFilter = ContentFilter::create(response);
641 #endif
642
643     frameLoader()->policyChecker()->checkContentPolicy(m_response, callContinueAfterContentPolicy, this);
644 }
645
646 void DocumentLoader::callContinueAfterContentPolicy(void* argument, PolicyAction policy)
647 {
648     static_cast<DocumentLoader*>(argument)->continueAfterContentPolicy(policy);
649 }
650
651 void DocumentLoader::continueAfterContentPolicy(PolicyAction policy)
652 {
653     ASSERT(m_waitingForContentPolicy);
654     m_waitingForContentPolicy = false;
655     if (isStopping())
656         return;
657
658     KURL url = m_request.url();
659     const String& mimeType = m_response.mimeType();
660     
661     switch (policy) {
662     case PolicyUse: {
663         // Prevent remote web archives from loading because they can claim to be from any domain and thus avoid cross-domain security checks (4120255).
664         bool isRemoteWebArchive = (equalIgnoringCase("application/x-webarchive", mimeType)
665 #if PLATFORM(GTK)
666             || equalIgnoringCase("message/rfc822", mimeType)
667 #endif
668             || equalIgnoringCase("multipart/related", mimeType))
669             && !m_substituteData.isValid() && !SchemeRegistry::shouldTreatURLSchemeAsLocal(url.protocol());
670         if (!frameLoader()->client()->canShowMIMEType(mimeType) || isRemoteWebArchive) {
671             frameLoader()->policyChecker()->cannotShowMIMEType(m_response);
672             // Check reachedTerminalState since the load may have already been canceled inside of _handleUnimplementablePolicyWithErrorCode::.
673             stopLoadingForPolicyChange();
674             return;
675         }
676         break;
677     }
678
679     case PolicyDownload: {
680         // m_mainResource can be null, e.g. when loading a substitute resource from application cache.
681         if (!m_mainResource) {
682             mainReceivedError(frameLoader()->client()->cannotShowURLError(m_request));
683             return;
684         }
685         InspectorInstrumentation::continueWithPolicyDownload(m_frame, this, mainResourceLoader()->identifier(), m_response);
686
687         // When starting the request, we didn't know that it would result in download and not navigation. Now we know that main document URL didn't change.
688         // Download may use this knowledge for purposes unrelated to cookies, notably for setting file quarantine data.
689         frameLoader()->setOriginalURLForDownloadRequest(m_request);
690         frameLoader()->client()->convertMainResourceLoadToDownload(this, m_request, m_response);
691
692         // It might have gone missing
693         if (mainResourceLoader())
694             mainResourceLoader()->didFail(interruptedForPolicyChangeError());
695         return;
696     }
697     case PolicyIgnore:
698         InspectorInstrumentation::continueWithPolicyIgnore(m_frame, this, mainResourceLoader()->identifier(), m_response);
699         stopLoadingForPolicyChange();
700         return;
701     
702     default:
703         ASSERT_NOT_REACHED();
704     }
705
706     if (m_response.isHTTP()) {
707         int status = m_response.httpStatusCode();
708         if (status < 200 || status >= 300) {
709             bool hostedByObject = frameLoader()->isHostedByObjectElement();
710
711             frameLoader()->handleFallbackContent();
712             // object elements are no longer rendered after we fallback, so don't
713             // keep trying to process data from their load
714
715             if (hostedByObject)
716                 cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
717         }
718     }
719
720     if (!isStopping() && m_substituteData.isValid()) {
721         if (m_substituteData.content()->size())
722             dataReceived(0, m_substituteData.content()->data(), m_substituteData.content()->size());
723         if (isLoadingMainResource())
724             finishedLoading(0);
725     }
726 }
727
728 void DocumentLoader::commitLoad(const char* data, int length)
729 {
730     // Both unloading the old page and parsing the new page may execute JavaScript which destroys the datasource
731     // by starting a new load, so retain temporarily.
732     RefPtr<Frame> protectFrame(m_frame);
733     RefPtr<DocumentLoader> protectLoader(this);
734
735     commitIfReady();
736     FrameLoader* frameLoader = DocumentLoader::frameLoader();
737     if (!frameLoader)
738         return;
739 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
740     if (ArchiveFactory::isArchiveMimeType(response().mimeType()))
741         return;
742 #endif
743     frameLoader->client()->committedLoad(this, data, length);
744 }
745
746 ResourceError DocumentLoader::interruptedForPolicyChangeError() const
747 {
748     return frameLoader()->client()->interruptedForPolicyChangeError(request());
749 }
750
751 void DocumentLoader::stopLoadingForPolicyChange()
752 {
753     ResourceError error = interruptedForPolicyChangeError();
754     error.setIsCancellation(true);
755     cancelMainResourceLoad(error);
756 }
757
758 void DocumentLoader::commitData(const char* bytes, size_t length)
759 {
760     if (!m_gotFirstByte) {
761         m_gotFirstByte = true;
762         m_writer.begin(documentURL(), false);
763         m_writer.setDocumentWasLoadedAsPartOfNavigation();
764
765         if (SecurityPolicy::allowSubstituteDataAccessToLocal() && m_originalSubstituteDataWasValid) {
766             // If this document was loaded with substituteData, then the document can
767             // load local resources. See https://bugs.webkit.org/show_bug.cgi?id=16756
768             // and https://bugs.webkit.org/show_bug.cgi?id=19760 for further
769             // discussion.
770             m_frame->document()->securityOrigin()->grantLoadLocalResources();
771         }
772
773         if (frameLoader()->stateMachine()->creatingInitialEmptyDocument())
774             return;
775         
776 #if ENABLE(MHTML)
777         // The origin is the MHTML file, we need to set the base URL to the document encoded in the MHTML so
778         // relative URLs are resolved properly.
779         if (m_archive && m_archive->type() == Archive::MHTML)
780             m_frame->document()->setBaseURLOverride(m_archive->mainResource()->url());
781 #endif
782
783         // Call receivedFirstData() exactly once per load. We should only reach this point multiple times
784         // for multipart loads, and FrameLoader::isReplacing() will be true after the first time.
785         if (!isMultipartReplacingLoad())
786             frameLoader()->receivedFirstData();
787
788         bool userChosen = true;
789         String encoding = overrideEncoding();
790         if (encoding.isNull()) {
791             userChosen = false;
792             encoding = response().textEncodingName();
793 #if ENABLE(WEB_ARCHIVE)
794             if (m_archive && m_archive->type() == Archive::WebArchive)
795                 encoding = m_archive->mainResource()->textEncoding();
796 #endif
797         }
798         m_writer.setEncoding(encoding, userChosen);
799     }
800     ASSERT(m_frame->document()->parsing());
801     m_writer.addData(bytes, length);
802 }
803
804 void DocumentLoader::reportMemoryUsage(MemoryObjectInfo* memoryObjectInfo) const
805 {
806     MemoryClassInfo info(memoryObjectInfo, this, WebCoreMemoryTypes::Loader);
807     info.addMember(m_frame, "frame");
808     info.addMember(m_cachedResourceLoader, "cachedResourceLoader");
809     info.addMember(m_mainResource, "mainResource");
810     info.addMember(m_subresourceLoaders, "subresourceLoaders");
811     info.addMember(m_multipartSubresourceLoaders, "multipartSubresourceLoaders");
812     info.addMember(m_plugInStreamLoaders, "plugInStreamLoaders");
813     info.addMember(m_substituteData, "substituteData");
814     info.addMember(m_pageTitle.string(), "pageTitle.string()");
815     info.addMember(m_overrideEncoding, "overrideEncoding");
816     info.addMember(m_responses, "responses");
817     info.addMember(m_originalRequest, "originalRequest");
818     info.addMember(m_originalRequestCopy, "originalRequestCopy");
819     info.addMember(m_request, "request");
820     info.addMember(m_response, "response");
821     info.addMember(m_lastCheckedRequest, "lastCheckedRequest");
822     info.addMember(m_responses, "responses");
823     info.addMember(m_pendingSubstituteResources, "pendingSubstituteResources");
824     info.addMember(m_substituteResourceDeliveryTimer, "substituteResourceDeliveryTimer");
825     info.addMember(m_archiveResourceCollection, "archiveResourceCollection");
826 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
827     info.addMember(m_archive, "archive");
828     info.addMember(m_parsedArchiveData, "parsedArchiveData");
829 #endif
830     info.addMember(m_resourcesClientKnowsAbout, "resourcesClientKnowsAbout");
831     info.addMember(m_resourcesLoadedFromMemoryCacheForClientNotification, "resourcesLoadedFromMemoryCacheForClientNotification");
832     info.addMember(m_clientRedirectSourceForHistory, "clientRedirectSourceForHistory");
833     info.addMember(m_iconLoadDecisionCallback, "iconLoadDecisionCallback");
834     info.addMember(m_iconDataCallback, "iconDataCallback");
835     info.addMember(m_applicationCacheHost, "applicationCacheHost");
836 }
837
838 void DocumentLoader::dataReceived(CachedResource* resource, const char* data, int length)
839 {
840     ASSERT(data);
841     ASSERT(length);
842     ASSERT_UNUSED(resource, resource == m_mainResource);
843     ASSERT(!m_response.isNull());
844
845 #if USE(CFNETWORK) || PLATFORM(MAC)
846     // Workaround for <rdar://problem/6060782>
847     if (m_response.isNull())
848         setResponse(ResourceResponse(KURL(), "text/html", 0, String(), String()));
849 #endif
850
851     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
852     // See <rdar://problem/6304600> for more details.
853 #if !USE(CF)
854     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
855 #endif
856
857 #if USE(CONTENT_FILTERING)
858     bool loadWasBlockedBeforeFinishing = false;
859     if (m_contentFilter && m_contentFilter->needsMoreData()) {
860         m_contentFilter->addData(data, length);
861
862         if (m_contentFilter->needsMoreData()) {
863             // Since the filter still needs more data to make a decision,
864             // transition back to the committed state so that we don't partially
865             // load content that might later be blocked.
866             commitLoad(0, 0);
867             return;
868         }
869
870         data = m_contentFilter->getReplacementData(length);
871         loadWasBlockedBeforeFinishing = m_contentFilter->didBlockData();
872     }
873 #endif
874
875     if (m_identifierForLoadWithoutResourceLoader)
876         frameLoader()->notifier()->dispatchDidReceiveData(this, m_identifierForLoadWithoutResourceLoader, data, length, -1);
877
878     m_applicationCacheHost->mainResourceDataReceived(data, length, -1, false);
879     m_timeOfLastDataReceived = monotonicallyIncreasingTime();
880
881     if (!isMultipartReplacingLoad())
882         commitLoad(data, length);
883
884 #if USE(CONTENT_FILTERING)
885     if (loadWasBlockedBeforeFinishing)
886         cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
887 #endif
888 }
889
890 void DocumentLoader::setupForReplace()
891 {
892     if (!mainResourceData())
893         return;
894     
895     maybeFinishLoadingMultipartContent();
896     maybeCreateArchive();
897     m_writer.end();
898     frameLoader()->setReplacing();
899     m_gotFirstByte = false;
900     
901     stopLoadingSubresources();
902     stopLoadingPlugIns();
903 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
904     clearArchiveResources();
905 #endif
906 }
907
908 void DocumentLoader::checkLoadComplete()
909 {
910     if (!m_frame || isLoading())
911         return;
912 #if !ENABLE(THREADED_HTML_PARSER)
913     // This ASSERT triggers with the threaded HTML parser.
914     // See https://bugs.webkit.org/show_bug.cgi?id=110937
915     ASSERT(this == frameLoader()->activeDocumentLoader());
916 #endif
917     m_frame->document()->domWindow()->finishedLoading();
918 }
919
920 void DocumentLoader::setFrame(Frame* frame)
921 {
922     if (m_frame == frame)
923         return;
924     ASSERT(frame && !m_frame);
925     m_frame = frame;
926     m_writer.setFrame(frame);
927     attachToFrame();
928 }
929
930 void DocumentLoader::attachToFrame()
931 {
932     ASSERT(m_frame);
933 }
934
935 void DocumentLoader::detachFromFrame()
936 {
937     ASSERT(m_frame);
938     RefPtr<Frame> protectFrame(m_frame);
939     RefPtr<DocumentLoader> protectLoader(this);
940
941     // It never makes sense to have a document loader that is detached from its
942     // frame have any loads active, so go ahead and kill all the loads.
943     stopLoading();
944
945     m_applicationCacheHost->setDOMApplicationCache(0);
946     InspectorInstrumentation::loaderDetachedFromFrame(m_frame, this);
947     m_frame = 0;
948 }
949
950 void DocumentLoader::clearMainResourceLoader()
951 {
952     m_loadingMainResource = false;
953     if (this == frameLoader()->activeDocumentLoader())
954         checkLoadComplete();
955 }
956
957 bool DocumentLoader::isLoadingInAPISense() const
958 {
959     // Once a frame has loaded, we no longer need to consider subresources,
960     // but we still need to consider subframes.
961     if (frameLoader()->state() != FrameStateComplete) {
962         if (m_frame->settings()->needsIsLoadingInAPISenseQuirk() && !m_subresourceLoaders.isEmpty())
963             return true;
964     
965         Document* doc = m_frame->document();
966         if ((isLoadingMainResource() || !m_frame->document()->loadEventFinished()) && isLoading())
967             return true;
968         if (m_cachedResourceLoader->requestCount())
969             return true;
970         if (doc->processingLoadEvent())
971             return true;
972         if (doc->hasActiveParser())
973             return true;
974     }
975     return frameLoader()->subframeIsLoading();
976 }
977
978 bool DocumentLoader::maybeCreateArchive()
979 {
980 #if !ENABLE(WEB_ARCHIVE) && !ENABLE(MHTML)
981     return false;
982 #else
983     
984     // Give the archive machinery a crack at this document. If the MIME type is not an archive type, it will return 0.
985     RefPtr<ResourceBuffer> mainResourceBuffer = mainResourceData();
986     m_archive = ArchiveFactory::create(m_response.url(), mainResourceBuffer ? mainResourceBuffer->sharedBuffer() : 0, m_response.mimeType());
987     if (!m_archive)
988         return false;
989     
990     addAllArchiveResources(m_archive.get());
991     ArchiveResource* mainResource = m_archive->mainResource();
992     m_parsedArchiveData = mainResource->data();
993     m_writer.setMIMEType(mainResource->mimeType());
994     
995     ASSERT(m_frame->document());
996     commitData(mainResource->data()->data(), mainResource->data()->size());
997     return true;
998 #endif // !ENABLE(WEB_ARCHIVE) && !ENABLE(MHTML)
999 }
1000
1001 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
1002 void DocumentLoader::setArchive(PassRefPtr<Archive> archive)
1003 {
1004     m_archive = archive;
1005     addAllArchiveResources(m_archive.get());
1006 }
1007
1008 void DocumentLoader::addAllArchiveResources(Archive* archive)
1009 {
1010     if (!m_archiveResourceCollection)
1011         m_archiveResourceCollection = adoptPtr(new ArchiveResourceCollection);
1012         
1013     ASSERT(archive);
1014     if (!archive)
1015         return;
1016         
1017     m_archiveResourceCollection->addAllResources(archive);
1018 }
1019
1020 // FIXME: Adding a resource directly to a DocumentLoader/ArchiveResourceCollection seems like bad design, but is API some apps rely on.
1021 // Can we change the design in a manner that will let us deprecate that API without reducing functionality of those apps?
1022 void DocumentLoader::addArchiveResource(PassRefPtr<ArchiveResource> resource)
1023 {
1024     if (!m_archiveResourceCollection)
1025         m_archiveResourceCollection = adoptPtr(new ArchiveResourceCollection);
1026         
1027     ASSERT(resource);
1028     if (!resource)
1029         return;
1030         
1031     m_archiveResourceCollection->addResource(resource);
1032 }
1033
1034 PassRefPtr<Archive> DocumentLoader::popArchiveForSubframe(const String& frameName, const KURL& url)
1035 {
1036     return m_archiveResourceCollection ? m_archiveResourceCollection->popSubframeArchive(frameName, url) : PassRefPtr<Archive>(0);
1037 }
1038
1039 void DocumentLoader::clearArchiveResources()
1040 {
1041     m_archiveResourceCollection.clear();
1042     m_substituteResourceDeliveryTimer.stop();
1043 }
1044
1045 SharedBuffer* DocumentLoader::parsedArchiveData() const
1046 {
1047     return m_parsedArchiveData.get();
1048 }
1049 #endif // ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
1050
1051 ArchiveResource* DocumentLoader::archiveResourceForURL(const KURL& url) const
1052 {
1053     if (!m_archiveResourceCollection)
1054         return 0;
1055         
1056     ArchiveResource* resource = m_archiveResourceCollection->archiveResourceForURL(url);
1057
1058     return resource && !resource->shouldIgnoreWhenUnarchiving() ? resource : 0;
1059 }
1060
1061 PassRefPtr<ArchiveResource> DocumentLoader::mainResource() const
1062 {
1063     const ResourceResponse& r = response();
1064     
1065     RefPtr<ResourceBuffer> mainResourceBuffer = mainResourceData();
1066     RefPtr<SharedBuffer> data = mainResourceBuffer ? mainResourceBuffer->sharedBuffer() : 0;
1067     if (!data)
1068         data = SharedBuffer::create();
1069         
1070     return ArchiveResource::create(data, r.url(), r.mimeType(), r.textEncodingName(), frame()->tree()->uniqueName());
1071 }
1072
1073 PassRefPtr<ArchiveResource> DocumentLoader::subresource(const KURL& url) const
1074 {
1075     if (!isCommitted())
1076         return 0;
1077     
1078     CachedResource* resource = m_cachedResourceLoader->cachedResource(url);
1079     if (!resource || !resource->isLoaded())
1080         return archiveResourceForURL(url);
1081
1082     if (resource->type() == CachedResource::MainResource)
1083         return 0;
1084
1085     // FIXME: This has the side effect of making the resource non-purgeable.
1086     // It would be better if it didn't have this permanent effect.
1087     if (!resource->makePurgeable(false))
1088         return 0;
1089
1090     ResourceBuffer* data = resource->resourceBuffer();
1091     if (!data)
1092         return 0;
1093
1094     return ArchiveResource::create(data->sharedBuffer(), url, resource->response());
1095 }
1096
1097 void DocumentLoader::getSubresources(Vector<PassRefPtr<ArchiveResource> >& subresources) const
1098 {
1099     if (!isCommitted())
1100         return;
1101
1102     const CachedResourceLoader::DocumentResourceMap& allResources = m_cachedResourceLoader->allCachedResources();
1103     CachedResourceLoader::DocumentResourceMap::const_iterator end = allResources.end();
1104     for (CachedResourceLoader::DocumentResourceMap::const_iterator it = allResources.begin(); it != end; ++it) {
1105         RefPtr<ArchiveResource> subresource = this->subresource(KURL(ParsedURLString, it->value->url()));
1106         if (subresource)
1107             subresources.append(subresource.release());
1108     }
1109
1110     return;
1111 }
1112
1113 void DocumentLoader::deliverSubstituteResourcesAfterDelay()
1114 {
1115     if (m_pendingSubstituteResources.isEmpty())
1116         return;
1117     ASSERT(m_frame && m_frame->page());
1118     if (m_frame->page()->defersLoading())
1119         return;
1120     if (!m_substituteResourceDeliveryTimer.isActive())
1121         m_substituteResourceDeliveryTimer.startOneShot(0);
1122 }
1123
1124 void DocumentLoader::substituteResourceDeliveryTimerFired(Timer<DocumentLoader>*)
1125 {
1126     if (m_pendingSubstituteResources.isEmpty())
1127         return;
1128     ASSERT(m_frame && m_frame->page());
1129     if (m_frame->page()->defersLoading())
1130         return;
1131
1132     SubstituteResourceMap copy;
1133     copy.swap(m_pendingSubstituteResources);
1134
1135     SubstituteResourceMap::const_iterator end = copy.end();
1136     for (SubstituteResourceMap::const_iterator it = copy.begin(); it != end; ++it) {
1137         RefPtr<ResourceLoader> loader = it->key;
1138         SubstituteResource* resource = it->value.get();
1139         
1140         if (resource) {
1141             SharedBuffer* data = resource->data();
1142         
1143             loader->didReceiveResponse(resource->response());
1144
1145             // Calling ResourceLoader::didReceiveResponse can end up cancelling the load,
1146             // so we need to check if the loader has reached its terminal state.
1147             if (loader->reachedTerminalState())
1148                 return;
1149
1150             loader->didReceiveData(data->data(), data->size(), data->size(), DataPayloadWholeResource);
1151
1152             // Calling ResourceLoader::didReceiveData can end up cancelling the load,
1153             // so we need to check if the loader has reached its terminal state.
1154             if (loader->reachedTerminalState())
1155                 return;
1156
1157             loader->didFinishLoading(0);
1158         } else {
1159             // A null resource means that we should fail the load.
1160             // FIXME: Maybe we should use another error here - something like "not in cache".
1161             loader->didFail(loader->cannotShowURLError());
1162         }
1163     }
1164 }
1165
1166 #ifndef NDEBUG
1167 bool DocumentLoader::isSubstituteLoadPending(ResourceLoader* loader) const
1168 {
1169     return m_pendingSubstituteResources.contains(loader);
1170 }
1171 #endif
1172
1173 void DocumentLoader::cancelPendingSubstituteLoad(ResourceLoader* loader)
1174 {
1175     if (m_pendingSubstituteResources.isEmpty())
1176         return;
1177     m_pendingSubstituteResources.remove(loader);
1178     if (m_pendingSubstituteResources.isEmpty())
1179         m_substituteResourceDeliveryTimer.stop();
1180 }
1181
1182 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
1183 bool DocumentLoader::scheduleArchiveLoad(ResourceLoader* loader, const ResourceRequest& request)
1184 {
1185     if (ArchiveResource* resource = archiveResourceForURL(request.url())) {
1186         m_pendingSubstituteResources.set(loader, resource);
1187         deliverSubstituteResourcesAfterDelay();
1188         return true;
1189     }
1190
1191     if (!m_archive)
1192         return false;
1193
1194     switch (m_archive->type()) {
1195 #if ENABLE(WEB_ARCHIVE)
1196     case Archive::WebArchive:
1197         // WebArchiveDebugMode means we fail loads instead of trying to fetch them from the network if they're not in the archive.
1198         return m_frame->settings() && m_frame->settings()->webArchiveDebugModeEnabled() && ArchiveFactory::isArchiveMimeType(responseMIMEType());
1199 #endif
1200 #if ENABLE(MHTML)
1201     case Archive::MHTML:
1202         return true; // Always fail the load for resources not included in the MHTML.
1203 #endif
1204     default:
1205         return false;
1206     }
1207 }
1208 #endif // ENABLE(WEB_ARCHIVE)
1209
1210 void DocumentLoader::addResponse(const ResourceResponse& r)
1211 {
1212     if (!m_stopRecordingResponses)
1213         m_responses.append(r);
1214 }
1215
1216 void DocumentLoader::stopRecordingResponses()
1217 {
1218     m_stopRecordingResponses = true;
1219     m_responses.shrinkToFit();
1220 }
1221
1222 void DocumentLoader::setTitle(const StringWithDirection& title)
1223 {
1224     if (m_pageTitle == title)
1225         return;
1226
1227     frameLoader()->willChangeTitle(this);
1228     m_pageTitle = title;
1229     frameLoader()->didChangeTitle(this);
1230 }
1231
1232 KURL DocumentLoader::urlForHistory() const
1233 {
1234     // Return the URL to be used for history and B/F list.
1235     // Returns nil for WebDataProtocol URLs that aren't alternates 
1236     // for unreachable URLs, because these can't be stored in history.
1237     if (m_substituteData.isValid())
1238         return unreachableURL();
1239
1240     return m_originalRequestCopy.url();
1241 }
1242
1243 bool DocumentLoader::urlForHistoryReflectsFailure() const
1244 {
1245     return m_substituteData.isValid() || m_response.httpStatusCode() >= 400;
1246 }
1247
1248 const KURL& DocumentLoader::originalURL() const
1249 {
1250     return m_originalRequestCopy.url();
1251 }
1252
1253 const KURL& DocumentLoader::requestURL() const
1254 {
1255     return request().url();
1256 }
1257
1258 const KURL& DocumentLoader::responseURL() const
1259 {
1260     return m_response.url();
1261 }
1262
1263 KURL DocumentLoader::documentURL() const
1264 {
1265     KURL url = substituteData().responseURL();
1266 #if ENABLE(WEB_ARCHIVE)
1267     if (url.isEmpty() && m_archive && m_archive->type() == Archive::WebArchive)
1268         url = m_archive->mainResource()->url();
1269 #endif
1270     if (url.isEmpty())
1271         url = requestURL();
1272     if (url.isEmpty())
1273         url = responseURL();
1274     return url;
1275 }
1276
1277 const String& DocumentLoader::responseMIMEType() const
1278 {
1279     return m_response.mimeType();
1280 }
1281
1282 const KURL& DocumentLoader::unreachableURL() const
1283 {
1284     return m_substituteData.failingURL();
1285 }
1286
1287 void DocumentLoader::setDefersLoading(bool defers)
1288 {
1289     // Multiple frames may be loading the same main resource simultaneously. If deferral state changes,
1290     // each frame's DocumentLoader will try to send a setDefersLoading() to the same underlying ResourceLoader. Ensure only
1291     // the "owning" DocumentLoader does so, as setDefersLoading() is not resilient to setting the same value repeatedly.
1292     if (mainResourceLoader() && mainResourceLoader()->documentLoader() == this)
1293         mainResourceLoader()->setDefersLoading(defers);
1294
1295     setAllDefersLoading(m_subresourceLoaders, defers);
1296     setAllDefersLoading(m_plugInStreamLoaders, defers);
1297     if (!defers)
1298         deliverSubstituteResourcesAfterDelay();
1299 }
1300
1301 void DocumentLoader::setMainResourceDataBufferingPolicy(DataBufferingPolicy dataBufferingPolicy)
1302 {
1303     if (m_mainResource)
1304         m_mainResource->setDataBufferingPolicy(dataBufferingPolicy);
1305 }
1306
1307 void DocumentLoader::stopLoadingPlugIns()
1308 {
1309     cancelAll(m_plugInStreamLoaders);
1310 }
1311
1312 void DocumentLoader::stopLoadingSubresources()
1313 {
1314     cancelAll(m_subresourceLoaders);
1315 }
1316
1317 void DocumentLoader::addSubresourceLoader(ResourceLoader* loader)
1318 {
1319     // The main resource's underlying ResourceLoader will ask to be added here.
1320     // It is much simpler to handle special casing of main resource loads if we don't
1321     // let it be added. In the main resource load case, mainResourceLoader()
1322     // will still be null at this point, but m_gotFirstByte should be false here if and only
1323     // if we are just starting the main resource load.
1324     if (!m_gotFirstByte)
1325         return;
1326     ASSERT(!m_subresourceLoaders.contains(loader));
1327     ASSERT(!mainResourceLoader() || mainResourceLoader() != loader);
1328     m_subresourceLoaders.add(loader);
1329 }
1330
1331 void DocumentLoader::removeSubresourceLoader(ResourceLoader* loader)
1332 {
1333     if (!m_subresourceLoaders.contains(loader))
1334         return;
1335     m_subresourceLoaders.remove(loader);
1336     checkLoadComplete();
1337     if (Frame* frame = m_frame)
1338         frame->loader()->checkLoadComplete();
1339 }
1340
1341 void DocumentLoader::addPlugInStreamLoader(ResourceLoader* loader)
1342 {
1343     m_plugInStreamLoaders.add(loader);
1344 }
1345
1346 void DocumentLoader::removePlugInStreamLoader(ResourceLoader* loader)
1347 {
1348     m_plugInStreamLoaders.remove(loader);
1349     checkLoadComplete();
1350 }
1351
1352 bool DocumentLoader::isMultipartReplacingLoad() const
1353 {
1354     return isLoadingMultipartContent() && frameLoader()->isReplacing();
1355 }
1356
1357 bool DocumentLoader::maybeLoadEmpty()
1358 {
1359     bool shouldLoadEmpty = !m_substituteData.isValid() && (m_request.url().isEmpty() || SchemeRegistry::shouldLoadURLSchemeAsEmptyDocument(m_request.url().protocol()));
1360     if (!shouldLoadEmpty && !frameLoader()->client()->representationExistsForURLScheme(m_request.url().protocol()))
1361         return false;
1362
1363     if (m_request.url().isEmpty() && !frameLoader()->stateMachine()->creatingInitialEmptyDocument())
1364         m_request.setURL(blankURL());
1365     String mimeType = shouldLoadEmpty ? "text/html" : frameLoader()->client()->generatedMIMETypeForURLScheme(m_request.url().protocol());
1366     setResponse(ResourceResponse(m_request.url(), mimeType, 0, String(), String()));
1367     finishedLoading(monotonicallyIncreasingTime());
1368     return true;
1369 }
1370
1371 void DocumentLoader::startLoadingMainResource()
1372 {
1373     m_mainDocumentError = ResourceError();
1374     timing()->markNavigationStart();
1375     ASSERT(!m_mainResource);
1376     ASSERT(!m_loadingMainResource);
1377     m_loadingMainResource = true;
1378
1379     if (maybeLoadEmpty())
1380         return;
1381
1382     // FIXME: Is there any way the extra fields could have not been added by now?
1383     // If not, it would be great to remove this line of code.
1384     // Note that currently, some requests may have incorrect extra fields even if this function has been called,
1385     // because we pass a wrong loadType (see FIXME in addExtraFieldsToMainResourceRequest()).
1386     frameLoader()->addExtraFieldsToMainResourceRequest(m_request);
1387
1388     ASSERT(timing()->navigationStart());
1389     ASSERT(!timing()->fetchStart());
1390     timing()->markFetchStart();
1391     willSendRequest(m_request, ResourceResponse());
1392
1393     // willSendRequest() may lead to our Frame being detached or cancelling the load via nulling the ResourceRequest.
1394     if (!m_frame || m_request.isNull())
1395         return;
1396
1397     m_applicationCacheHost->maybeLoadMainResource(m_request, m_substituteData);
1398
1399     if (m_substituteData.isValid()) {
1400         m_identifierForLoadWithoutResourceLoader = m_frame->page()->progress()->createUniqueIdentifier();
1401         frameLoader()->notifier()->assignIdentifierToInitialRequest(m_identifierForLoadWithoutResourceLoader, this, m_request);
1402         frameLoader()->notifier()->dispatchWillSendRequest(this, m_identifierForLoadWithoutResourceLoader, m_request, ResourceResponse());
1403         handleSubstituteDataLoadSoon();
1404         return;
1405     }
1406
1407     ResourceRequest request(m_request);
1408     DEFINE_STATIC_LOCAL(ResourceLoaderOptions, mainResourceLoadOptions,
1409         (SendCallbacks, SniffContent, BufferData, AllowStoredCredentials, AskClientForCrossOriginCredentials, SkipSecurityCheck));
1410     CachedResourceRequest cachedResourceRequest(request, mainResourceLoadOptions);
1411     m_mainResource = m_cachedResourceLoader->requestMainResource(cachedResourceRequest);
1412     if (!m_mainResource) {
1413         setRequest(ResourceRequest());
1414         // If the load was aborted by clearing m_request, it's possible the ApplicationCacheHost
1415         // is now in a state where starting an empty load will be inconsistent. Replace it with
1416         // a new ApplicationCacheHost.
1417         m_applicationCacheHost = adoptPtr(new ApplicationCacheHost(this));
1418         maybeLoadEmpty();
1419         return;
1420     }
1421
1422     if (!mainResourceLoader()) {
1423         m_identifierForLoadWithoutResourceLoader = m_frame->page()->progress()->createUniqueIdentifier();
1424         frameLoader()->notifier()->assignIdentifierToInitialRequest(m_identifierForLoadWithoutResourceLoader, this, request);
1425         frameLoader()->notifier()->dispatchWillSendRequest(this, m_identifierForLoadWithoutResourceLoader, request, ResourceResponse());
1426     }
1427     m_mainResource->addClient(this);
1428
1429     // A bunch of headers are set when the underlying ResourceLoader is created, and m_request needs to include those.
1430     if (mainResourceLoader())
1431         request = mainResourceLoader()->originalRequest();
1432     // If there was a fragment identifier on m_request, the cache will have stripped it. m_request should include
1433     // the fragment identifier, so add that back in.
1434     if (equalIgnoringFragmentIdentifier(m_request.url(), request.url()))
1435         request.setURL(m_request.url());
1436     setRequest(request);
1437 }
1438
1439 void DocumentLoader::cancelMainResourceLoad(const ResourceError& resourceError)
1440 {
1441     RefPtr<DocumentLoader> protect(this);
1442     ResourceError error = resourceError.isNull() ? frameLoader()->cancelledError(m_request) : resourceError;
1443
1444     m_dataLoadTimer.stop();
1445     if (m_waitingForContentPolicy) {
1446         frameLoader()->policyChecker()->cancelCheck();
1447         ASSERT(m_waitingForContentPolicy);
1448         m_waitingForContentPolicy = false;
1449     }
1450
1451     if (mainResourceLoader())
1452         mainResourceLoader()->cancel(error);
1453
1454     mainReceivedError(error);
1455 }
1456
1457 void DocumentLoader::subresourceLoaderFinishedLoadingOnePart(ResourceLoader* loader)
1458 {
1459     m_multipartSubresourceLoaders.add(loader);
1460     m_subresourceLoaders.remove(loader);
1461     checkLoadComplete();
1462     if (Frame* frame = m_frame)
1463         frame->loader()->checkLoadComplete();    
1464 }
1465
1466 void DocumentLoader::maybeFinishLoadingMultipartContent()
1467 {
1468     if (!isMultipartReplacingLoad())
1469         return;
1470
1471     frameLoader()->setupForReplace();
1472     m_committed = false;
1473     RefPtr<ResourceBuffer> resourceData = mainResourceData();
1474     commitLoad(resourceData->data(), resourceData->size());
1475 }
1476
1477 void DocumentLoader::iconLoadDecisionAvailable()
1478 {
1479     if (m_frame)
1480         m_frame->loader()->icon()->loadDecisionReceived(iconDatabase().synchronousLoadDecisionForIconURL(frameLoader()->icon()->url(), this));
1481 }
1482
1483 static void iconLoadDecisionCallback(IconLoadDecision decision, void* context)
1484 {
1485     static_cast<DocumentLoader*>(context)->continueIconLoadWithDecision(decision);
1486 }
1487
1488 void DocumentLoader::getIconLoadDecisionForIconURL(const String& urlString)
1489 {
1490     if (m_iconLoadDecisionCallback)
1491         m_iconLoadDecisionCallback->invalidate();
1492     m_iconLoadDecisionCallback = IconLoadDecisionCallback::create(this, iconLoadDecisionCallback);
1493     iconDatabase().loadDecisionForIconURL(urlString, m_iconLoadDecisionCallback);
1494 }
1495
1496 void DocumentLoader::continueIconLoadWithDecision(IconLoadDecision decision)
1497 {
1498     ASSERT(m_iconLoadDecisionCallback);
1499     m_iconLoadDecisionCallback = 0;
1500     if (m_frame)
1501         m_frame->loader()->icon()->continueLoadWithDecision(decision);
1502 }
1503
1504 static void iconDataCallback(SharedBuffer*, void*)
1505 {
1506     // FIXME: Implement this once we know what parts of WebCore actually need the icon data returned.
1507 }
1508
1509 void DocumentLoader::getIconDataForIconURL(const String& urlString)
1510 {   
1511     if (m_iconDataCallback)
1512         m_iconDataCallback->invalidate();
1513     m_iconDataCallback = IconDataCallback::create(this, iconDataCallback);
1514     iconDatabase().iconDataForIconURL(urlString, m_iconDataCallback);
1515 }
1516
1517 void DocumentLoader::handledOnloadEvents()
1518 {
1519     m_wasOnloadHandled = true;
1520     applicationCacheHost()->stopDeferringEvents();
1521 }
1522
1523 } // namespace WebCore