Merge MainResourceLoader into DocumentLoader
[WebKit-https.git] / Source / WebCore / loader / DocumentLoader.cpp
1 /*
2  * Copyright (C) 2006, 2007, 2008 Apple Inc. All rights reserved.
3  * Copyright (C) 2011 Google Inc. All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  *
9  * 1.  Redistributions of source code must retain the above copyright
10  *     notice, this list of conditions and the following disclaimer. 
11  * 2.  Redistributions in binary form must reproduce the above copyright
12  *     notice, this list of conditions and the following disclaimer in the
13  *     documentation and/or other materials provided with the distribution. 
14  * 3.  Neither the name of Apple Computer, Inc. ("Apple") nor the names of
15  *     its contributors may be used to endorse or promote products derived
16  *     from this software without specific prior written permission. 
17  *
18  * THIS SOFTWARE IS PROVIDED BY APPLE AND ITS CONTRIBUTORS "AS IS" AND ANY
19  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
20  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
21  * DISCLAIMED. IN NO EVENT SHALL APPLE OR ITS CONTRIBUTORS BE LIABLE FOR ANY
22  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
23  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
24  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
25  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
26  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
27  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
28  */
29
30 #include "config.h"
31 #include "DocumentLoader.h"
32
33 #include "ApplicationCacheHost.h"
34 #include "ArchiveResourceCollection.h"
35 #include "CachedPage.h"
36 #include "CachedResourceLoader.h"
37 #include "DOMWindow.h"
38 #include "Document.h"
39 #include "DocumentParser.h"
40 #include "DocumentWriter.h"
41 #include "Event.h"
42 #include "FormState.h"
43 #include "Frame.h"
44 #include "FrameLoader.h"
45 #include "FrameLoaderClient.h"
46 #include "FrameTree.h"
47 #include "HTMLFormElement.h"
48 #include "HistoryItem.h"
49 #include "InspectorInstrumentation.h"
50 #include "Logging.h"
51 #include "MemoryCache.h"
52 #include "Page.h"
53 #include "ProgressTracker.h"
54 #include "ResourceBuffer.h"
55 #include "SchemeRegistry.h"
56 #include "Settings.h"
57 #include "SubresourceLoader.h"
58 #include "TextResourceDecoder.h"
59 #include "WebCoreMemoryInstrumentation.h"
60 #include <wtf/Assertions.h>
61 #include <wtf/MemoryInstrumentationHashMap.h>
62 #include <wtf/MemoryInstrumentationHashSet.h>
63 #include <wtf/MemoryInstrumentationVector.h>
64 #include <wtf/text/CString.h>
65 #include <wtf/text/WTFString.h>
66 #include <wtf/unicode/Unicode.h>
67
68 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
69 #include "ArchiveFactory.h"
70 #endif
71
72 #if USE(CONTENT_FILTERING)
73 #include "ContentFilter.h"
74 #endif
75
76 namespace WebCore {
77
78 static void cancelAll(const ResourceLoaderSet& loaders)
79 {
80     Vector<RefPtr<ResourceLoader> > loadersCopy;
81     copyToVector(loaders, loadersCopy);
82     size_t size = loadersCopy.size();
83     for (size_t i = 0; i < size; ++i)
84         loadersCopy[i]->cancel();
85 }
86
87 static void setAllDefersLoading(const ResourceLoaderSet& loaders, bool defers)
88 {
89     Vector<RefPtr<ResourceLoader> > loadersCopy;
90     copyToVector(loaders, loadersCopy);
91     size_t size = loadersCopy.size();
92     for (size_t i = 0; i < size; ++i)
93         loadersCopy[i]->setDefersLoading(defers);
94 }
95
96 DocumentLoader::DocumentLoader(const ResourceRequest& req, const SubstituteData& substituteData)
97     : m_deferMainResourceDataLoad(true)
98     , m_frame(0)
99     , m_cachedResourceLoader(CachedResourceLoader::create(this))
100     , m_writer(m_frame)
101     , m_originalRequest(req)
102     , m_substituteData(substituteData)
103     , m_originalRequestCopy(req)
104     , m_request(req)
105     , m_committed(false)
106     , m_isStopping(false)
107     , m_gotFirstByte(false)
108     , m_isClientRedirect(false)
109     , m_isLoadingMultipartContent(false)
110     , m_wasOnloadHandled(false)
111     , m_stopRecordingResponses(false)
112     , m_substituteResourceDeliveryTimer(this, &DocumentLoader::substituteResourceDeliveryTimerFired)
113     , m_didCreateGlobalHistoryEntry(false)
114     , m_loadingMainResource(false)
115     , m_timeOfLastDataReceived(0.0)
116     , m_identifierForLoadWithoutResourceLoader(0)
117     , m_dataLoadTimer(this, &DocumentLoader::handleSubstituteDataLoadNow)
118     , m_waitingForContentPolicy(false)
119     , m_applicationCacheHost(adoptPtr(new ApplicationCacheHost(this)))
120 {
121 }
122
123 FrameLoader* DocumentLoader::frameLoader() const
124 {
125     if (!m_frame)
126         return 0;
127     return m_frame->loader();
128 }
129
130 ResourceLoader* DocumentLoader::mainResourceLoader() const
131 {
132     return m_mainResource ? m_mainResource->loader() : 0;
133 }
134
135 DocumentLoader::~DocumentLoader()
136 {
137     ASSERT(!m_frame || frameLoader()->activeDocumentLoader() != this || !isLoading());
138     if (m_iconLoadDecisionCallback)
139         m_iconLoadDecisionCallback->invalidate();
140     if (m_iconDataCallback)
141         m_iconDataCallback->invalidate();
142     m_cachedResourceLoader->clearDocumentLoader();
143     
144     if (m_mainResource) {
145         m_mainResource->removeClient(this);
146         m_mainResource = 0;
147     }
148 }
149
150 PassRefPtr<ResourceBuffer> DocumentLoader::mainResourceData() const
151 {
152     if (m_substituteData.isValid())
153         return ResourceBuffer::create(m_substituteData.content()->data(), m_substituteData.content()->size());
154     if (m_mainResource)
155         return m_mainResource->resourceBuffer();
156     return 0;
157 }
158
159 Document* DocumentLoader::document() const
160 {
161     if (m_frame && m_frame->loader()->documentLoader() == this)
162         return m_frame->document();
163     return 0;
164 }
165
166 const ResourceRequest& DocumentLoader::originalRequest() const
167 {
168     return m_originalRequest;
169 }
170
171 const ResourceRequest& DocumentLoader::originalRequestCopy() const
172 {
173     return m_originalRequestCopy;
174 }
175
176 const ResourceRequest& DocumentLoader::request() const
177 {
178     return m_request;
179 }
180
181 ResourceRequest& DocumentLoader::request()
182 {
183     return m_request;
184 }
185
186 const KURL& DocumentLoader::url() const
187 {
188     return request().url();
189 }
190
191 void DocumentLoader::replaceRequestURLForSameDocumentNavigation(const KURL& url)
192 {
193     m_originalRequestCopy.setURL(url);
194     m_request.setURL(url);
195 }
196
197 void DocumentLoader::setRequest(const ResourceRequest& req)
198 {
199     // Replacing an unreachable URL with alternate content looks like a server-side
200     // redirect at this point, but we can replace a committed dataSource.
201     bool handlingUnreachableURL = false;
202
203     handlingUnreachableURL = m_substituteData.isValid() && !m_substituteData.failingURL().isEmpty();
204
205     if (handlingUnreachableURL)
206         m_committed = false;
207
208     // We should never be getting a redirect callback after the data
209     // source is committed, except in the unreachable URL case. It 
210     // would be a WebFoundation bug if it sent a redirect callback after commit.
211     ASSERT(!m_committed);
212
213     m_request = req;
214 }
215
216 void DocumentLoader::setMainDocumentError(const ResourceError& error)
217 {
218     m_mainDocumentError = error;    
219     frameLoader()->client()->setMainDocumentError(this, error);
220 }
221
222 void DocumentLoader::mainReceivedError(const ResourceError& error)
223 {
224     ASSERT(!error.isNull());
225     if (m_applicationCacheHost->maybeLoadFallbackForMainError(request(), error))
226         return;
227
228     if (m_identifierForLoadWithoutResourceLoader) {
229         ASSERT(!mainResourceLoader());
230         frameLoader()->client()->dispatchDidFailLoading(this, m_identifierForLoadWithoutResourceLoader, error);
231     }
232
233     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
234     // See <rdar://problem/6304600> for more details.
235 #if !USE(CF)
236     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
237 #endif
238
239     m_applicationCacheHost->failedLoadingMainResource();
240
241     if (!frameLoader())
242         return;
243     setMainDocumentError(error);
244     clearMainResourceLoader();
245     frameLoader()->receivedMainResourceError(error);
246 }
247
248 // Cancels the data source's pending loads.  Conceptually, a data source only loads
249 // one document at a time, but one document may have many related resources. 
250 // stopLoading will stop all loads initiated by the data source, 
251 // but not loads initiated by child frames' data sources -- that's the WebFrame's job.
252 void DocumentLoader::stopLoading()
253 {
254     RefPtr<Frame> protectFrame(m_frame);
255     RefPtr<DocumentLoader> protectLoader(this);
256
257     // In some rare cases, calling FrameLoader::stopLoading could cause isLoading() to return false.
258     // (This can happen when there's a single XMLHttpRequest currently loading and stopLoading causes it
259     // to stop loading. Because of this, we need to save it so we don't return early.
260     bool loading = isLoading();
261     
262     if (m_committed) {
263         // Attempt to stop the frame if the document loader is loading, or if it is done loading but
264         // still  parsing. Failure to do so can cause a world leak.
265         Document* doc = m_frame->document();
266         
267         if (loading || doc->parsing())
268             m_frame->loader()->stopLoading(UnloadEventPolicyNone);
269     }
270
271     // Always cancel multipart loaders
272     cancelAll(m_multipartSubresourceLoaders);
273
274     // Appcache uses ResourceHandle directly, DocumentLoader doesn't count these loads.
275     m_applicationCacheHost->stopLoadingInFrame(m_frame);
276     
277 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
278     clearArchiveResources();
279 #endif
280
281     if (!loading) {
282         // If something above restarted loading we might run into mysterious crashes like 
283         // https://bugs.webkit.org/show_bug.cgi?id=62764 and <rdar://problem/9328684>
284         ASSERT(!isLoading());
285         return;
286     }
287
288     // We might run in to infinite recursion if we're stopping loading as the result of 
289     // detaching from the frame, so break out of that recursion here.
290     // See <rdar://problem/9673866> for more details.
291     if (m_isStopping)
292         return;
293
294     m_isStopping = true;
295
296     FrameLoader* frameLoader = DocumentLoader::frameLoader();
297     
298     if (isLoadingMainResource())
299         // Stop the main resource loader and let it send the cancelled message.
300         cancelMainResourceLoad(frameLoader->cancelledError(m_request));
301     else if (!m_subresourceLoaders.isEmpty())
302         // The main resource loader already finished loading. Set the cancelled error on the 
303         // document and let the subresourceLoaders send individual cancelled messages below.
304         setMainDocumentError(frameLoader->cancelledError(m_request));
305     else
306         // If there are no resource loaders, we need to manufacture a cancelled message.
307         // (A back/forward navigation has no resource loaders because its resources are cached.)
308         mainReceivedError(frameLoader->cancelledError(m_request));
309     
310     stopLoadingSubresources();
311     stopLoadingPlugIns();
312     
313     m_isStopping = false;
314 }
315
316 void DocumentLoader::commitIfReady()
317 {
318     if (!m_committed) {
319         m_committed = true;
320         frameLoader()->commitProvisionalLoad();
321     }
322 }
323
324 bool DocumentLoader::isLoading() const
325 {
326     // FIXME: This should always be enabled, but it seems to cause
327     // http/tests/security/feed-urls-from-remote.html to timeout on Mac WK1
328     // see http://webkit.org/b/110554 and http://webkit.org/b/110401
329 #if ENABLE(THREADED_HTML_PARSER)
330     if (document() && document()->hasActiveParser())
331         return true;
332 #endif
333     return isLoadingMainResource() || !m_subresourceLoaders.isEmpty() || !m_plugInStreamLoaders.isEmpty();
334 }
335
336 void DocumentLoader::notifyFinished(CachedResource* resource)
337 {
338     ASSERT_UNUSED(resource, m_mainResource == resource);
339     ASSERT(m_mainResource);
340     if (!m_mainResource->errorOccurred() && !m_mainResource->wasCanceled()) {
341         finishedLoading(m_mainResource->loadFinishTime());
342         return;
343     }
344
345     // FIXME: we should fix the design to eliminate the need for a platform ifdef here
346 #if !PLATFORM(CHROMIUM)
347     if (m_request.cachePolicy() == ReturnCacheDataDontLoad && !m_mainResource->wasCanceled()) {
348         frameLoader()->retryAfterFailedCacheOnlyMainResourceLoad();
349         return;
350     }
351 #endif
352
353     mainReceivedError(m_mainResource->resourceError());
354 }
355
356 void DocumentLoader::finishedLoading(double finishTime)
357 {
358     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
359     // See <rdar://problem/6304600> for more details.
360 #if !USE(CF)
361     ASSERT(!m_frame->page()->defersLoading() || InspectorInstrumentation::isDebuggerPaused(m_frame));
362 #endif
363
364     RefPtr<DocumentLoader> protect(this);
365
366     if (m_identifierForLoadWithoutResourceLoader) {
367         frameLoader()->notifier()->dispatchDidFinishLoading(this, m_identifierForLoadWithoutResourceLoader, finishTime);
368         m_identifierForLoadWithoutResourceLoader = 0;
369     }
370
371 #if USE(CONTENT_FILTERING)
372     if (m_contentFilter && m_contentFilter->needsMoreData()) {
373         m_contentFilter->finishedAddingData();
374         int length;
375         const char* data = m_contentFilter->getReplacementData(length);
376         if (data)
377             dataReceived(m_mainResource.get(), data, length);
378     }
379 #endif
380
381     maybeFinishLoadingMultipartContent();
382
383     double responseEndTime = finishTime;
384     if (!responseEndTime)
385         responseEndTime = m_timeOfLastDataReceived;
386     if (!responseEndTime)
387         responseEndTime = monotonicallyIncreasingTime();
388     timing()->setResponseEnd(responseEndTime);
389
390     commitIfReady();
391     if (!frameLoader())
392         return;
393
394     if (!maybeCreateArchive()) {
395         // If this is an empty document, it will not have actually been created yet. Commit dummy data so that
396         // DocumentWriter::begin() gets called and creates the Document.
397         if (!m_gotFirstByte)
398             commitData(0, 0);
399         frameLoader()->client()->finishedLoading(this);
400     }
401
402     m_writer.end();
403     if (!m_mainDocumentError.isNull())
404         return;
405     clearMainResourceLoader();
406     if (!frameLoader()->stateMachine()->creatingInitialEmptyDocument())
407         frameLoader()->checkLoadComplete();
408
409     // If the document specified an application cache manifest, it violates the author's intent if we store it in the memory cache
410     // and deny the appcache the chance to intercept it in the future, so remove from the memory cache.
411     if (m_frame) {
412         if (m_mainResource && m_frame->document()->hasManifest())
413             memoryCache()->remove(m_mainResource.get());
414     }
415     m_applicationCacheHost->finishedLoadingMainResource();
416 }
417
418 bool DocumentLoader::isPostOrRedirectAfterPost(const ResourceRequest& newRequest, const ResourceResponse& redirectResponse)
419 {
420     if (newRequest.httpMethod() == "POST")
421         return true;
422
423     int status = redirectResponse.httpStatusCode();
424     if (((status >= 301 && status <= 303) || status == 307)
425         && m_originalRequest.httpMethod() == "POST")
426         return true;
427
428     return false;
429 }
430
431 void DocumentLoader::handleSubstituteDataLoadNow(DocumentLoaderTimer*)
432 {
433     KURL url = m_substituteData.responseURL();
434     if (url.isEmpty())
435         url = m_request.url();
436     ResourceResponse response(url, m_substituteData.mimeType(), m_substituteData.content()->size(), m_substituteData.textEncoding(), "");
437     responseReceived(0, response);
438 }
439
440 void DocumentLoader::startDataLoadTimer()
441 {
442     m_dataLoadTimer.startOneShot(0);
443
444 #if HAVE(RUNLOOP_TIMER)
445     if (SchedulePairHashSet* scheduledPairs = m_frame->page()->scheduledRunLoopPairs())
446         m_dataLoadTimer.schedule(*scheduledPairs);
447 #endif
448 }
449
450 void DocumentLoader::handleSubstituteDataLoadSoon()
451 {
452     if (deferMainResourceDataLoad())
453         startDataLoadTimer();
454     else
455         handleSubstituteDataLoadNow(0);
456 }
457
458 void DocumentLoader::redirectReceived(CachedResource* resource, ResourceRequest& request, const ResourceResponse& redirectResponse)
459 {
460     ASSERT_UNUSED(resource, resource == m_mainResource);
461     willSendRequest(request, redirectResponse);
462 }
463
464 void DocumentLoader::willSendRequest(ResourceRequest& newRequest, const ResourceResponse& redirectResponse)
465 {
466     // Note that there are no asserts here as there are for the other callbacks. This is due to the
467     // fact that this "callback" is sent when starting every load, and the state of callback
468     // deferrals plays less of a part in this function in preventing the bad behavior deferring 
469     // callbacks is meant to prevent.
470     ASSERT(!newRequest.isNull());
471
472     if (!frameLoader()->checkIfFormActionAllowedByCSP(newRequest.url())) {
473         cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
474         return;
475     }
476
477     ASSERT(timing()->fetchStart());
478     if (!redirectResponse.isNull()) {
479         // If the redirecting url is not allowed to display content from the target origin,
480         // then block the redirect.
481         RefPtr<SecurityOrigin> redirectingOrigin = SecurityOrigin::create(redirectResponse.url());
482         if (!redirectingOrigin->canDisplay(newRequest.url())) {
483             FrameLoader::reportLocalLoadFailed(m_frame, newRequest.url().string());
484             cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
485             return;
486         }
487         timing()->addRedirect(redirectResponse.url(), newRequest.url());
488     }
489
490     // Update cookie policy base URL as URL changes, except for subframes, which use the
491     // URL of the main frame which doesn't change when we redirect.
492     if (frameLoader()->isLoadingMainFrame())
493         newRequest.setFirstPartyForCookies(newRequest.url());
494
495     // If we're fielding a redirect in response to a POST, force a load from origin, since
496     // this is a common site technique to return to a page viewing some data that the POST
497     // just modified.
498     // Also, POST requests always load from origin, but this does not affect subresources.
499     if (newRequest.cachePolicy() == UseProtocolCachePolicy && isPostOrRedirectAfterPost(newRequest, redirectResponse))
500         newRequest.setCachePolicy(ReloadIgnoringCacheData);
501
502     Frame* top = m_frame->tree()->top();
503     if (top != m_frame) {
504         if (!frameLoader()->mixedContentChecker()->canDisplayInsecureContent(top->document()->securityOrigin(), newRequest.url())) {
505             cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
506             return;
507         }
508     }
509
510     setRequest(newRequest);
511
512     if (!redirectResponse.isNull()) {
513         // We checked application cache for initial URL, now we need to check it for redirected one.
514         ASSERT(!m_substituteData.isValid());
515         m_applicationCacheHost->maybeLoadMainResourceForRedirect(newRequest, m_substituteData);
516         if (m_substituteData.isValid())
517             m_identifierForLoadWithoutResourceLoader = mainResourceLoader()->identifier();
518     }
519
520     // FIXME: Ideally we'd stop the I/O until we hear back from the navigation policy delegate
521     // listener. But there's no way to do that in practice. So instead we cancel later if the
522     // listener tells us to. In practice that means the navigation policy needs to be decided
523     // synchronously for these redirect cases.
524     if (!redirectResponse.isNull())
525         frameLoader()->policyChecker()->checkNavigationPolicy(newRequest, callContinueAfterNavigationPolicy, this);
526 }
527
528 void DocumentLoader::callContinueAfterNavigationPolicy(void* argument, const ResourceRequest& request, PassRefPtr<FormState>, bool shouldContinue)
529 {
530     static_cast<DocumentLoader*>(argument)->continueAfterNavigationPolicy(request, shouldContinue);
531 }
532
533 void DocumentLoader::continueAfterNavigationPolicy(const ResourceRequest&, bool shouldContinue)
534 {
535     if (!shouldContinue)
536         stopLoadingForPolicyChange();
537     else if (m_substituteData.isValid()) {
538         // A redirect resulted in loading substitute data.
539         ASSERT(timing()->redirectCount());
540
541         // We need to remove our reference to the CachedResource in favor of a SubstituteData load.
542         // This will probably trigger the cancellation of the CachedResource's underlying ResourceLoader, though there is a
543         // small chance that the resource is being loaded by a different Frame, preventing the ResourceLoader from being cancelled.
544         // If the ResourceLoader is indeed cancelled, it would normally send resource load callbacks.
545         // However, from an API perspective, this isn't a cancellation. Therefore, sever our relationship with the network load,
546         // but prevent the ResourceLoader from sending ResourceLoadNotifier callbacks.
547         RefPtr<ResourceLoader> resourceLoader = mainResourceLoader();
548         ASSERT(resourceLoader->shouldSendResourceLoadCallbacks());
549         resourceLoader->setSendCallbackPolicy(DoNotSendCallbacks);
550         if (m_mainResource) {
551             m_mainResource->removeClient(this);
552             m_mainResource = 0;
553         }
554         resourceLoader->setSendCallbackPolicy(SendCallbacks);
555         handleSubstituteDataLoadSoon();
556     }
557 }
558
559 void DocumentLoader::responseReceived(CachedResource* resource, const ResourceResponse& response)
560 {
561     ASSERT_UNUSED(resource, m_mainResource == resource);
562     RefPtr<DocumentLoader> protect(this);
563     bool willLoadFallback = m_applicationCacheHost->maybeLoadFallbackForMainResponse(request(), response);
564
565     // The memory cache doesn't understand the application cache or its caching rules. So if a main resource is served
566     // from the application cache, ensure we don't save the result for future use.
567     bool shouldRemoveResourceFromCache = willLoadFallback;
568 #if PLATFORM(CHROMIUM)
569     // chromium's ApplicationCacheHost implementation always returns true for maybeLoadFallbackForMainResponse(). However, all responses loaded
570     // from appcache will have a non-zero appCacheID().
571     if (response.appCacheID())
572         shouldRemoveResourceFromCache = true;
573 #endif
574     if (shouldRemoveResourceFromCache)
575         memoryCache()->remove(m_mainResource.get());
576
577     if (willLoadFallback)
578         return;
579
580     DEFINE_STATIC_LOCAL(AtomicString, xFrameOptionHeader, ("x-frame-options", AtomicString::ConstructFromLiteral));
581     HTTPHeaderMap::const_iterator it = response.httpHeaderFields().find(xFrameOptionHeader);
582     if (it != response.httpHeaderFields().end()) {
583         String content = it->value;
584         unsigned long identifier = m_identifierForLoadWithoutResourceLoader ? m_identifierForLoadWithoutResourceLoader : mainResourceLoader()->identifier();
585         if (frameLoader()->shouldInterruptLoadForXFrameOptions(content, response.url(), identifier)) {
586             InspectorInstrumentation::continueAfterXFrameOptionsDenied(m_frame, this, identifier, response);
587             String message = "Refused to display '" + response.url().elidedString() + "' in a frame because it set 'X-Frame-Options' to '" + content + "'.";
588             frame()->document()->addConsoleMessage(SecurityMessageSource, ErrorMessageLevel, message, identifier);
589             cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
590             return;
591         }
592     }
593
594     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
595     // See <rdar://problem/6304600> for more details.
596 #if !USE(CF)
597     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
598 #endif
599
600     if (m_isLoadingMultipartContent) {
601         setupForReplace();
602         m_mainResource->clear();
603     } else if (response.isMultipart()) {
604         FeatureObserver::observe(m_frame->document(), FeatureObserver::MultipartMainResource);
605         m_isLoadingMultipartContent = true;
606     }
607
608     setResponse(response);
609
610     if (m_identifierForLoadWithoutResourceLoader)
611         frameLoader()->notifier()->dispatchDidReceiveResponse(this, m_identifierForLoadWithoutResourceLoader, m_response, 0);
612
613     ASSERT(!m_waitingForContentPolicy);
614     m_waitingForContentPolicy = true;
615
616     // Always show content with valid substitute data.
617     if (m_substituteData.isValid()) {
618         continueAfterContentPolicy(PolicyUse);
619         return;
620     }
621
622 #if ENABLE(FTPDIR)
623     // Respect the hidden FTP Directory Listing pref so it can be tested even if the policy delegate might otherwise disallow it
624     Settings* settings = m_frame->settings();
625     if (settings && settings->forceFTPDirectoryListings() && m_response.mimeType() == "application/x-ftp-directory") {
626         continueAfterContentPolicy(PolicyUse);
627         return;
628     }
629 #endif
630
631 #if USE(CONTENT_FILTERING)
632     if (response.url().protocolIs("https") && ContentFilter::isEnabled())
633         m_contentFilter = ContentFilter::create(response);
634 #endif
635
636     frameLoader()->policyChecker()->checkContentPolicy(m_response, callContinueAfterContentPolicy, this);
637 }
638
639 void DocumentLoader::callContinueAfterContentPolicy(void* argument, PolicyAction policy)
640 {
641     static_cast<DocumentLoader*>(argument)->continueAfterContentPolicy(policy);
642 }
643
644 void DocumentLoader::continueAfterContentPolicy(PolicyAction policy)
645 {
646     ASSERT(m_waitingForContentPolicy);
647     m_waitingForContentPolicy = false;
648     if (isStopping())
649         return;
650
651     KURL url = m_request.url();
652     const String& mimeType = m_response.mimeType();
653     
654     switch (policy) {
655     case PolicyUse: {
656         // Prevent remote web archives from loading because they can claim to be from any domain and thus avoid cross-domain security checks (4120255).
657         bool isRemoteWebArchive = (equalIgnoringCase("application/x-webarchive", mimeType)
658 #if PLATFORM(GTK)
659             || equalIgnoringCase("message/rfc822", mimeType)
660 #endif
661             || equalIgnoringCase("multipart/related", mimeType))
662             && !m_substituteData.isValid() && !SchemeRegistry::shouldTreatURLSchemeAsLocal(url.protocol());
663         if (!frameLoader()->client()->canShowMIMEType(mimeType) || isRemoteWebArchive) {
664             frameLoader()->policyChecker()->cannotShowMIMEType(m_response);
665             // Check reachedTerminalState since the load may have already been canceled inside of _handleUnimplementablePolicyWithErrorCode::.
666             stopLoadingForPolicyChange();
667             return;
668         }
669         break;
670     }
671
672     case PolicyDownload: {
673         // m_mainResource can be null, e.g. when loading a substitute resource from application cache.
674         if (!m_mainResource) {
675             mainReceivedError(frameLoader()->client()->cannotShowURLError(m_request));
676             return;
677         }
678         InspectorInstrumentation::continueWithPolicyDownload(m_frame, this, mainResourceLoader()->identifier(), m_response);
679
680         // When starting the request, we didn't know that it would result in download and not navigation. Now we know that main document URL didn't change.
681         // Download may use this knowledge for purposes unrelated to cookies, notably for setting file quarantine data.
682         frameLoader()->setOriginalURLForDownloadRequest(m_request);
683         frameLoader()->client()->convertMainResourceLoadToDownload(this, m_request, m_response);
684
685         // It might have gone missing
686         if (mainResourceLoader())
687             mainResourceLoader()->didFail(interruptedForPolicyChangeError());
688         return;
689     }
690     case PolicyIgnore:
691         InspectorInstrumentation::continueWithPolicyIgnore(m_frame, this, mainResourceLoader()->identifier(), m_response);
692         stopLoadingForPolicyChange();
693         return;
694     
695     default:
696         ASSERT_NOT_REACHED();
697     }
698
699     if (m_response.isHTTP()) {
700         int status = m_response.httpStatusCode();
701         if (status < 200 || status >= 300) {
702             bool hostedByObject = frameLoader()->isHostedByObjectElement();
703
704             frameLoader()->handleFallbackContent();
705             // object elements are no longer rendered after we fallback, so don't
706             // keep trying to process data from their load
707
708             if (hostedByObject)
709                 cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
710         }
711     }
712
713     if (!isStopping() && m_substituteData.isValid()) {
714         if (m_substituteData.content()->size())
715             dataReceived(0, m_substituteData.content()->data(), m_substituteData.content()->size());
716         if (isLoadingMainResource())
717             finishedLoading(0);
718     }
719 }
720
721 void DocumentLoader::commitLoad(const char* data, int length)
722 {
723     // Both unloading the old page and parsing the new page may execute JavaScript which destroys the datasource
724     // by starting a new load, so retain temporarily.
725     RefPtr<Frame> protectFrame(m_frame);
726     RefPtr<DocumentLoader> protectLoader(this);
727
728     commitIfReady();
729     FrameLoader* frameLoader = DocumentLoader::frameLoader();
730     if (!frameLoader)
731         return;
732 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
733     if (ArchiveFactory::isArchiveMimeType(response().mimeType()))
734         return;
735 #endif
736     frameLoader->client()->committedLoad(this, data, length);
737 }
738
739 ResourceError DocumentLoader::interruptedForPolicyChangeError() const
740 {
741     return frameLoader()->client()->interruptedForPolicyChangeError(request());
742 }
743
744 void DocumentLoader::stopLoadingForPolicyChange()
745 {
746     ResourceError error = interruptedForPolicyChangeError();
747     error.setIsCancellation(true);
748     cancelMainResourceLoad(error);
749 }
750
751 void DocumentLoader::commitData(const char* bytes, size_t length)
752 {
753     if (!m_gotFirstByte) {
754         m_gotFirstByte = true;
755         m_writer.begin(documentURL(), false);
756         m_writer.setDocumentWasLoadedAsPartOfNavigation();
757
758         if (frameLoader()->stateMachine()->creatingInitialEmptyDocument())
759             return;
760         
761 #if ENABLE(MHTML)
762         // The origin is the MHTML file, we need to set the base URL to the document encoded in the MHTML so
763         // relative URLs are resolved properly.
764         if (m_archive && m_archive->type() == Archive::MHTML)
765             m_frame->document()->setBaseURLOverride(m_archive->mainResource()->url());
766 #endif
767
768         // Call receivedFirstData() exactly once per load. We should only reach this point multiple times
769         // for multipart loads, and FrameLoader::isReplacing() will be true after the first time.
770         if (!isMultipartReplacingLoad())
771             frameLoader()->receivedFirstData();
772
773         bool userChosen = true;
774         String encoding = overrideEncoding();
775         if (encoding.isNull()) {
776             userChosen = false;
777             encoding = response().textEncodingName();
778 #if ENABLE(WEB_ARCHIVE)
779             if (m_archive && m_archive->type() == Archive::WebArchive)
780                 encoding = m_archive->mainResource()->textEncoding();
781 #endif
782         }
783         m_writer.setEncoding(encoding, userChosen);
784     }
785     ASSERT(m_frame->document()->parsing());
786     m_writer.addData(bytes, length);
787 }
788
789 void DocumentLoader::reportMemoryUsage(MemoryObjectInfo* memoryObjectInfo) const
790 {
791     MemoryClassInfo info(memoryObjectInfo, this, WebCoreMemoryTypes::Loader);
792     info.addMember(m_frame, "frame");
793     info.addMember(m_cachedResourceLoader, "cachedResourceLoader");
794     info.addMember(m_mainResource, "mainResource");
795     info.addMember(m_subresourceLoaders, "subresourceLoaders");
796     info.addMember(m_multipartSubresourceLoaders, "multipartSubresourceLoaders");
797     info.addMember(m_plugInStreamLoaders, "plugInStreamLoaders");
798     info.addMember(m_substituteData, "substituteData");
799     info.addMember(m_pageTitle.string(), "pageTitle.string()");
800     info.addMember(m_overrideEncoding, "overrideEncoding");
801     info.addMember(m_responses, "responses");
802     info.addMember(m_originalRequest, "originalRequest");
803     info.addMember(m_originalRequestCopy, "originalRequestCopy");
804     info.addMember(m_request, "request");
805     info.addMember(m_response, "response");
806     info.addMember(m_lastCheckedRequest, "lastCheckedRequest");
807     info.addMember(m_responses, "responses");
808     info.addMember(m_pendingSubstituteResources, "pendingSubstituteResources");
809     info.addMember(m_substituteResourceDeliveryTimer, "substituteResourceDeliveryTimer");
810     info.addMember(m_archiveResourceCollection, "archiveResourceCollection");
811 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
812     info.addMember(m_archive, "archive");
813     info.addMember(m_parsedArchiveData, "parsedArchiveData");
814 #endif
815     info.addMember(m_resourcesClientKnowsAbout, "resourcesClientKnowsAbout");
816     info.addMember(m_resourcesLoadedFromMemoryCacheForClientNotification, "resourcesLoadedFromMemoryCacheForClientNotification");
817     info.addMember(m_clientRedirectSourceForHistory, "clientRedirectSourceForHistory");
818     info.addMember(m_iconLoadDecisionCallback, "iconLoadDecisionCallback");
819     info.addMember(m_iconDataCallback, "iconDataCallback");
820     info.addMember(m_applicationCacheHost, "applicationCacheHost");
821 }
822
823 void DocumentLoader::dataReceived(CachedResource* resource, const char* data, int length)
824 {
825     ASSERT(data);
826     ASSERT(length);
827     ASSERT_UNUSED(resource, resource == m_mainResource);
828     ASSERT(!m_response.isNull());
829
830 #if USE(CFNETWORK) || PLATFORM(MAC)
831     // Workaround for <rdar://problem/6060782>
832     if (m_response.isNull())
833         setResponse(ResourceResponse(KURL(), "text/html", 0, String(), String()));
834 #endif
835
836     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
837     // See <rdar://problem/6304600> for more details.
838 #if !USE(CF)
839     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
840 #endif
841
842 #if USE(CONTENT_FILTERING)
843     bool loadWasBlockedBeforeFinishing = false;
844     if (m_contentFilter && m_contentFilter->needsMoreData()) {
845         m_contentFilter->addData(data, length);
846
847         if (m_contentFilter->needsMoreData()) {
848             // Since the filter still needs more data to make a decision,
849             // transition back to the committed state so that we don't partially
850             // load content that might later be blocked.
851             commitLoad(0, 0);
852             return;
853         }
854
855         data = m_contentFilter->getReplacementData(length);
856         loadWasBlockedBeforeFinishing = m_contentFilter->didBlockData();
857     }
858 #endif
859
860     if (m_identifierForLoadWithoutResourceLoader)
861         frameLoader()->notifier()->dispatchDidReceiveData(this, m_identifierForLoadWithoutResourceLoader, data, length, -1);
862
863     m_applicationCacheHost->mainResourceDataReceived(data, length, -1, false);
864     m_timeOfLastDataReceived = monotonicallyIncreasingTime();
865
866     if (!isMultipartReplacingLoad())
867         commitLoad(data, length);
868
869 #if USE(CONTENT_FILTERING)
870     if (loadWasBlockedBeforeFinishing)
871         cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
872 #endif
873 }
874
875 void DocumentLoader::setupForReplace()
876 {
877     if (!mainResourceData())
878         return;
879     
880     maybeFinishLoadingMultipartContent();
881     maybeCreateArchive();
882     m_writer.end();
883     frameLoader()->setReplacing();
884     m_gotFirstByte = false;
885     
886     stopLoadingSubresources();
887     stopLoadingPlugIns();
888 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
889     clearArchiveResources();
890 #endif
891 }
892
893 void DocumentLoader::checkLoadComplete()
894 {
895     if (!m_frame || isLoading())
896         return;
897 #if !ENABLE(THREADED_HTML_PARSER)
898     // This ASSERT triggers with the threaded HTML parser.
899     // See https://bugs.webkit.org/show_bug.cgi?id=110937
900     ASSERT(this == frameLoader()->activeDocumentLoader());
901 #endif
902     m_frame->document()->domWindow()->finishedLoading();
903 }
904
905 void DocumentLoader::setFrame(Frame* frame)
906 {
907     if (m_frame == frame)
908         return;
909     ASSERT(frame && !m_frame);
910     m_frame = frame;
911     m_writer.setFrame(frame);
912     attachToFrame();
913 }
914
915 void DocumentLoader::attachToFrame()
916 {
917     ASSERT(m_frame);
918 }
919
920 void DocumentLoader::detachFromFrame()
921 {
922     ASSERT(m_frame);
923     RefPtr<Frame> protectFrame(m_frame);
924     RefPtr<DocumentLoader> protectLoader(this);
925
926     // It never makes sense to have a document loader that is detached from its
927     // frame have any loads active, so go ahead and kill all the loads.
928     stopLoading();
929
930     m_applicationCacheHost->setDOMApplicationCache(0);
931     InspectorInstrumentation::loaderDetachedFromFrame(m_frame, this);
932     m_frame = 0;
933 }
934
935 void DocumentLoader::clearMainResourceLoader()
936 {
937     m_loadingMainResource = false;
938     if (this == frameLoader()->activeDocumentLoader())
939         checkLoadComplete();
940 }
941
942 bool DocumentLoader::isLoadingInAPISense() const
943 {
944     // Once a frame has loaded, we no longer need to consider subresources,
945     // but we still need to consider subframes.
946     if (frameLoader()->state() != FrameStateComplete) {
947         if (m_frame->settings()->needsIsLoadingInAPISenseQuirk() && !m_subresourceLoaders.isEmpty())
948             return true;
949     
950         Document* doc = m_frame->document();
951         if ((isLoadingMainResource() || !m_frame->document()->loadEventFinished()) && isLoading())
952             return true;
953         if (m_cachedResourceLoader->requestCount())
954             return true;
955         if (doc->processingLoadEvent())
956             return true;
957         if (doc->hasActiveParser())
958             return true;
959     }
960     return frameLoader()->subframeIsLoading();
961 }
962
963 bool DocumentLoader::maybeCreateArchive()
964 {
965 #if !ENABLE(WEB_ARCHIVE) && !ENABLE(MHTML)
966     return false;
967 #else
968     
969     // Give the archive machinery a crack at this document. If the MIME type is not an archive type, it will return 0.
970     RefPtr<ResourceBuffer> mainResourceBuffer = mainResourceData();
971     m_archive = ArchiveFactory::create(m_response.url(), mainResourceBuffer ? mainResourceBuffer->sharedBuffer() : 0, m_response.mimeType());
972     if (!m_archive)
973         return false;
974     
975     addAllArchiveResources(m_archive.get());
976     ArchiveResource* mainResource = m_archive->mainResource();
977     m_parsedArchiveData = mainResource->data();
978     m_writer.setMIMEType(mainResource->mimeType());
979     
980     ASSERT(m_frame->document());
981     commitData(mainResource->data()->data(), mainResource->data()->size());
982     return true;
983 #endif // !ENABLE(WEB_ARCHIVE) && !ENABLE(MHTML)
984 }
985
986 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
987 void DocumentLoader::setArchive(PassRefPtr<Archive> archive)
988 {
989     m_archive = archive;
990     addAllArchiveResources(m_archive.get());
991 }
992
993 void DocumentLoader::addAllArchiveResources(Archive* archive)
994 {
995     if (!m_archiveResourceCollection)
996         m_archiveResourceCollection = adoptPtr(new ArchiveResourceCollection);
997         
998     ASSERT(archive);
999     if (!archive)
1000         return;
1001         
1002     m_archiveResourceCollection->addAllResources(archive);
1003 }
1004
1005 // FIXME: Adding a resource directly to a DocumentLoader/ArchiveResourceCollection seems like bad design, but is API some apps rely on.
1006 // Can we change the design in a manner that will let us deprecate that API without reducing functionality of those apps?
1007 void DocumentLoader::addArchiveResource(PassRefPtr<ArchiveResource> resource)
1008 {
1009     if (!m_archiveResourceCollection)
1010         m_archiveResourceCollection = adoptPtr(new ArchiveResourceCollection);
1011         
1012     ASSERT(resource);
1013     if (!resource)
1014         return;
1015         
1016     m_archiveResourceCollection->addResource(resource);
1017 }
1018
1019 PassRefPtr<Archive> DocumentLoader::popArchiveForSubframe(const String& frameName, const KURL& url)
1020 {
1021     return m_archiveResourceCollection ? m_archiveResourceCollection->popSubframeArchive(frameName, url) : PassRefPtr<Archive>(0);
1022 }
1023
1024 void DocumentLoader::clearArchiveResources()
1025 {
1026     m_archiveResourceCollection.clear();
1027     m_substituteResourceDeliveryTimer.stop();
1028 }
1029
1030 SharedBuffer* DocumentLoader::parsedArchiveData() const
1031 {
1032     return m_parsedArchiveData.get();
1033 }
1034 #endif // ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
1035
1036 ArchiveResource* DocumentLoader::archiveResourceForURL(const KURL& url) const
1037 {
1038     if (!m_archiveResourceCollection)
1039         return 0;
1040         
1041     ArchiveResource* resource = m_archiveResourceCollection->archiveResourceForURL(url);
1042
1043     return resource && !resource->shouldIgnoreWhenUnarchiving() ? resource : 0;
1044 }
1045
1046 PassRefPtr<ArchiveResource> DocumentLoader::mainResource() const
1047 {
1048     const ResourceResponse& r = response();
1049     
1050     RefPtr<ResourceBuffer> mainResourceBuffer = mainResourceData();
1051     RefPtr<SharedBuffer> data = mainResourceBuffer ? mainResourceBuffer->sharedBuffer() : 0;
1052     if (!data)
1053         data = SharedBuffer::create();
1054         
1055     return ArchiveResource::create(data, r.url(), r.mimeType(), r.textEncodingName(), frame()->tree()->uniqueName());
1056 }
1057
1058 PassRefPtr<ArchiveResource> DocumentLoader::subresource(const KURL& url) const
1059 {
1060     if (!isCommitted())
1061         return 0;
1062     
1063     CachedResource* resource = m_cachedResourceLoader->cachedResource(url);
1064     if (!resource || !resource->isLoaded())
1065         return archiveResourceForURL(url);
1066
1067     if (resource->type() == CachedResource::MainResource)
1068         return 0;
1069
1070     // FIXME: This has the side effect of making the resource non-purgeable.
1071     // It would be better if it didn't have this permanent effect.
1072     if (!resource->makePurgeable(false))
1073         return 0;
1074
1075     ResourceBuffer* data = resource->resourceBuffer();
1076     if (!data)
1077         return 0;
1078
1079     return ArchiveResource::create(data->sharedBuffer(), url, resource->response());
1080 }
1081
1082 void DocumentLoader::getSubresources(Vector<PassRefPtr<ArchiveResource> >& subresources) const
1083 {
1084     if (!isCommitted())
1085         return;
1086
1087     const CachedResourceLoader::DocumentResourceMap& allResources = m_cachedResourceLoader->allCachedResources();
1088     CachedResourceLoader::DocumentResourceMap::const_iterator end = allResources.end();
1089     for (CachedResourceLoader::DocumentResourceMap::const_iterator it = allResources.begin(); it != end; ++it) {
1090         RefPtr<ArchiveResource> subresource = this->subresource(KURL(ParsedURLString, it->value->url()));
1091         if (subresource)
1092             subresources.append(subresource.release());
1093     }
1094
1095     return;
1096 }
1097
1098 void DocumentLoader::deliverSubstituteResourcesAfterDelay()
1099 {
1100     if (m_pendingSubstituteResources.isEmpty())
1101         return;
1102     ASSERT(m_frame && m_frame->page());
1103     if (m_frame->page()->defersLoading())
1104         return;
1105     if (!m_substituteResourceDeliveryTimer.isActive())
1106         m_substituteResourceDeliveryTimer.startOneShot(0);
1107 }
1108
1109 void DocumentLoader::substituteResourceDeliveryTimerFired(Timer<DocumentLoader>*)
1110 {
1111     if (m_pendingSubstituteResources.isEmpty())
1112         return;
1113     ASSERT(m_frame && m_frame->page());
1114     if (m_frame->page()->defersLoading())
1115         return;
1116
1117     SubstituteResourceMap copy;
1118     copy.swap(m_pendingSubstituteResources);
1119
1120     SubstituteResourceMap::const_iterator end = copy.end();
1121     for (SubstituteResourceMap::const_iterator it = copy.begin(); it != end; ++it) {
1122         RefPtr<ResourceLoader> loader = it->key;
1123         SubstituteResource* resource = it->value.get();
1124         
1125         if (resource) {
1126             SharedBuffer* data = resource->data();
1127         
1128             loader->didReceiveResponse(resource->response());
1129
1130             // Calling ResourceLoader::didReceiveResponse can end up cancelling the load,
1131             // so we need to check if the loader has reached its terminal state.
1132             if (loader->reachedTerminalState())
1133                 return;
1134
1135             loader->didReceiveData(data->data(), data->size(), data->size(), DataPayloadWholeResource);
1136
1137             // Calling ResourceLoader::didReceiveData can end up cancelling the load,
1138             // so we need to check if the loader has reached its terminal state.
1139             if (loader->reachedTerminalState())
1140                 return;
1141
1142             loader->didFinishLoading(0);
1143         } else {
1144             // A null resource means that we should fail the load.
1145             // FIXME: Maybe we should use another error here - something like "not in cache".
1146             loader->didFail(loader->cannotShowURLError());
1147         }
1148     }
1149 }
1150
1151 #ifndef NDEBUG
1152 bool DocumentLoader::isSubstituteLoadPending(ResourceLoader* loader) const
1153 {
1154     return m_pendingSubstituteResources.contains(loader);
1155 }
1156 #endif
1157
1158 void DocumentLoader::cancelPendingSubstituteLoad(ResourceLoader* loader)
1159 {
1160     if (m_pendingSubstituteResources.isEmpty())
1161         return;
1162     m_pendingSubstituteResources.remove(loader);
1163     if (m_pendingSubstituteResources.isEmpty())
1164         m_substituteResourceDeliveryTimer.stop();
1165 }
1166
1167 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
1168 bool DocumentLoader::scheduleArchiveLoad(ResourceLoader* loader, const ResourceRequest& request)
1169 {
1170     if (ArchiveResource* resource = archiveResourceForURL(request.url())) {
1171         m_pendingSubstituteResources.set(loader, resource);
1172         deliverSubstituteResourcesAfterDelay();
1173         return true;
1174     }
1175
1176     if (!m_archive)
1177         return false;
1178
1179     switch (m_archive->type()) {
1180 #if ENABLE(WEB_ARCHIVE)
1181     case Archive::WebArchive:
1182         // WebArchiveDebugMode means we fail loads instead of trying to fetch them from the network if they're not in the archive.
1183         return m_frame->settings() && m_frame->settings()->webArchiveDebugModeEnabled() && ArchiveFactory::isArchiveMimeType(responseMIMEType());
1184 #endif
1185 #if ENABLE(MHTML)
1186     case Archive::MHTML:
1187         return true; // Always fail the load for resources not included in the MHTML.
1188 #endif
1189     default:
1190         return false;
1191     }
1192 }
1193 #endif // ENABLE(WEB_ARCHIVE)
1194
1195 void DocumentLoader::addResponse(const ResourceResponse& r)
1196 {
1197     if (!m_stopRecordingResponses)
1198         m_responses.append(r);
1199 }
1200
1201 void DocumentLoader::stopRecordingResponses()
1202 {
1203     m_stopRecordingResponses = true;
1204     m_responses.shrinkToFit();
1205 }
1206
1207 void DocumentLoader::setTitle(const StringWithDirection& title)
1208 {
1209     if (m_pageTitle == title)
1210         return;
1211
1212     frameLoader()->willChangeTitle(this);
1213     m_pageTitle = title;
1214     frameLoader()->didChangeTitle(this);
1215 }
1216
1217 KURL DocumentLoader::urlForHistory() const
1218 {
1219     // Return the URL to be used for history and B/F list.
1220     // Returns nil for WebDataProtocol URLs that aren't alternates 
1221     // for unreachable URLs, because these can't be stored in history.
1222     if (m_substituteData.isValid())
1223         return unreachableURL();
1224
1225     return m_originalRequestCopy.url();
1226 }
1227
1228 bool DocumentLoader::urlForHistoryReflectsFailure() const
1229 {
1230     return m_substituteData.isValid() || m_response.httpStatusCode() >= 400;
1231 }
1232
1233 const KURL& DocumentLoader::originalURL() const
1234 {
1235     return m_originalRequestCopy.url();
1236 }
1237
1238 const KURL& DocumentLoader::requestURL() const
1239 {
1240     return request().url();
1241 }
1242
1243 const KURL& DocumentLoader::responseURL() const
1244 {
1245     return m_response.url();
1246 }
1247
1248 KURL DocumentLoader::documentURL() const
1249 {
1250     KURL url = substituteData().responseURL();
1251 #if ENABLE(WEB_ARCHIVE)
1252     if (url.isEmpty() && m_archive && m_archive->type() == Archive::WebArchive)
1253         url = m_archive->mainResource()->url();
1254 #endif
1255     if (url.isEmpty())
1256         url = requestURL();
1257     if (url.isEmpty())
1258         url = responseURL();
1259     return url;
1260 }
1261
1262 const String& DocumentLoader::responseMIMEType() const
1263 {
1264     return m_response.mimeType();
1265 }
1266
1267 const KURL& DocumentLoader::unreachableURL() const
1268 {
1269     return m_substituteData.failingURL();
1270 }
1271
1272 void DocumentLoader::setDefersLoading(bool defers)
1273 {
1274     if (mainResourceLoader())
1275         mainResourceLoader()->setDefersLoading(defers);
1276     setAllDefersLoading(m_subresourceLoaders, defers);
1277     setAllDefersLoading(m_plugInStreamLoaders, defers);
1278     if (!defers)
1279         deliverSubstituteResourcesAfterDelay();
1280 }
1281
1282 void DocumentLoader::setMainResourceDataBufferingPolicy(DataBufferingPolicy dataBufferingPolicy)
1283 {
1284     if (m_mainResource)
1285         m_mainResource->setDataBufferingPolicy(dataBufferingPolicy);
1286 }
1287
1288 void DocumentLoader::stopLoadingPlugIns()
1289 {
1290     cancelAll(m_plugInStreamLoaders);
1291 }
1292
1293 void DocumentLoader::stopLoadingSubresources()
1294 {
1295     cancelAll(m_subresourceLoaders);
1296 }
1297
1298 void DocumentLoader::addSubresourceLoader(ResourceLoader* loader)
1299 {
1300     // The main resource's underlying ResourceLoader will ask to be added here.
1301     // It is much simpler to handle special casing of main resource loads if we don't
1302     // let it be added. In the main resource load case, mainResourceLoader()
1303     // will still be null at this point, but m_gotFirstByte should be false here if and only
1304     // if we are just starting the main resource load.
1305     if (!m_gotFirstByte)
1306         return;
1307     ASSERT(!m_subresourceLoaders.contains(loader));
1308     ASSERT(!mainResourceLoader() || mainResourceLoader() != loader);
1309     m_subresourceLoaders.add(loader);
1310 }
1311
1312 void DocumentLoader::removeSubresourceLoader(ResourceLoader* loader)
1313 {
1314     if (!m_subresourceLoaders.contains(loader))
1315         return;
1316     m_subresourceLoaders.remove(loader);
1317     checkLoadComplete();
1318     if (Frame* frame = m_frame)
1319         frame->loader()->checkLoadComplete();
1320 }
1321
1322 void DocumentLoader::addPlugInStreamLoader(ResourceLoader* loader)
1323 {
1324     m_plugInStreamLoaders.add(loader);
1325 }
1326
1327 void DocumentLoader::removePlugInStreamLoader(ResourceLoader* loader)
1328 {
1329     m_plugInStreamLoaders.remove(loader);
1330     checkLoadComplete();
1331 }
1332
1333 bool DocumentLoader::isMultipartReplacingLoad() const
1334 {
1335     return isLoadingMultipartContent() && frameLoader()->isReplacing();
1336 }
1337
1338 bool DocumentLoader::maybeLoadEmpty()
1339 {
1340     bool shouldLoadEmpty = !m_substituteData.isValid() && (m_request.url().isEmpty() || SchemeRegistry::shouldLoadURLSchemeAsEmptyDocument(m_request.url().protocol()));
1341     if (!shouldLoadEmpty && !frameLoader()->client()->representationExistsForURLScheme(m_request.url().protocol()))
1342         return false;
1343
1344     if (m_request.url().isEmpty() && !frameLoader()->stateMachine()->creatingInitialEmptyDocument())
1345         m_request.setURL(blankURL());
1346     String mimeType = shouldLoadEmpty ? "text/html" : frameLoader()->client()->generatedMIMETypeForURLScheme(m_request.url().protocol());
1347     setResponse(ResourceResponse(m_request.url(), mimeType, 0, String(), String()));
1348     finishedLoading(monotonicallyIncreasingTime());
1349     return true;
1350 }
1351
1352 void DocumentLoader::startLoadingMainResource()
1353 {
1354     m_mainDocumentError = ResourceError();
1355     timing()->markNavigationStart();
1356     ASSERT(!m_mainResource);
1357     ASSERT(!m_loadingMainResource);
1358     m_loadingMainResource = true;
1359
1360     if (maybeLoadEmpty())
1361         return;
1362
1363     // FIXME: Is there any way the extra fields could have not been added by now?
1364     // If not, it would be great to remove this line of code.
1365     // Note that currently, some requests may have incorrect extra fields even if this function has been called,
1366     // because we pass a wrong loadType (see FIXME in addExtraFieldsToMainResourceRequest()).
1367     frameLoader()->addExtraFieldsToMainResourceRequest(m_request);
1368
1369     ASSERT(timing()->navigationStart());
1370     ASSERT(!timing()->fetchStart());
1371     timing()->markFetchStart();
1372     willSendRequest(m_request, ResourceResponse());
1373
1374     // willSendRequest() may lead to our Frame being detached or cancelling the load via nulling the ResourceRequest.
1375     if (!m_frame || m_request.isNull())
1376         return;
1377
1378     m_applicationCacheHost->maybeLoadMainResource(m_request, m_substituteData);
1379
1380     if (m_substituteData.isValid()) {
1381         m_identifierForLoadWithoutResourceLoader = m_frame->page()->progress()->createUniqueIdentifier();
1382         frameLoader()->notifier()->assignIdentifierToInitialRequest(m_identifierForLoadWithoutResourceLoader, this, m_request);
1383         frameLoader()->notifier()->dispatchWillSendRequest(this, m_identifierForLoadWithoutResourceLoader, m_request, ResourceResponse());
1384         handleSubstituteDataLoadSoon();
1385         return;
1386     }
1387
1388     ResourceRequest request(m_request);
1389     DEFINE_STATIC_LOCAL(ResourceLoaderOptions, mainResourceLoadOptions,
1390         (SendCallbacks, SniffContent, BufferData, AllowStoredCredentials, AskClientForCrossOriginCredentials, SkipSecurityCheck));
1391     CachedResourceRequest cachedResourceRequest(request, mainResourceLoadOptions);
1392     m_mainResource = m_cachedResourceLoader->requestMainResource(cachedResourceRequest);
1393     if (!m_mainResource) {
1394         setRequest(ResourceRequest());
1395         // If the load was aborted by clearing m_request, it's possible the ApplicationCacheHost
1396         // is now in a state where starting an empty load will be inconsistent. Replace it with
1397         // a new ApplicationCacheHost.
1398         m_applicationCacheHost = adoptPtr(new ApplicationCacheHost(this));
1399         maybeLoadEmpty();
1400         return;
1401     }
1402
1403     if (!mainResourceLoader()) {
1404         m_identifierForLoadWithoutResourceLoader = m_frame->page()->progress()->createUniqueIdentifier();
1405         frameLoader()->notifier()->assignIdentifierToInitialRequest(m_identifierForLoadWithoutResourceLoader, this, request);
1406         frameLoader()->notifier()->dispatchWillSendRequest(this, m_identifierForLoadWithoutResourceLoader, request, ResourceResponse());
1407     }
1408     m_mainResource->addClient(this);
1409
1410     // A bunch of headers are set when the underlying ResourceLoader is created, and m_request needs to include those.
1411     if (mainResourceLoader())
1412         request = mainResourceLoader()->originalRequest();
1413     // If there was a fragment identifier on m_request, the cache will have stripped it. m_request should include
1414     // the fragment identifier, so add that back in.
1415     if (equalIgnoringFragmentIdentifier(m_request.url(), request.url()))
1416         request.setURL(m_request.url());
1417     setRequest(request);
1418 }
1419
1420 void DocumentLoader::cancelMainResourceLoad(const ResourceError& resourceError)
1421 {
1422     RefPtr<DocumentLoader> protect(this);
1423     ResourceError error = resourceError.isNull() ? frameLoader()->cancelledError(m_request) : resourceError;
1424
1425     m_dataLoadTimer.stop();
1426     if (m_waitingForContentPolicy) {
1427         frameLoader()->policyChecker()->cancelCheck();
1428         ASSERT(m_waitingForContentPolicy);
1429         m_waitingForContentPolicy = false;
1430     }
1431
1432     if (mainResourceLoader())
1433         mainResourceLoader()->cancel(error);
1434
1435     mainReceivedError(error);
1436 }
1437
1438 void DocumentLoader::subresourceLoaderFinishedLoadingOnePart(ResourceLoader* loader)
1439 {
1440     m_multipartSubresourceLoaders.add(loader);
1441     m_subresourceLoaders.remove(loader);
1442     checkLoadComplete();
1443     if (Frame* frame = m_frame)
1444         frame->loader()->checkLoadComplete();    
1445 }
1446
1447 void DocumentLoader::maybeFinishLoadingMultipartContent()
1448 {
1449     if (!isMultipartReplacingLoad())
1450         return;
1451
1452     frameLoader()->setupForReplace();
1453     m_committed = false;
1454     RefPtr<ResourceBuffer> resourceData = mainResourceData();
1455     commitLoad(resourceData->data(), resourceData->size());
1456 }
1457
1458 void DocumentLoader::iconLoadDecisionAvailable()
1459 {
1460     if (m_frame)
1461         m_frame->loader()->icon()->loadDecisionReceived(iconDatabase().synchronousLoadDecisionForIconURL(frameLoader()->icon()->url(), this));
1462 }
1463
1464 static void iconLoadDecisionCallback(IconLoadDecision decision, void* context)
1465 {
1466     static_cast<DocumentLoader*>(context)->continueIconLoadWithDecision(decision);
1467 }
1468
1469 void DocumentLoader::getIconLoadDecisionForIconURL(const String& urlString)
1470 {
1471     if (m_iconLoadDecisionCallback)
1472         m_iconLoadDecisionCallback->invalidate();
1473     m_iconLoadDecisionCallback = IconLoadDecisionCallback::create(this, iconLoadDecisionCallback);
1474     iconDatabase().loadDecisionForIconURL(urlString, m_iconLoadDecisionCallback);
1475 }
1476
1477 void DocumentLoader::continueIconLoadWithDecision(IconLoadDecision decision)
1478 {
1479     ASSERT(m_iconLoadDecisionCallback);
1480     m_iconLoadDecisionCallback = 0;
1481     if (m_frame)
1482         m_frame->loader()->icon()->continueLoadWithDecision(decision);
1483 }
1484
1485 static void iconDataCallback(SharedBuffer*, void*)
1486 {
1487     // FIXME: Implement this once we know what parts of WebCore actually need the icon data returned.
1488 }
1489
1490 void DocumentLoader::getIconDataForIconURL(const String& urlString)
1491 {   
1492     if (m_iconDataCallback)
1493         m_iconDataCallback->invalidate();
1494     m_iconDataCallback = IconDataCallback::create(this, iconDataCallback);
1495     iconDatabase().iconDataForIconURL(urlString, m_iconDataCallback);
1496 }
1497
1498 void DocumentLoader::handledOnloadEvents()
1499 {
1500     m_wasOnloadHandled = true;
1501     applicationCacheHost()->stopDeferringEvents();
1502 }
1503
1504 } // namespace WebCore