Fix double hash lookup in DocumentLoader::removeSubresourceLoader().
[WebKit-https.git] / Source / WebCore / loader / DocumentLoader.cpp
1 /*
2  * Copyright (C) 2006, 2007, 2008 Apple Inc. All rights reserved.
3  * Copyright (C) 2011 Google Inc. All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  *
9  * 1.  Redistributions of source code must retain the above copyright
10  *     notice, this list of conditions and the following disclaimer. 
11  * 2.  Redistributions in binary form must reproduce the above copyright
12  *     notice, this list of conditions and the following disclaimer in the
13  *     documentation and/or other materials provided with the distribution. 
14  * 3.  Neither the name of Apple Computer, Inc. ("Apple") nor the names of
15  *     its contributors may be used to endorse or promote products derived
16  *     from this software without specific prior written permission. 
17  *
18  * THIS SOFTWARE IS PROVIDED BY APPLE AND ITS CONTRIBUTORS "AS IS" AND ANY
19  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
20  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
21  * DISCLAIMED. IN NO EVENT SHALL APPLE OR ITS CONTRIBUTORS BE LIABLE FOR ANY
22  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
23  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
24  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
25  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
26  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
27  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
28  */
29
30 #include "config.h"
31 #include "DocumentLoader.h"
32
33 #include "ApplicationCacheHost.h"
34 #include "ArchiveResourceCollection.h"
35 #include "CachedPage.h"
36 #include "CachedRawResource.h"
37 #include "CachedResourceLoader.h"
38 #include "DOMWindow.h"
39 #include "Document.h"
40 #include "DocumentParser.h"
41 #include "DocumentWriter.h"
42 #include "Event.h"
43 #include "FormState.h"
44 #include "Frame.h"
45 #include "FrameLoader.h"
46 #include "FrameLoaderClient.h"
47 #include "FrameTree.h"
48 #include "HTMLFormElement.h"
49 #include "HTMLFrameOwnerElement.h"
50 #include "HistoryItem.h"
51 #include "IconController.h"
52 #include "InspectorInstrumentation.h"
53 #include "Logging.h"
54 #include "MemoryCache.h"
55 #include "Page.h"
56 #include "PolicyChecker.h"
57 #include "ProgressTracker.h"
58 #include "ResourceBuffer.h"
59 #include "SchemeRegistry.h"
60 #include "SecurityPolicy.h"
61 #include "Settings.h"
62 #include "SubresourceLoader.h"
63 #include "TextResourceDecoder.h"
64 #include <wtf/Assertions.h>
65 #include <wtf/text/CString.h>
66 #include <wtf/text/WTFString.h>
67 #include <wtf/unicode/Unicode.h>
68
69 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
70 #include "ArchiveFactory.h"
71 #endif
72
73 #if USE(CONTENT_FILTERING)
74 #include "ContentFilter.h"
75 #endif
76
77 namespace WebCore {
78
79 static void cancelAll(const ResourceLoaderSet& loaders)
80 {
81     Vector<RefPtr<ResourceLoader> > loadersCopy;
82     copyToVector(loaders, loadersCopy);
83     size_t size = loadersCopy.size();
84     for (size_t i = 0; i < size; ++i)
85         loadersCopy[i]->cancel();
86 }
87
88 static void setAllDefersLoading(const ResourceLoaderSet& loaders, bool defers)
89 {
90     Vector<RefPtr<ResourceLoader> > loadersCopy;
91     copyToVector(loaders, loadersCopy);
92     size_t size = loadersCopy.size();
93     for (size_t i = 0; i < size; ++i)
94         loadersCopy[i]->setDefersLoading(defers);
95 }
96
97 DocumentLoader::DocumentLoader(const ResourceRequest& req, const SubstituteData& substituteData)
98     : m_deferMainResourceDataLoad(true)
99     , m_frame(0)
100     , m_cachedResourceLoader(CachedResourceLoader::create(this))
101     , m_writer(m_frame)
102     , m_originalRequest(req)
103     , m_substituteData(substituteData)
104     , m_originalRequestCopy(req)
105     , m_request(req)
106     , m_originalSubstituteDataWasValid(substituteData.isValid())
107     , m_committed(false)
108     , m_isStopping(false)
109     , m_gotFirstByte(false)
110     , m_isClientRedirect(false)
111     , m_isLoadingMultipartContent(false)
112     , m_wasOnloadHandled(false)
113     , m_stopRecordingResponses(false)
114     , m_substituteResourceDeliveryTimer(this, &DocumentLoader::substituteResourceDeliveryTimerFired)
115     , m_didCreateGlobalHistoryEntry(false)
116     , m_loadingMainResource(false)
117     , m_timeOfLastDataReceived(0.0)
118     , m_identifierForLoadWithoutResourceLoader(0)
119     , m_dataLoadTimer(this, &DocumentLoader::handleSubstituteDataLoadNow)
120     , m_waitingForContentPolicy(false)
121     , m_applicationCacheHost(adoptPtr(new ApplicationCacheHost(this)))
122 {
123 }
124
125 FrameLoader* DocumentLoader::frameLoader() const
126 {
127     if (!m_frame)
128         return 0;
129     return m_frame->loader();
130 }
131
132 ResourceLoader* DocumentLoader::mainResourceLoader() const
133 {
134     return m_mainResource ? m_mainResource->loader() : 0;
135 }
136
137 DocumentLoader::~DocumentLoader()
138 {
139     ASSERT(!m_frame || frameLoader()->activeDocumentLoader() != this || !isLoading());
140     if (m_iconLoadDecisionCallback)
141         m_iconLoadDecisionCallback->invalidate();
142     if (m_iconDataCallback)
143         m_iconDataCallback->invalidate();
144     m_cachedResourceLoader->clearDocumentLoader();
145     
146     clearMainResource();
147 }
148
149 PassRefPtr<ResourceBuffer> DocumentLoader::mainResourceData() const
150 {
151     if (m_substituteData.isValid())
152         return ResourceBuffer::create(m_substituteData.content()->data(), m_substituteData.content()->size());
153     if (m_mainResource)
154         return m_mainResource->resourceBuffer();
155     return 0;
156 }
157
158 Document* DocumentLoader::document() const
159 {
160     if (m_frame && m_frame->loader()->documentLoader() == this)
161         return m_frame->document();
162     return 0;
163 }
164
165 const ResourceRequest& DocumentLoader::originalRequest() const
166 {
167     return m_originalRequest;
168 }
169
170 const ResourceRequest& DocumentLoader::originalRequestCopy() const
171 {
172     return m_originalRequestCopy;
173 }
174
175 const ResourceRequest& DocumentLoader::request() const
176 {
177     return m_request;
178 }
179
180 ResourceRequest& DocumentLoader::request()
181 {
182     return m_request;
183 }
184
185 const KURL& DocumentLoader::url() const
186 {
187     return request().url();
188 }
189
190 void DocumentLoader::replaceRequestURLForSameDocumentNavigation(const KURL& url)
191 {
192     m_originalRequestCopy.setURL(url);
193     m_request.setURL(url);
194 }
195
196 void DocumentLoader::setRequest(const ResourceRequest& req)
197 {
198     // Replacing an unreachable URL with alternate content looks like a server-side
199     // redirect at this point, but we can replace a committed dataSource.
200     bool handlingUnreachableURL = false;
201
202     handlingUnreachableURL = m_substituteData.isValid() && !m_substituteData.failingURL().isEmpty();
203
204     if (handlingUnreachableURL)
205         m_committed = false;
206
207     // We should never be getting a redirect callback after the data
208     // source is committed, except in the unreachable URL case. It 
209     // would be a WebFoundation bug if it sent a redirect callback after commit.
210     ASSERT(!m_committed);
211
212     m_request = req;
213 }
214
215 void DocumentLoader::setMainDocumentError(const ResourceError& error)
216 {
217     m_mainDocumentError = error;    
218     frameLoader()->client()->setMainDocumentError(this, error);
219 }
220
221 void DocumentLoader::mainReceivedError(const ResourceError& error)
222 {
223     ASSERT(!error.isNull());
224     if (m_applicationCacheHost->maybeLoadFallbackForMainError(request(), error))
225         return;
226
227     if (m_identifierForLoadWithoutResourceLoader) {
228         ASSERT(!mainResourceLoader());
229         frameLoader()->client()->dispatchDidFailLoading(this, m_identifierForLoadWithoutResourceLoader, error);
230     }
231
232     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
233     // See <rdar://problem/6304600> for more details.
234 #if !USE(CF)
235     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
236 #endif
237
238     m_applicationCacheHost->failedLoadingMainResource();
239
240     if (!frameLoader())
241         return;
242     setMainDocumentError(error);
243     clearMainResourceLoader();
244     frameLoader()->receivedMainResourceError(error);
245 }
246
247 // Cancels the data source's pending loads.  Conceptually, a data source only loads
248 // one document at a time, but one document may have many related resources. 
249 // stopLoading will stop all loads initiated by the data source, 
250 // but not loads initiated by child frames' data sources -- that's the WebFrame's job.
251 void DocumentLoader::stopLoading()
252 {
253     RefPtr<Frame> protectFrame(m_frame);
254     RefPtr<DocumentLoader> protectLoader(this);
255
256     // In some rare cases, calling FrameLoader::stopLoading could cause isLoading() to return false.
257     // (This can happen when there's a single XMLHttpRequest currently loading and stopLoading causes it
258     // to stop loading. Because of this, we need to save it so we don't return early.
259     bool loading = isLoading();
260     
261     if (m_committed) {
262         // Attempt to stop the frame if the document loader is loading, or if it is done loading but
263         // still  parsing. Failure to do so can cause a world leak.
264         Document* doc = m_frame->document();
265         
266         if (loading || doc->parsing())
267             m_frame->loader()->stopLoading(UnloadEventPolicyNone);
268     }
269
270     // Always cancel multipart loaders
271     cancelAll(m_multipartSubresourceLoaders);
272
273     // Appcache uses ResourceHandle directly, DocumentLoader doesn't count these loads.
274     m_applicationCacheHost->stopLoadingInFrame(m_frame);
275     
276 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
277     clearArchiveResources();
278 #endif
279
280     if (!loading) {
281         // If something above restarted loading we might run into mysterious crashes like 
282         // https://bugs.webkit.org/show_bug.cgi?id=62764 and <rdar://problem/9328684>
283         ASSERT(!isLoading());
284         return;
285     }
286
287     // We might run in to infinite recursion if we're stopping loading as the result of 
288     // detaching from the frame, so break out of that recursion here.
289     // See <rdar://problem/9673866> for more details.
290     if (m_isStopping)
291         return;
292
293     m_isStopping = true;
294
295     FrameLoader* frameLoader = DocumentLoader::frameLoader();
296     
297     if (isLoadingMainResource())
298         // Stop the main resource loader and let it send the cancelled message.
299         cancelMainResourceLoad(frameLoader->cancelledError(m_request));
300     else if (!m_subresourceLoaders.isEmpty())
301         // The main resource loader already finished loading. Set the cancelled error on the 
302         // document and let the subresourceLoaders send individual cancelled messages below.
303         setMainDocumentError(frameLoader->cancelledError(m_request));
304     else
305         // If there are no resource loaders, we need to manufacture a cancelled message.
306         // (A back/forward navigation has no resource loaders because its resources are cached.)
307         mainReceivedError(frameLoader->cancelledError(m_request));
308     
309     stopLoadingSubresources();
310     stopLoadingPlugIns();
311     
312     m_isStopping = false;
313 }
314
315 void DocumentLoader::commitIfReady()
316 {
317     if (!m_committed) {
318         m_committed = true;
319         frameLoader()->commitProvisionalLoad();
320     }
321 }
322
323 bool DocumentLoader::isLoading() const
324 {
325     // FIXME: This should always be enabled, but it seems to cause
326     // http/tests/security/feed-urls-from-remote.html to timeout on Mac WK1
327     // see http://webkit.org/b/110554 and http://webkit.org/b/110401
328 #if ENABLE(THREADED_HTML_PARSER)
329     if (document() && document()->hasActiveParser())
330         return true;
331 #endif
332     return isLoadingMainResource() || !m_subresourceLoaders.isEmpty() || !m_plugInStreamLoaders.isEmpty();
333 }
334
335 void DocumentLoader::notifyFinished(CachedResource* resource)
336 {
337     ASSERT_UNUSED(resource, m_mainResource == resource);
338     ASSERT(m_mainResource);
339     if (!m_mainResource->errorOccurred() && !m_mainResource->wasCanceled()) {
340         finishedLoading(m_mainResource->loadFinishTime());
341         return;
342     }
343
344     if (m_request.cachePolicy() == ReturnCacheDataDontLoad && !m_mainResource->wasCanceled()) {
345         frameLoader()->retryAfterFailedCacheOnlyMainResourceLoad();
346         return;
347     }
348
349     mainReceivedError(m_mainResource->resourceError());
350 }
351
352 void DocumentLoader::finishedLoading(double finishTime)
353 {
354     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
355     // See <rdar://problem/6304600> for more details.
356 #if !USE(CF)
357     ASSERT(!m_frame->page()->defersLoading() || InspectorInstrumentation::isDebuggerPaused(m_frame));
358 #endif
359
360     RefPtr<DocumentLoader> protect(this);
361
362     if (m_identifierForLoadWithoutResourceLoader) {
363         frameLoader()->notifier()->dispatchDidFinishLoading(this, m_identifierForLoadWithoutResourceLoader, finishTime);
364         m_identifierForLoadWithoutResourceLoader = 0;
365     }
366
367 #if USE(CONTENT_FILTERING)
368     if (m_contentFilter && m_contentFilter->needsMoreData()) {
369         m_contentFilter->finishedAddingData();
370         int length;
371         const char* data = m_contentFilter->getReplacementData(length);
372         if (data)
373             dataReceived(m_mainResource.get(), data, length);
374     }
375 #endif
376
377     maybeFinishLoadingMultipartContent();
378
379     double responseEndTime = finishTime;
380     if (!responseEndTime)
381         responseEndTime = m_timeOfLastDataReceived;
382     if (!responseEndTime)
383         responseEndTime = monotonicallyIncreasingTime();
384     timing()->setResponseEnd(responseEndTime);
385
386     commitIfReady();
387     if (!frameLoader())
388         return;
389
390     if (!maybeCreateArchive()) {
391         // If this is an empty document, it will not have actually been created yet. Commit dummy data so that
392         // DocumentWriter::begin() gets called and creates the Document.
393         if (!m_gotFirstByte)
394             commitData(0, 0);
395         frameLoader()->client()->finishedLoading(this);
396     }
397
398     m_writer.end();
399     if (!m_mainDocumentError.isNull())
400         return;
401     clearMainResourceLoader();
402     if (!frameLoader()->stateMachine()->creatingInitialEmptyDocument())
403         frameLoader()->checkLoadComplete();
404
405     // If the document specified an application cache manifest, it violates the author's intent if we store it in the memory cache
406     // and deny the appcache the chance to intercept it in the future, so remove from the memory cache.
407     if (m_frame) {
408         if (m_mainResource && m_frame->document()->hasManifest())
409             memoryCache()->remove(m_mainResource.get());
410     }
411     m_applicationCacheHost->finishedLoadingMainResource();
412 }
413
414 bool DocumentLoader::isPostOrRedirectAfterPost(const ResourceRequest& newRequest, const ResourceResponse& redirectResponse)
415 {
416     if (newRequest.httpMethod() == "POST")
417         return true;
418
419     int status = redirectResponse.httpStatusCode();
420     if (((status >= 301 && status <= 303) || status == 307)
421         && m_originalRequest.httpMethod() == "POST")
422         return true;
423
424     return false;
425 }
426
427 void DocumentLoader::handleSubstituteDataLoadNow(DocumentLoaderTimer*)
428 {
429     KURL url = m_substituteData.responseURL();
430     if (url.isEmpty())
431         url = m_request.url();
432     ResourceResponse response(url, m_substituteData.mimeType(), m_substituteData.content()->size(), m_substituteData.textEncoding(), "");
433     responseReceived(0, response);
434 }
435
436 void DocumentLoader::startDataLoadTimer()
437 {
438     m_dataLoadTimer.startOneShot(0);
439
440 #if HAVE(RUNLOOP_TIMER)
441     if (SchedulePairHashSet* scheduledPairs = m_frame->page()->scheduledRunLoopPairs())
442         m_dataLoadTimer.schedule(*scheduledPairs);
443 #endif
444 }
445
446 void DocumentLoader::handleSubstituteDataLoadSoon()
447 {
448     if (m_deferMainResourceDataLoad)
449         startDataLoadTimer();
450     else
451         handleSubstituteDataLoadNow(0);
452 }
453
454 void DocumentLoader::redirectReceived(CachedResource* resource, ResourceRequest& request, const ResourceResponse& redirectResponse)
455 {
456     ASSERT_UNUSED(resource, resource == m_mainResource);
457     willSendRequest(request, redirectResponse);
458 }
459
460 void DocumentLoader::willSendRequest(ResourceRequest& newRequest, const ResourceResponse& redirectResponse)
461 {
462     // Note that there are no asserts here as there are for the other callbacks. This is due to the
463     // fact that this "callback" is sent when starting every load, and the state of callback
464     // deferrals plays less of a part in this function in preventing the bad behavior deferring 
465     // callbacks is meant to prevent.
466     ASSERT(!newRequest.isNull());
467
468     if (!frameLoader()->checkIfFormActionAllowedByCSP(newRequest.url())) {
469         cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
470         return;
471     }
472
473     ASSERT(timing()->fetchStart());
474     if (!redirectResponse.isNull()) {
475         // If the redirecting url is not allowed to display content from the target origin,
476         // then block the redirect.
477         RefPtr<SecurityOrigin> redirectingOrigin = SecurityOrigin::create(redirectResponse.url());
478         if (!redirectingOrigin->canDisplay(newRequest.url())) {
479             FrameLoader::reportLocalLoadFailed(m_frame, newRequest.url().string());
480             cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
481             return;
482         }
483         timing()->addRedirect(redirectResponse.url(), newRequest.url());
484     }
485
486     // Update cookie policy base URL as URL changes, except for subframes, which use the
487     // URL of the main frame which doesn't change when we redirect.
488     if (frameLoader()->isLoadingMainFrame())
489         newRequest.setFirstPartyForCookies(newRequest.url());
490
491     // If we're fielding a redirect in response to a POST, force a load from origin, since
492     // this is a common site technique to return to a page viewing some data that the POST
493     // just modified.
494     // Also, POST requests always load from origin, but this does not affect subresources.
495     if (newRequest.cachePolicy() == UseProtocolCachePolicy && isPostOrRedirectAfterPost(newRequest, redirectResponse))
496         newRequest.setCachePolicy(ReloadIgnoringCacheData);
497
498     Frame* top = m_frame->tree()->top();
499     if (top != m_frame) {
500         if (!frameLoader()->mixedContentChecker()->canDisplayInsecureContent(top->document()->securityOrigin(), newRequest.url())) {
501             cancelMainResourceLoad(frameLoader()->cancelledError(newRequest));
502             return;
503         }
504     }
505
506     setRequest(newRequest);
507
508     if (!redirectResponse.isNull()) {
509         // We checked application cache for initial URL, now we need to check it for redirected one.
510         ASSERT(!m_substituteData.isValid());
511         m_applicationCacheHost->maybeLoadMainResourceForRedirect(newRequest, m_substituteData);
512         if (m_substituteData.isValid())
513             m_identifierForLoadWithoutResourceLoader = mainResourceLoader()->identifier();
514     }
515
516     // FIXME: Ideally we'd stop the I/O until we hear back from the navigation policy delegate
517     // listener. But there's no way to do that in practice. So instead we cancel later if the
518     // listener tells us to. In practice that means the navigation policy needs to be decided
519     // synchronously for these redirect cases.
520     if (!redirectResponse.isNull())
521         frameLoader()->policyChecker()->checkNavigationPolicy(newRequest, callContinueAfterNavigationPolicy, this);
522 }
523
524 void DocumentLoader::callContinueAfterNavigationPolicy(void* argument, const ResourceRequest& request, PassRefPtr<FormState>, bool shouldContinue)
525 {
526     static_cast<DocumentLoader*>(argument)->continueAfterNavigationPolicy(request, shouldContinue);
527 }
528
529 void DocumentLoader::continueAfterNavigationPolicy(const ResourceRequest&, bool shouldContinue)
530 {
531     if (!shouldContinue)
532         stopLoadingForPolicyChange();
533     else if (m_substituteData.isValid()) {
534         // A redirect resulted in loading substitute data.
535         ASSERT(timing()->redirectCount());
536
537         // We need to remove our reference to the CachedResource in favor of a SubstituteData load.
538         // This will probably trigger the cancellation of the CachedResource's underlying ResourceLoader, though there is a
539         // small chance that the resource is being loaded by a different Frame, preventing the ResourceLoader from being cancelled.
540         // If the ResourceLoader is indeed cancelled, it would normally send resource load callbacks.
541         // However, from an API perspective, this isn't a cancellation. Therefore, sever our relationship with the network load,
542         // but prevent the ResourceLoader from sending ResourceLoadNotifier callbacks.
543         RefPtr<ResourceLoader> resourceLoader = mainResourceLoader();
544         ASSERT(resourceLoader->shouldSendResourceLoadCallbacks());
545         resourceLoader->setSendCallbackPolicy(DoNotSendCallbacks);
546         clearMainResource();
547         resourceLoader->setSendCallbackPolicy(SendCallbacks);
548         handleSubstituteDataLoadSoon();
549     }
550 }
551
552 void DocumentLoader::responseReceived(CachedResource* resource, const ResourceResponse& response)
553 {
554     ASSERT_UNUSED(resource, m_mainResource == resource);
555     RefPtr<DocumentLoader> protect(this);
556     bool willLoadFallback = m_applicationCacheHost->maybeLoadFallbackForMainResponse(request(), response);
557
558     // The memory cache doesn't understand the application cache or its caching rules. So if a main resource is served
559     // from the application cache, ensure we don't save the result for future use.
560     if (willLoadFallback)
561         memoryCache()->remove(m_mainResource.get());
562
563     if (willLoadFallback)
564         return;
565
566     DEFINE_STATIC_LOCAL(AtomicString, xFrameOptionHeader, ("x-frame-options", AtomicString::ConstructFromLiteral));
567     HTTPHeaderMap::const_iterator it = response.httpHeaderFields().find(xFrameOptionHeader);
568     if (it != response.httpHeaderFields().end()) {
569         String content = it->value;
570         ASSERT(m_mainResource);
571         unsigned long identifier = m_identifierForLoadWithoutResourceLoader ? m_identifierForLoadWithoutResourceLoader : m_mainResource->identifier();
572         ASSERT(identifier);
573         if (frameLoader()->shouldInterruptLoadForXFrameOptions(content, response.url(), identifier)) {
574             InspectorInstrumentation::continueAfterXFrameOptionsDenied(m_frame, this, identifier, response);
575             String message = "Refused to display '" + response.url().stringCenterEllipsizedToLength() + "' in a frame because it set 'X-Frame-Options' to '" + content + "'.";
576             frame()->document()->addConsoleMessage(SecurityMessageSource, ErrorMessageLevel, message, identifier);
577             frame()->document()->enforceSandboxFlags(SandboxOrigin);
578             if (HTMLFrameOwnerElement* ownerElement = frame()->ownerElement())
579                 ownerElement->dispatchEvent(Event::create(eventNames().loadEvent, false, false));
580             cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
581             return;
582         }
583     }
584
585     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
586     // See <rdar://problem/6304600> for more details.
587 #if !USE(CF)
588     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
589 #endif
590
591     if (m_isLoadingMultipartContent) {
592         setupForReplace();
593         m_mainResource->clear();
594     } else if (response.isMultipart()) {
595         FeatureObserver::observe(m_frame->document(), FeatureObserver::MultipartMainResource);
596         m_isLoadingMultipartContent = true;
597     }
598
599     m_response = response;
600
601     if (m_identifierForLoadWithoutResourceLoader) {
602         addResponse(m_response);
603         frameLoader()->notifier()->dispatchDidReceiveResponse(this, m_identifierForLoadWithoutResourceLoader, m_response, 0);
604     }
605
606     ASSERT(!m_waitingForContentPolicy);
607     m_waitingForContentPolicy = true;
608
609     // Always show content with valid substitute data.
610     if (m_substituteData.isValid()) {
611         continueAfterContentPolicy(PolicyUse);
612         return;
613     }
614
615 #if ENABLE(FTPDIR)
616     // Respect the hidden FTP Directory Listing pref so it can be tested even if the policy delegate might otherwise disallow it
617     Settings* settings = m_frame->settings();
618     if (settings && settings->forceFTPDirectoryListings() && m_response.mimeType() == "application/x-ftp-directory") {
619         continueAfterContentPolicy(PolicyUse);
620         return;
621     }
622 #endif
623
624 #if USE(CONTENT_FILTERING)
625     if (response.url().protocolIs("https") && ContentFilter::isEnabled())
626         m_contentFilter = ContentFilter::create(response);
627 #endif
628
629     frameLoader()->policyChecker()->checkContentPolicy(m_response, callContinueAfterContentPolicy, this);
630 }
631
632 void DocumentLoader::callContinueAfterContentPolicy(void* argument, PolicyAction policy)
633 {
634     static_cast<DocumentLoader*>(argument)->continueAfterContentPolicy(policy);
635 }
636
637 void DocumentLoader::continueAfterContentPolicy(PolicyAction policy)
638 {
639     ASSERT(m_waitingForContentPolicy);
640     m_waitingForContentPolicy = false;
641     if (isStopping())
642         return;
643
644     KURL url = m_request.url();
645     const String& mimeType = m_response.mimeType();
646     
647     switch (policy) {
648     case PolicyUse: {
649         // Prevent remote web archives from loading because they can claim to be from any domain and thus avoid cross-domain security checks (4120255).
650         bool isRemoteWebArchive = (equalIgnoringCase("application/x-webarchive", mimeType)
651 #if PLATFORM(GTK)
652             || equalIgnoringCase("message/rfc822", mimeType)
653 #endif
654             || equalIgnoringCase("multipart/related", mimeType))
655             && !m_substituteData.isValid() && !SchemeRegistry::shouldTreatURLSchemeAsLocal(url.protocol());
656         if (!frameLoader()->client()->canShowMIMEType(mimeType) || isRemoteWebArchive) {
657             frameLoader()->policyChecker()->cannotShowMIMEType(m_response);
658             // Check reachedTerminalState since the load may have already been canceled inside of _handleUnimplementablePolicyWithErrorCode::.
659             stopLoadingForPolicyChange();
660             return;
661         }
662         break;
663     }
664
665     case PolicyDownload: {
666         // m_mainResource can be null, e.g. when loading a substitute resource from application cache.
667         if (!m_mainResource) {
668             mainReceivedError(frameLoader()->client()->cannotShowURLError(m_request));
669             return;
670         }
671
672         if (ResourceLoader* mainResourceLoader = this->mainResourceLoader())
673             InspectorInstrumentation::continueWithPolicyDownload(m_frame, this, mainResourceLoader->identifier(), m_response);
674
675         // When starting the request, we didn't know that it would result in download and not navigation. Now we know that main document URL didn't change.
676         // Download may use this knowledge for purposes unrelated to cookies, notably for setting file quarantine data.
677         frameLoader()->setOriginalURLForDownloadRequest(m_request);
678         frameLoader()->client()->convertMainResourceLoadToDownload(this, m_request, m_response);
679
680         // It might have gone missing
681         if (mainResourceLoader())
682             mainResourceLoader()->didFail(interruptedForPolicyChangeError());
683         return;
684     }
685     case PolicyIgnore:
686         if (ResourceLoader* mainResourceLoader = this->mainResourceLoader())
687             InspectorInstrumentation::continueWithPolicyIgnore(m_frame, this, mainResourceLoader->identifier(), m_response);
688         stopLoadingForPolicyChange();
689         return;
690     
691     default:
692         ASSERT_NOT_REACHED();
693     }
694
695     if (m_response.isHTTP()) {
696         int status = m_response.httpStatusCode();
697         if (status < 200 || status >= 300) {
698             bool hostedByObject = frameLoader()->isHostedByObjectElement();
699
700             frameLoader()->handleFallbackContent();
701             // object elements are no longer rendered after we fallback, so don't
702             // keep trying to process data from their load
703
704             if (hostedByObject)
705                 cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
706         }
707     }
708
709     if (!isStopping() && m_substituteData.isValid()) {
710         if (m_substituteData.content()->size())
711             dataReceived(0, m_substituteData.content()->data(), m_substituteData.content()->size());
712         if (isLoadingMainResource())
713             finishedLoading(0);
714     }
715 }
716
717 void DocumentLoader::commitLoad(const char* data, int length)
718 {
719     // Both unloading the old page and parsing the new page may execute JavaScript which destroys the datasource
720     // by starting a new load, so retain temporarily.
721     RefPtr<Frame> protectFrame(m_frame);
722     RefPtr<DocumentLoader> protectLoader(this);
723
724     commitIfReady();
725     FrameLoader* frameLoader = DocumentLoader::frameLoader();
726     if (!frameLoader)
727         return;
728 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
729     if (ArchiveFactory::isArchiveMimeType(response().mimeType()))
730         return;
731 #endif
732     frameLoader->client()->committedLoad(this, data, length);
733 }
734
735 ResourceError DocumentLoader::interruptedForPolicyChangeError() const
736 {
737     return frameLoader()->client()->interruptedForPolicyChangeError(request());
738 }
739
740 void DocumentLoader::stopLoadingForPolicyChange()
741 {
742     ResourceError error = interruptedForPolicyChangeError();
743     error.setIsCancellation(true);
744     cancelMainResourceLoad(error);
745 }
746
747 void DocumentLoader::commitData(const char* bytes, size_t length)
748 {
749     if (!m_gotFirstByte) {
750         m_gotFirstByte = true;
751         m_writer.begin(documentURL(), false);
752         m_writer.setDocumentWasLoadedAsPartOfNavigation();
753
754         if (SecurityPolicy::allowSubstituteDataAccessToLocal() && m_originalSubstituteDataWasValid) {
755             // If this document was loaded with substituteData, then the document can
756             // load local resources. See https://bugs.webkit.org/show_bug.cgi?id=16756
757             // and https://bugs.webkit.org/show_bug.cgi?id=19760 for further
758             // discussion.
759             m_frame->document()->securityOrigin()->grantLoadLocalResources();
760         }
761
762         if (frameLoader()->stateMachine()->creatingInitialEmptyDocument())
763             return;
764         
765 #if ENABLE(MHTML)
766         // The origin is the MHTML file, we need to set the base URL to the document encoded in the MHTML so
767         // relative URLs are resolved properly.
768         if (m_archive && m_archive->type() == Archive::MHTML)
769             m_frame->document()->setBaseURLOverride(m_archive->mainResource()->url());
770 #endif
771
772         // Call receivedFirstData() exactly once per load. We should only reach this point multiple times
773         // for multipart loads, and FrameLoader::isReplacing() will be true after the first time.
774         if (!isMultipartReplacingLoad())
775             frameLoader()->receivedFirstData();
776
777         bool userChosen = true;
778         String encoding = overrideEncoding();
779         if (encoding.isNull()) {
780             userChosen = false;
781             encoding = response().textEncodingName();
782 #if ENABLE(WEB_ARCHIVE)
783             if (m_archive && m_archive->type() == Archive::WebArchive)
784                 encoding = m_archive->mainResource()->textEncoding();
785 #endif
786         }
787         m_writer.setEncoding(encoding, userChosen);
788     }
789     ASSERT(m_frame->document()->parsing());
790     m_writer.addData(bytes, length);
791 }
792
793 void DocumentLoader::dataReceived(CachedResource* resource, const char* data, int length)
794 {
795     ASSERT(data);
796     ASSERT(length);
797     ASSERT_UNUSED(resource, resource == m_mainResource);
798     ASSERT(!m_response.isNull());
799
800 #if USE(CFNETWORK) || PLATFORM(MAC)
801     // Workaround for <rdar://problem/6060782>
802     if (m_response.isNull())
803         m_response = ResourceResponse(KURL(), "text/html", 0, String(), String());
804 #endif
805
806     // There is a bug in CFNetwork where callbacks can be dispatched even when loads are deferred.
807     // See <rdar://problem/6304600> for more details.
808 #if !USE(CF)
809     ASSERT(!mainResourceLoader() || !mainResourceLoader()->defersLoading());
810 #endif
811
812 #if USE(CONTENT_FILTERING)
813     bool loadWasBlockedBeforeFinishing = false;
814     if (m_contentFilter && m_contentFilter->needsMoreData()) {
815         m_contentFilter->addData(data, length);
816
817         if (m_contentFilter->needsMoreData()) {
818             // Since the filter still needs more data to make a decision,
819             // transition back to the committed state so that we don't partially
820             // load content that might later be blocked.
821             commitLoad(0, 0);
822             return;
823         }
824
825         data = m_contentFilter->getReplacementData(length);
826         loadWasBlockedBeforeFinishing = m_contentFilter->didBlockData();
827     }
828 #endif
829
830     if (m_identifierForLoadWithoutResourceLoader)
831         frameLoader()->notifier()->dispatchDidReceiveData(this, m_identifierForLoadWithoutResourceLoader, data, length, -1);
832
833     m_applicationCacheHost->mainResourceDataReceived(data, length, -1, false);
834     m_timeOfLastDataReceived = monotonicallyIncreasingTime();
835
836     if (!isMultipartReplacingLoad())
837         commitLoad(data, length);
838
839 #if USE(CONTENT_FILTERING)
840     if (loadWasBlockedBeforeFinishing)
841         cancelMainResourceLoad(frameLoader()->cancelledError(m_request));
842 #endif
843 }
844
845 void DocumentLoader::setupForReplace()
846 {
847     if (!mainResourceData())
848         return;
849     
850     maybeFinishLoadingMultipartContent();
851     maybeCreateArchive();
852     m_writer.end();
853     frameLoader()->setReplacing();
854     m_gotFirstByte = false;
855     
856     stopLoadingSubresources();
857     stopLoadingPlugIns();
858 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
859     clearArchiveResources();
860 #endif
861 }
862
863 void DocumentLoader::checkLoadComplete()
864 {
865     if (!m_frame || isLoading())
866         return;
867 #if !ENABLE(THREADED_HTML_PARSER)
868     // This ASSERT triggers with the threaded HTML parser.
869     // See https://bugs.webkit.org/show_bug.cgi?id=110937
870     ASSERT(this == frameLoader()->activeDocumentLoader());
871 #endif
872     m_frame->document()->domWindow()->finishedLoading();
873 }
874
875 void DocumentLoader::setFrame(Frame* frame)
876 {
877     if (m_frame == frame)
878         return;
879     ASSERT(frame && !m_frame);
880     m_frame = frame;
881     m_writer.setFrame(frame);
882     attachToFrame();
883 }
884
885 void DocumentLoader::attachToFrame()
886 {
887     ASSERT(m_frame);
888 }
889
890 void DocumentLoader::detachFromFrame()
891 {
892     ASSERT(m_frame);
893     RefPtr<Frame> protectFrame(m_frame);
894     RefPtr<DocumentLoader> protectLoader(this);
895
896     // It never makes sense to have a document loader that is detached from its
897     // frame have any loads active, so go ahead and kill all the loads.
898     stopLoading();
899     if (m_mainResource && m_mainResource->hasClient(this))
900         m_mainResource->removeClient(this);
901
902     m_applicationCacheHost->setDOMApplicationCache(0);
903     InspectorInstrumentation::loaderDetachedFromFrame(m_frame, this);
904     m_frame = 0;
905 }
906
907 void DocumentLoader::clearMainResourceLoader()
908 {
909     m_loadingMainResource = false;
910     if (this == frameLoader()->activeDocumentLoader())
911         checkLoadComplete();
912 }
913
914 bool DocumentLoader::isLoadingInAPISense() const
915 {
916     // Once a frame has loaded, we no longer need to consider subresources,
917     // but we still need to consider subframes.
918     if (frameLoader()->state() != FrameStateComplete) {
919         if (m_frame->settings()->needsIsLoadingInAPISenseQuirk() && !m_subresourceLoaders.isEmpty())
920             return true;
921     
922         Document* doc = m_frame->document();
923         if ((isLoadingMainResource() || !m_frame->document()->loadEventFinished()) && isLoading())
924             return true;
925         if (m_cachedResourceLoader->requestCount())
926             return true;
927         if (doc->processingLoadEvent())
928             return true;
929         if (doc->hasActiveParser())
930             return true;
931     }
932     return frameLoader()->subframeIsLoading();
933 }
934
935 bool DocumentLoader::maybeCreateArchive()
936 {
937 #if !ENABLE(WEB_ARCHIVE) && !ENABLE(MHTML)
938     return false;
939 #else
940     
941     // Give the archive machinery a crack at this document. If the MIME type is not an archive type, it will return 0.
942     RefPtr<ResourceBuffer> mainResourceBuffer = mainResourceData();
943     m_archive = ArchiveFactory::create(m_response.url(), mainResourceBuffer ? mainResourceBuffer->sharedBuffer() : 0, m_response.mimeType());
944     if (!m_archive)
945         return false;
946     
947     addAllArchiveResources(m_archive.get());
948     ArchiveResource* mainResource = m_archive->mainResource();
949     m_parsedArchiveData = mainResource->data();
950     m_writer.setMIMEType(mainResource->mimeType());
951     
952     ASSERT(m_frame->document());
953     commitData(mainResource->data()->data(), mainResource->data()->size());
954     return true;
955 #endif // !ENABLE(WEB_ARCHIVE) && !ENABLE(MHTML)
956 }
957
958 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
959 void DocumentLoader::setArchive(PassRefPtr<Archive> archive)
960 {
961     m_archive = archive;
962     addAllArchiveResources(m_archive.get());
963 }
964
965 void DocumentLoader::addAllArchiveResources(Archive* archive)
966 {
967     if (!m_archiveResourceCollection)
968         m_archiveResourceCollection = adoptPtr(new ArchiveResourceCollection);
969         
970     ASSERT(archive);
971     if (!archive)
972         return;
973         
974     m_archiveResourceCollection->addAllResources(archive);
975 }
976
977 // FIXME: Adding a resource directly to a DocumentLoader/ArchiveResourceCollection seems like bad design, but is API some apps rely on.
978 // Can we change the design in a manner that will let us deprecate that API without reducing functionality of those apps?
979 void DocumentLoader::addArchiveResource(PassRefPtr<ArchiveResource> resource)
980 {
981     if (!m_archiveResourceCollection)
982         m_archiveResourceCollection = adoptPtr(new ArchiveResourceCollection);
983         
984     ASSERT(resource);
985     if (!resource)
986         return;
987         
988     m_archiveResourceCollection->addResource(resource);
989 }
990
991 PassRefPtr<Archive> DocumentLoader::popArchiveForSubframe(const String& frameName, const KURL& url)
992 {
993     return m_archiveResourceCollection ? m_archiveResourceCollection->popSubframeArchive(frameName, url) : PassRefPtr<Archive>(0);
994 }
995
996 void DocumentLoader::clearArchiveResources()
997 {
998     m_archiveResourceCollection.clear();
999     m_substituteResourceDeliveryTimer.stop();
1000 }
1001
1002 SharedBuffer* DocumentLoader::parsedArchiveData() const
1003 {
1004     return m_parsedArchiveData.get();
1005 }
1006 #endif // ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
1007
1008 ArchiveResource* DocumentLoader::archiveResourceForURL(const KURL& url) const
1009 {
1010     if (!m_archiveResourceCollection)
1011         return 0;
1012         
1013     ArchiveResource* resource = m_archiveResourceCollection->archiveResourceForURL(url);
1014
1015     return resource && !resource->shouldIgnoreWhenUnarchiving() ? resource : 0;
1016 }
1017
1018 PassRefPtr<ArchiveResource> DocumentLoader::mainResource() const
1019 {
1020     const ResourceResponse& r = response();
1021     
1022     RefPtr<ResourceBuffer> mainResourceBuffer = mainResourceData();
1023     RefPtr<SharedBuffer> data = mainResourceBuffer ? mainResourceBuffer->sharedBuffer() : 0;
1024     if (!data)
1025         data = SharedBuffer::create();
1026         
1027     return ArchiveResource::create(data, r.url(), r.mimeType(), r.textEncodingName(), frame()->tree()->uniqueName());
1028 }
1029
1030 PassRefPtr<ArchiveResource> DocumentLoader::subresource(const KURL& url) const
1031 {
1032     if (!isCommitted())
1033         return 0;
1034     
1035     CachedResource* resource = m_cachedResourceLoader->cachedResource(url);
1036     if (!resource || !resource->isLoaded())
1037         return archiveResourceForURL(url);
1038
1039     if (resource->type() == CachedResource::MainResource)
1040         return 0;
1041
1042     // FIXME: This has the side effect of making the resource non-purgeable.
1043     // It would be better if it didn't have this permanent effect.
1044     if (!resource->makePurgeable(false))
1045         return 0;
1046
1047     ResourceBuffer* data = resource->resourceBuffer();
1048     if (!data)
1049         return 0;
1050
1051     return ArchiveResource::create(data->sharedBuffer(), url, resource->response());
1052 }
1053
1054 void DocumentLoader::getSubresources(Vector<PassRefPtr<ArchiveResource> >& subresources) const
1055 {
1056     if (!isCommitted())
1057         return;
1058
1059     const CachedResourceLoader::DocumentResourceMap& allResources = m_cachedResourceLoader->allCachedResources();
1060     CachedResourceLoader::DocumentResourceMap::const_iterator end = allResources.end();
1061     for (CachedResourceLoader::DocumentResourceMap::const_iterator it = allResources.begin(); it != end; ++it) {
1062         RefPtr<ArchiveResource> subresource = this->subresource(KURL(ParsedURLString, it->value->url()));
1063         if (subresource)
1064             subresources.append(subresource.release());
1065     }
1066
1067     return;
1068 }
1069
1070 void DocumentLoader::deliverSubstituteResourcesAfterDelay()
1071 {
1072     if (m_pendingSubstituteResources.isEmpty())
1073         return;
1074     ASSERT(m_frame && m_frame->page());
1075     if (m_frame->page()->defersLoading())
1076         return;
1077     if (!m_substituteResourceDeliveryTimer.isActive())
1078         m_substituteResourceDeliveryTimer.startOneShot(0);
1079 }
1080
1081 void DocumentLoader::substituteResourceDeliveryTimerFired(Timer<DocumentLoader>*)
1082 {
1083     if (m_pendingSubstituteResources.isEmpty())
1084         return;
1085     ASSERT(m_frame && m_frame->page());
1086     if (m_frame->page()->defersLoading())
1087         return;
1088
1089     SubstituteResourceMap copy;
1090     copy.swap(m_pendingSubstituteResources);
1091
1092     SubstituteResourceMap::const_iterator end = copy.end();
1093     for (SubstituteResourceMap::const_iterator it = copy.begin(); it != end; ++it) {
1094         RefPtr<ResourceLoader> loader = it->key;
1095         SubstituteResource* resource = it->value.get();
1096         
1097         if (resource) {
1098             SharedBuffer* data = resource->data();
1099         
1100             loader->didReceiveResponse(resource->response());
1101
1102             // Calling ResourceLoader::didReceiveResponse can end up cancelling the load,
1103             // so we need to check if the loader has reached its terminal state.
1104             if (loader->reachedTerminalState())
1105                 return;
1106
1107             loader->didReceiveData(data->data(), data->size(), data->size(), DataPayloadWholeResource);
1108
1109             // Calling ResourceLoader::didReceiveData can end up cancelling the load,
1110             // so we need to check if the loader has reached its terminal state.
1111             if (loader->reachedTerminalState())
1112                 return;
1113
1114             loader->didFinishLoading(0);
1115         } else {
1116             // A null resource means that we should fail the load.
1117             // FIXME: Maybe we should use another error here - something like "not in cache".
1118             loader->didFail(loader->cannotShowURLError());
1119         }
1120     }
1121 }
1122
1123 #ifndef NDEBUG
1124 bool DocumentLoader::isSubstituteLoadPending(ResourceLoader* loader) const
1125 {
1126     return m_pendingSubstituteResources.contains(loader);
1127 }
1128 #endif
1129
1130 void DocumentLoader::cancelPendingSubstituteLoad(ResourceLoader* loader)
1131 {
1132     if (m_pendingSubstituteResources.isEmpty())
1133         return;
1134     m_pendingSubstituteResources.remove(loader);
1135     if (m_pendingSubstituteResources.isEmpty())
1136         m_substituteResourceDeliveryTimer.stop();
1137 }
1138
1139 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
1140 bool DocumentLoader::scheduleArchiveLoad(ResourceLoader* loader, const ResourceRequest& request)
1141 {
1142     if (ArchiveResource* resource = archiveResourceForURL(request.url())) {
1143         m_pendingSubstituteResources.set(loader, resource);
1144         deliverSubstituteResourcesAfterDelay();
1145         return true;
1146     }
1147
1148     if (!m_archive)
1149         return false;
1150
1151     switch (m_archive->type()) {
1152 #if ENABLE(WEB_ARCHIVE)
1153     case Archive::WebArchive:
1154         // WebArchiveDebugMode means we fail loads instead of trying to fetch them from the network if they're not in the archive.
1155         return m_frame->settings() && m_frame->settings()->webArchiveDebugModeEnabled() && ArchiveFactory::isArchiveMimeType(responseMIMEType());
1156 #endif
1157 #if ENABLE(MHTML)
1158     case Archive::MHTML:
1159         return true; // Always fail the load for resources not included in the MHTML.
1160 #endif
1161     default:
1162         return false;
1163     }
1164 }
1165 #endif // ENABLE(WEB_ARCHIVE)
1166
1167 void DocumentLoader::addResponse(const ResourceResponse& r)
1168 {
1169     if (!m_stopRecordingResponses)
1170         m_responses.append(r);
1171 }
1172
1173 void DocumentLoader::stopRecordingResponses()
1174 {
1175     m_stopRecordingResponses = true;
1176     m_responses.shrinkToFit();
1177 }
1178
1179 void DocumentLoader::setTitle(const StringWithDirection& title)
1180 {
1181     if (m_pageTitle == title)
1182         return;
1183
1184     frameLoader()->willChangeTitle(this);
1185     m_pageTitle = title;
1186     frameLoader()->didChangeTitle(this);
1187 }
1188
1189 KURL DocumentLoader::urlForHistory() const
1190 {
1191     // Return the URL to be used for history and B/F list.
1192     // Returns nil for WebDataProtocol URLs that aren't alternates 
1193     // for unreachable URLs, because these can't be stored in history.
1194     if (m_substituteData.isValid())
1195         return unreachableURL();
1196
1197     return m_originalRequestCopy.url();
1198 }
1199
1200 bool DocumentLoader::urlForHistoryReflectsFailure() const
1201 {
1202     return m_substituteData.isValid() || m_response.httpStatusCode() >= 400;
1203 }
1204
1205 const KURL& DocumentLoader::originalURL() const
1206 {
1207     return m_originalRequestCopy.url();
1208 }
1209
1210 const KURL& DocumentLoader::requestURL() const
1211 {
1212     return request().url();
1213 }
1214
1215 const KURL& DocumentLoader::responseURL() const
1216 {
1217     return m_response.url();
1218 }
1219
1220 KURL DocumentLoader::documentURL() const
1221 {
1222     KURL url = substituteData().responseURL();
1223 #if ENABLE(WEB_ARCHIVE)
1224     if (url.isEmpty() && m_archive && m_archive->type() == Archive::WebArchive)
1225         url = m_archive->mainResource()->url();
1226 #endif
1227     if (url.isEmpty())
1228         url = requestURL();
1229     if (url.isEmpty())
1230         url = m_response.url();
1231     return url;
1232 }
1233
1234 const String& DocumentLoader::responseMIMEType() const
1235 {
1236     return m_response.mimeType();
1237 }
1238
1239 const KURL& DocumentLoader::unreachableURL() const
1240 {
1241     return m_substituteData.failingURL();
1242 }
1243
1244 void DocumentLoader::setDefersLoading(bool defers)
1245 {
1246     // Multiple frames may be loading the same main resource simultaneously. If deferral state changes,
1247     // each frame's DocumentLoader will try to send a setDefersLoading() to the same underlying ResourceLoader. Ensure only
1248     // the "owning" DocumentLoader does so, as setDefersLoading() is not resilient to setting the same value repeatedly.
1249     if (mainResourceLoader() && mainResourceLoader()->documentLoader() == this)
1250         mainResourceLoader()->setDefersLoading(defers);
1251
1252     setAllDefersLoading(m_subresourceLoaders, defers);
1253     setAllDefersLoading(m_plugInStreamLoaders, defers);
1254     if (!defers)
1255         deliverSubstituteResourcesAfterDelay();
1256 }
1257
1258 void DocumentLoader::setMainResourceDataBufferingPolicy(DataBufferingPolicy dataBufferingPolicy)
1259 {
1260     if (m_mainResource)
1261         m_mainResource->setDataBufferingPolicy(dataBufferingPolicy);
1262 }
1263
1264 void DocumentLoader::stopLoadingPlugIns()
1265 {
1266     cancelAll(m_plugInStreamLoaders);
1267 }
1268
1269 void DocumentLoader::stopLoadingSubresources()
1270 {
1271     cancelAll(m_subresourceLoaders);
1272 }
1273
1274 void DocumentLoader::addSubresourceLoader(ResourceLoader* loader)
1275 {
1276     // The main resource's underlying ResourceLoader will ask to be added here.
1277     // It is much simpler to handle special casing of main resource loads if we don't
1278     // let it be added. In the main resource load case, mainResourceLoader()
1279     // will still be null at this point, but m_gotFirstByte should be false here if and only
1280     // if we are just starting the main resource load.
1281     if (!m_gotFirstByte)
1282         return;
1283     ASSERT(!m_subresourceLoaders.contains(loader));
1284     ASSERT(!mainResourceLoader() || mainResourceLoader() != loader);
1285     m_subresourceLoaders.add(loader);
1286 }
1287
1288 void DocumentLoader::removeSubresourceLoader(ResourceLoader* loader)
1289 {
1290     ResourceLoaderSet::iterator it = m_subresourceLoaders.find(loader);
1291     if (it == m_subresourceLoaders.end())
1292         return;
1293     m_subresourceLoaders.remove(it);
1294     checkLoadComplete();
1295     if (Frame* frame = m_frame)
1296         frame->loader()->checkLoadComplete();
1297 }
1298
1299 void DocumentLoader::addPlugInStreamLoader(ResourceLoader* loader)
1300 {
1301     m_plugInStreamLoaders.add(loader);
1302 }
1303
1304 void DocumentLoader::removePlugInStreamLoader(ResourceLoader* loader)
1305 {
1306     m_plugInStreamLoaders.remove(loader);
1307     checkLoadComplete();
1308 }
1309
1310 bool DocumentLoader::isMultipartReplacingLoad() const
1311 {
1312     return isLoadingMultipartContent() && frameLoader()->isReplacing();
1313 }
1314
1315 bool DocumentLoader::maybeLoadEmpty()
1316 {
1317     bool shouldLoadEmpty = !m_substituteData.isValid() && (m_request.url().isEmpty() || SchemeRegistry::shouldLoadURLSchemeAsEmptyDocument(m_request.url().protocol()));
1318     if (!shouldLoadEmpty && !frameLoader()->client()->representationExistsForURLScheme(m_request.url().protocol()))
1319         return false;
1320
1321     if (m_request.url().isEmpty() && !frameLoader()->stateMachine()->creatingInitialEmptyDocument())
1322         m_request.setURL(blankURL());
1323     String mimeType = shouldLoadEmpty ? "text/html" : frameLoader()->client()->generatedMIMETypeForURLScheme(m_request.url().protocol());
1324     m_response = ResourceResponse(m_request.url(), mimeType, 0, String(), String());
1325     finishedLoading(monotonicallyIncreasingTime());
1326     return true;
1327 }
1328
1329 void DocumentLoader::startLoadingMainResource()
1330 {
1331     m_mainDocumentError = ResourceError();
1332     timing()->markNavigationStart();
1333     ASSERT(!m_mainResource);
1334     ASSERT(!m_loadingMainResource);
1335     m_loadingMainResource = true;
1336
1337     if (maybeLoadEmpty())
1338         return;
1339
1340     // FIXME: Is there any way the extra fields could have not been added by now?
1341     // If not, it would be great to remove this line of code.
1342     // Note that currently, some requests may have incorrect extra fields even if this function has been called,
1343     // because we pass a wrong loadType (see FIXME in addExtraFieldsToMainResourceRequest()).
1344     frameLoader()->addExtraFieldsToMainResourceRequest(m_request);
1345
1346     ASSERT(timing()->navigationStart());
1347     ASSERT(!timing()->fetchStart());
1348     timing()->markFetchStart();
1349     willSendRequest(m_request, ResourceResponse());
1350
1351     // willSendRequest() may lead to our Frame being detached or cancelling the load via nulling the ResourceRequest.
1352     if (!m_frame || m_request.isNull())
1353         return;
1354
1355     m_applicationCacheHost->maybeLoadMainResource(m_request, m_substituteData);
1356
1357     if (m_substituteData.isValid()) {
1358         m_identifierForLoadWithoutResourceLoader = m_frame->page()->progress()->createUniqueIdentifier();
1359         frameLoader()->notifier()->assignIdentifierToInitialRequest(m_identifierForLoadWithoutResourceLoader, this, m_request);
1360         frameLoader()->notifier()->dispatchWillSendRequest(this, m_identifierForLoadWithoutResourceLoader, m_request, ResourceResponse());
1361         handleSubstituteDataLoadSoon();
1362         return;
1363     }
1364
1365     ResourceRequest request(m_request);
1366     DEFINE_STATIC_LOCAL(ResourceLoaderOptions, mainResourceLoadOptions,
1367         (SendCallbacks, SniffContent, BufferData, AllowStoredCredentials, AskClientForAllCredentials, SkipSecurityCheck));
1368     CachedResourceRequest cachedResourceRequest(request, mainResourceLoadOptions);
1369     m_mainResource = m_cachedResourceLoader->requestMainResource(cachedResourceRequest);
1370     if (!m_mainResource) {
1371         setRequest(ResourceRequest());
1372         // If the load was aborted by clearing m_request, it's possible the ApplicationCacheHost
1373         // is now in a state where starting an empty load will be inconsistent. Replace it with
1374         // a new ApplicationCacheHost.
1375         m_applicationCacheHost = adoptPtr(new ApplicationCacheHost(this));
1376         maybeLoadEmpty();
1377         return;
1378     }
1379
1380     if (!mainResourceLoader()) {
1381         m_identifierForLoadWithoutResourceLoader = m_frame->page()->progress()->createUniqueIdentifier();
1382         frameLoader()->notifier()->assignIdentifierToInitialRequest(m_identifierForLoadWithoutResourceLoader, this, request);
1383         frameLoader()->notifier()->dispatchWillSendRequest(this, m_identifierForLoadWithoutResourceLoader, request, ResourceResponse());
1384     }
1385     m_mainResource->addClient(this);
1386
1387     // A bunch of headers are set when the underlying ResourceLoader is created, and m_request needs to include those.
1388     if (mainResourceLoader())
1389         request = mainResourceLoader()->originalRequest();
1390     // If there was a fragment identifier on m_request, the cache will have stripped it. m_request should include
1391     // the fragment identifier, so add that back in.
1392     if (equalIgnoringFragmentIdentifier(m_request.url(), request.url()))
1393         request.setURL(m_request.url());
1394     setRequest(request);
1395 }
1396
1397 void DocumentLoader::cancelMainResourceLoad(const ResourceError& resourceError)
1398 {
1399     RefPtr<DocumentLoader> protect(this);
1400     ResourceError error = resourceError.isNull() ? frameLoader()->cancelledError(m_request) : resourceError;
1401
1402     m_dataLoadTimer.stop();
1403     if (m_waitingForContentPolicy) {
1404         frameLoader()->policyChecker()->cancelCheck();
1405         ASSERT(m_waitingForContentPolicy);
1406         m_waitingForContentPolicy = false;
1407     }
1408
1409     if (mainResourceLoader())
1410         mainResourceLoader()->cancel(error);
1411
1412     clearMainResource();
1413
1414     mainReceivedError(error);
1415 }
1416
1417 void DocumentLoader::clearMainResource()
1418 {
1419     if (m_mainResource && m_mainResource->hasClient(this))
1420         m_mainResource->removeClient(this);
1421
1422     m_mainResource = 0;
1423 }
1424
1425 void DocumentLoader::subresourceLoaderFinishedLoadingOnePart(ResourceLoader* loader)
1426 {
1427     m_multipartSubresourceLoaders.add(loader);
1428     m_subresourceLoaders.remove(loader);
1429     checkLoadComplete();
1430     if (Frame* frame = m_frame)
1431         frame->loader()->checkLoadComplete();    
1432 }
1433
1434 void DocumentLoader::maybeFinishLoadingMultipartContent()
1435 {
1436     if (!isMultipartReplacingLoad())
1437         return;
1438
1439     frameLoader()->setupForReplace();
1440     m_committed = false;
1441     RefPtr<ResourceBuffer> resourceData = mainResourceData();
1442     commitLoad(resourceData->data(), resourceData->size());
1443 }
1444
1445 void DocumentLoader::iconLoadDecisionAvailable()
1446 {
1447     if (m_frame)
1448         m_frame->loader()->icon()->loadDecisionReceived(iconDatabase().synchronousLoadDecisionForIconURL(frameLoader()->icon()->url(), this));
1449 }
1450
1451 static void iconLoadDecisionCallback(IconLoadDecision decision, void* context)
1452 {
1453     static_cast<DocumentLoader*>(context)->continueIconLoadWithDecision(decision);
1454 }
1455
1456 void DocumentLoader::getIconLoadDecisionForIconURL(const String& urlString)
1457 {
1458     if (m_iconLoadDecisionCallback)
1459         m_iconLoadDecisionCallback->invalidate();
1460     m_iconLoadDecisionCallback = IconLoadDecisionCallback::create(this, iconLoadDecisionCallback);
1461     iconDatabase().loadDecisionForIconURL(urlString, m_iconLoadDecisionCallback);
1462 }
1463
1464 void DocumentLoader::continueIconLoadWithDecision(IconLoadDecision decision)
1465 {
1466     ASSERT(m_iconLoadDecisionCallback);
1467     m_iconLoadDecisionCallback = 0;
1468     if (m_frame)
1469         m_frame->loader()->icon()->continueLoadWithDecision(decision);
1470 }
1471
1472 static void iconDataCallback(SharedBuffer*, void*)
1473 {
1474     // FIXME: Implement this once we know what parts of WebCore actually need the icon data returned.
1475 }
1476
1477 void DocumentLoader::getIconDataForIconURL(const String& urlString)
1478 {   
1479     if (m_iconDataCallback)
1480         m_iconDataCallback->invalidate();
1481     m_iconDataCallback = IconDataCallback::create(this, iconDataCallback);
1482     iconDatabase().iconDataForIconURL(urlString, m_iconDataCallback);
1483 }
1484
1485 void DocumentLoader::handledOnloadEvents()
1486 {
1487     m_wasOnloadHandled = true;
1488     applicationCacheHost()->stopDeferringEvents();
1489 }
1490
1491 } // namespace WebCore