95abd7cffa0f60b1b6ac2986a630f8471020eb46
[WebKit-https.git] / Source / WebCore / loader / DocumentLoader.h
1 /*
2  * Copyright (C) 2006, 2007, 2008, 2009 Apple Inc. All rights reserved.
3  * Copyright (C) 2011 Google Inc. All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  *
9  * 1.  Redistributions of source code must retain the above copyright
10  *     notice, this list of conditions and the following disclaimer. 
11  * 2.  Redistributions in binary form must reproduce the above copyright
12  *     notice, this list of conditions and the following disclaimer in the
13  *     documentation and/or other materials provided with the distribution. 
14  * 3.  Neither the name of Apple Inc. ("Apple") nor the names of
15  *     its contributors may be used to endorse or promote products derived
16  *     from this software without specific prior written permission. 
17  *
18  * THIS SOFTWARE IS PROVIDED BY APPLE AND ITS CONTRIBUTORS "AS IS" AND ANY
19  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
20  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
21  * DISCLAIMED. IN NO EVENT SHALL APPLE OR ITS CONTRIBUTORS BE LIABLE FOR ANY
22  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
23  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
24  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
25  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
26  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
27  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
28  */
29
30 #ifndef DocumentLoader_h
31 #define DocumentLoader_h
32
33 #include "CachedRawResourceClient.h"
34 #include "CachedResourceHandle.h"
35 #include "DocumentLoadTiming.h"
36 #include "DocumentWriter.h"
37 #include "IconDatabaseBase.h"
38 #include "NavigationAction.h"
39 #include "ResourceError.h"
40 #include "ResourceLoaderOptions.h"
41 #include "ResourceRequest.h"
42 #include "ResourceResponse.h"
43 #include "StringWithDirection.h"
44 #include "SubstituteData.h"
45 #include "Timer.h"
46 #include <wtf/HashSet.h>
47 #include <wtf/RefPtr.h>
48 #include <wtf/Vector.h>
49
50 #if HAVE(RUNLOOP_TIMER)
51 #include <wtf/RunLoopTimer.h>
52 #endif
53
54 namespace WebCore {
55
56     class ApplicationCacheHost;
57     class Archive;
58     class ArchiveResource;
59     class ArchiveResourceCollection;
60     class CachedRawResource;
61     class CachedResourceLoader;
62     class ContentFilter;
63     class FormState;
64     class Frame;
65     class FrameLoader;
66     class Page;
67     class ResourceBuffer;
68     class ResourceLoader;
69     class SharedBuffer;
70     class SubstituteResource;
71
72     typedef HashMap<unsigned long, RefPtr<ResourceLoader>> ResourceLoaderMap;
73     typedef Vector<ResourceResponse> ResponseVector;
74
75     class DocumentLoader : public RefCounted<DocumentLoader>, private CachedRawResourceClient {
76         WTF_MAKE_FAST_ALLOCATED;
77     public:
78         static PassRefPtr<DocumentLoader> create(const ResourceRequest& request, const SubstituteData& data)
79         {
80             return adoptRef(new DocumentLoader(request, data));
81         }
82         virtual ~DocumentLoader();
83
84         void setFrame(Frame*);
85         Frame* frame() const { return m_frame; }
86
87         virtual void attachToFrame();
88         virtual void detachFromFrame();
89
90         FrameLoader* frameLoader() const;
91         ResourceLoader* mainResourceLoader() const;
92         PassRefPtr<ResourceBuffer> mainResourceData() const;
93         
94         DocumentWriter& writer() const { return m_writer; }
95
96         const ResourceRequest& originalRequest() const;
97         const ResourceRequest& originalRequestCopy() const;
98
99         const ResourceRequest& request() const;
100         ResourceRequest& request();
101
102         CachedResourceLoader& cachedResourceLoader() { return m_cachedResourceLoader.get(); }
103
104         const SubstituteData& substituteData() const { return m_substituteData; }
105
106         // FIXME: This is the same as requestURL(). We should remove one of them.
107         const URL& url() const;
108         const URL& unreachableURL() const;
109
110         const URL& originalURL() const;
111         const URL& requestURL() const;
112         const URL& responseURL() const;
113         const String& responseMIMEType() const;
114 #if PLATFORM(IOS)
115         // FIXME: This method seems to violate the encapsulation of this class.
116         void setResponseMIMEType(const String&);
117 #endif
118
119         void replaceRequestURLForSameDocumentNavigation(const URL&);
120         bool isStopping() const { return m_isStopping; }
121         void stopLoading();
122         void setCommitted(bool committed) { m_committed = committed; }
123         bool isCommitted() const { return m_committed; }
124         bool isLoading() const;
125
126         const ResourceError& mainDocumentError() const { return m_mainDocumentError; }
127
128         const ResourceResponse& response() const { return m_response; }
129 #if PLATFORM(IOS)
130         // FIXME: This method seems to violate the encapsulation of this class.
131         void setResponse(const ResourceResponse& response) { m_response = response; }
132 #endif
133
134         bool isClientRedirect() const { return m_isClientRedirect; }
135         void setIsClientRedirect(bool isClientRedirect) { m_isClientRedirect = isClientRedirect; }
136         void handledOnloadEvents();
137         bool wasOnloadHandled() { return m_wasOnloadHandled; }
138         bool isLoadingInAPISense() const;
139         void setTitle(const StringWithDirection&);
140         const String& overrideEncoding() const { return m_overrideEncoding; }
141
142 #if PLATFORM(MAC)
143         void schedule(SchedulePair&);
144         void unschedule(SchedulePair&);
145 #endif
146
147 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
148         void setArchive(PassRefPtr<Archive>);
149         void addAllArchiveResources(Archive*);
150         void addArchiveResource(PassRefPtr<ArchiveResource>);
151         PassRefPtr<Archive> popArchiveForSubframe(const String& frameName, const URL&);
152         SharedBuffer* parsedArchiveData() const;
153
154         bool scheduleArchiveLoad(ResourceLoader*, const ResourceRequest&);
155 #endif
156
157         // Return the ArchiveResource for the URL only when loading an Archive
158         ArchiveResource* archiveResourceForURL(const URL&) const;
159
160         PassRefPtr<ArchiveResource> mainResource() const;
161
162         // Return an ArchiveResource for the URL, either creating from live data or
163         // pulling from the ArchiveResourceCollection
164         PassRefPtr<ArchiveResource> subresource(const URL&) const;
165         Vector<RefPtr<ArchiveResource>> subresources() const;
166
167 #ifndef NDEBUG
168         bool isSubstituteLoadPending(ResourceLoader*) const;
169 #endif
170         void cancelPendingSubstituteLoad(ResourceLoader*);   
171         
172         void addResponse(const ResourceResponse&);
173         const ResponseVector& responses() const { return m_responses; }
174
175         const NavigationAction& triggeringAction() const { return m_triggeringAction; }
176         void setTriggeringAction(const NavigationAction& action) { m_triggeringAction = action; }
177         void setOverrideEncoding(const String& encoding) { m_overrideEncoding = encoding; }
178         void setLastCheckedRequest(const ResourceRequest& request) { m_lastCheckedRequest = request; }
179         const ResourceRequest& lastCheckedRequest()  { return m_lastCheckedRequest; }
180
181         void stopRecordingResponses();
182         const StringWithDirection& title() const { return m_pageTitle; }
183
184         URL urlForHistory() const;
185         bool urlForHistoryReflectsFailure() const;
186
187         // These accessors accommodate WebCore's somewhat fickle custom of creating history
188         // items for redirects, but only sometimes. For "source" and "destination",
189         // these accessors return the URL that would have been used if a history
190         // item were created. This allows WebKit to link history items reflecting
191         // redirects into a chain from start to finish.
192         String clientRedirectSourceForHistory() const { return m_clientRedirectSourceForHistory; } // null if no client redirect occurred.
193         String clientRedirectDestinationForHistory() const { return urlForHistory(); }
194         void setClientRedirectSourceForHistory(const String& clientRedirectSourceForHistory) { m_clientRedirectSourceForHistory = clientRedirectSourceForHistory; }
195         
196         String serverRedirectSourceForHistory() const { return (urlForHistory() == url() || url() == blankURL()) ? String() : urlForHistory().string(); } // null if no server redirect occurred.
197         String serverRedirectDestinationForHistory() const { return url(); }
198
199         bool didCreateGlobalHistoryEntry() const { return m_didCreateGlobalHistoryEntry; }
200         void setDidCreateGlobalHistoryEntry(bool didCreateGlobalHistoryEntry) { m_didCreateGlobalHistoryEntry = didCreateGlobalHistoryEntry; }
201
202         bool subresourceLoadersArePageCacheAcceptable() const { return m_subresourceLoadersArePageCacheAcceptable; }
203
204         void setDefersLoading(bool);
205         void setMainResourceDataBufferingPolicy(DataBufferingPolicy);
206
207         void startLoadingMainResource();
208         void cancelMainResourceLoad(const ResourceError&);
209         
210         // Support iconDatabase in synchronous mode.
211         void iconLoadDecisionAvailable();
212         
213         // Support iconDatabase in asynchronous mode.
214         void continueIconLoadWithDecision(IconLoadDecision);
215         void getIconLoadDecisionForIconURL(const String&);
216         void getIconDataForIconURL(const String&);
217
218         bool isLoadingMainResource() const { return m_loadingMainResource; }
219         bool isLoadingMultipartContent() const { return m_isLoadingMultipartContent; }
220
221         void stopLoadingPlugIns();
222         void stopLoadingSubresources();
223
224         void addSubresourceLoader(ResourceLoader*);
225         void removeSubresourceLoader(ResourceLoader*);
226         void addPlugInStreamLoader(ResourceLoader*);
227         void removePlugInStreamLoader(ResourceLoader*);
228
229         void subresourceLoaderFinishedLoadingOnePart(ResourceLoader*);
230
231         void setDeferMainResourceDataLoad(bool defer) { m_deferMainResourceDataLoad = defer; }
232         
233         void didTellClientAboutLoad(const String& url)
234         { 
235 #if !PLATFORM(COCOA)
236             // Don't include data urls here, as if a lot of data is loaded
237             // that way, we hold on to the (large) url string for too long.
238             if (protocolIs(url, "data"))
239                 return;
240 #endif
241             if (!url.isEmpty())
242                 m_resourcesClientKnowsAbout.add(url);
243         }
244         bool haveToldClientAboutLoad(const String& url) { return m_resourcesClientKnowsAbout.contains(url); }
245         void recordMemoryCacheLoadForFutureClientNotification(const ResourceRequest&);
246         void takeMemoryCacheLoadsForClientNotification(Vector<ResourceRequest>& loads);
247
248         DocumentLoadTiming* timing() { return &m_documentLoadTiming; }
249         void resetTiming() { m_documentLoadTiming = DocumentLoadTiming(); }
250
251         // The WebKit layer calls this function when it's ready for the data to
252         // actually be added to the document.
253         void commitData(const char* bytes, size_t length);
254
255         ApplicationCacheHost* applicationCacheHost() const { return m_applicationCacheHost.get(); }
256
257         void checkLoadComplete();
258
259         // The URL of the document resulting from this DocumentLoader.
260         URL documentURL() const;
261
262     protected:
263         DocumentLoader(const ResourceRequest&, const SubstituteData&);
264
265         bool m_deferMainResourceDataLoad;
266
267     private:
268         Document* document() const;
269
270         void setRequest(const ResourceRequest&);
271
272         void commitIfReady();
273         void setMainDocumentError(const ResourceError&);
274         void commitLoad(const char*, int);
275         void clearMainResourceLoader();
276
277         void setupForReplace();
278         void maybeFinishLoadingMultipartContent();
279         
280         bool maybeCreateArchive();
281 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
282         void clearArchiveResources();
283 #endif
284
285         void willSendRequest(ResourceRequest&, const ResourceResponse&);
286         void finishedLoading(double finishTime);
287         void mainReceivedError(const ResourceError&);
288         virtual void redirectReceived(CachedResource*, ResourceRequest&, const ResourceResponse&) override;
289         virtual void responseReceived(CachedResource*, const ResourceResponse&) override;
290         virtual void dataReceived(CachedResource*, const char* data, int length) override;
291         virtual void notifyFinished(CachedResource*) override;
292
293         bool maybeLoadEmpty();
294
295         bool isMultipartReplacingLoad() const;
296         bool isPostOrRedirectAfterPost(const ResourceRequest&, const ResourceResponse&);
297
298         void continueAfterNavigationPolicy(const ResourceRequest&, bool shouldContinue);
299
300         void continueAfterContentPolicy(PolicyAction);
301
302         void stopLoadingForPolicyChange();
303         ResourceError interruptedForPolicyChangeError() const;
304
305 #if HAVE(RUNLOOP_TIMER)
306         typedef RunLoopTimer<DocumentLoader> DocumentLoaderTimer;
307 #else
308         typedef Timer<DocumentLoader> DocumentLoaderTimer;
309 #endif
310         void handleSubstituteDataLoadSoon();
311         void handleSubstituteDataLoadNow(DocumentLoaderTimer*);
312         void startDataLoadTimer();
313
314         void deliverSubstituteResourcesAfterDelay();
315         void substituteResourceDeliveryTimerFired(Timer<DocumentLoader>&);
316
317         void clearMainResource();
318
319         Frame* m_frame;
320         Ref<CachedResourceLoader> m_cachedResourceLoader;
321
322         CachedResourceHandle<CachedRawResource> m_mainResource;
323         ResourceLoaderMap m_subresourceLoaders;
324         ResourceLoaderMap m_multipartSubresourceLoaders;
325         ResourceLoaderMap m_plugInStreamLoaders;
326         
327         mutable DocumentWriter m_writer;
328
329         // A reference to actual request used to create the data source.
330         // This should only be used by the resourceLoadDelegate's
331         // identifierForInitialRequest:fromDatasource: method. It is
332         // not guaranteed to remain unchanged, as requests are mutable.
333         ResourceRequest m_originalRequest;   
334
335         SubstituteData m_substituteData;
336
337         // A copy of the original request used to create the data source.
338         // We have to copy the request because requests are mutable.
339         ResourceRequest m_originalRequestCopy;
340         
341         // The 'working' request. It may be mutated
342         // several times from the original request to include additional
343         // headers, cookie information, canonicalization and redirects.
344         ResourceRequest m_request;
345
346         ResourceResponse m_response;
347     
348         ResourceError m_mainDocumentError;    
349
350         bool m_originalSubstituteDataWasValid;
351         bool m_committed;
352         bool m_isStopping;
353         bool m_gotFirstByte;
354         bool m_isClientRedirect;
355         bool m_isLoadingMultipartContent;
356
357         // FIXME: Document::m_processingLoadEvent and DocumentLoader::m_wasOnloadHandled are roughly the same
358         // and should be merged.
359         bool m_wasOnloadHandled;
360
361         StringWithDirection m_pageTitle;
362
363         String m_overrideEncoding;
364
365         // The action that triggered loading - we keep this around for the
366         // benefit of the various policy handlers.
367         NavigationAction m_triggeringAction;
368
369         // The last request that we checked click policy for - kept around
370         // so we can avoid asking again needlessly.
371         ResourceRequest m_lastCheckedRequest;
372
373         // We retain all the received responses so we can play back the
374         // WebResourceLoadDelegate messages if the item is loaded from the
375         // page cache.
376         ResponseVector m_responses;
377         bool m_stopRecordingResponses;
378         
379         typedef HashMap<RefPtr<ResourceLoader>, RefPtr<SubstituteResource>> SubstituteResourceMap;
380         SubstituteResourceMap m_pendingSubstituteResources;
381         Timer<DocumentLoader> m_substituteResourceDeliveryTimer;
382
383         OwnPtr<ArchiveResourceCollection> m_archiveResourceCollection;
384 #if ENABLE(WEB_ARCHIVE) || ENABLE(MHTML)
385         RefPtr<Archive> m_archive;
386         RefPtr<SharedBuffer> m_parsedArchiveData;
387 #endif
388
389         HashSet<String> m_resourcesClientKnowsAbout;
390         Vector<ResourceRequest> m_resourcesLoadedFromMemoryCacheForClientNotification;
391         
392         String m_clientRedirectSourceForHistory;
393         bool m_didCreateGlobalHistoryEntry;
394
395         bool m_loadingMainResource;
396         DocumentLoadTiming m_documentLoadTiming;
397
398         double m_timeOfLastDataReceived;
399         unsigned long m_identifierForLoadWithoutResourceLoader;
400
401         DocumentLoaderTimer m_dataLoadTimer;
402         bool m_waitingForContentPolicy;
403
404         RefPtr<IconLoadDecisionCallback> m_iconLoadDecisionCallback;
405         RefPtr<IconDataCallback> m_iconDataCallback;
406
407         bool m_subresourceLoadersArePageCacheAcceptable;
408
409         friend class ApplicationCacheHost;  // for substitute resource delivery
410         OwnPtr<ApplicationCacheHost> m_applicationCacheHost;
411
412 #if ENABLE(CONTENT_FILTERING)
413         std::unique_ptr<ContentFilter> m_contentFilter;
414 #endif
415     };
416
417     inline void DocumentLoader::recordMemoryCacheLoadForFutureClientNotification(const ResourceRequest& request)
418     {
419         m_resourcesLoadedFromMemoryCacheForClientNotification.append(request);
420     }
421
422     inline void DocumentLoader::takeMemoryCacheLoadsForClientNotification(Vector<ResourceRequest>& loadsSet)
423     {
424         loadsSet.swap(m_resourcesLoadedFromMemoryCacheForClientNotification);
425         m_resourcesLoadedFromMemoryCacheForClientNotification.clear();
426     }
427
428 }
429
430 #endif // DocumentLoader_h