a48b2f41baaa5a819fad21969fb7d46bb26fb6ff
[WebKit-https.git] / WebCore / khtml / xml / xml_tokenizer.cpp
1 /**
2  * This file is part of the DOM implementation for KDE.
3  *
4  * Copyright (C) 2000 Peter Kelly (pmk@post.com)
5  * Copyright (C) 2005 Apple Computer, Inc.
6  *
7  * This library is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Library General Public
9  * License as published by the Free Software Foundation; either
10  * version 2 of the License, or (at your option) any later version.
11  *
12  * This library is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Library General Public License for more details.
16  *
17  * You should have received a copy of the GNU Library General Public License
18  * along with this library; see the file COPYING.LIB.  If not, write to
19  * the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
20  * Boston, MA 02111-1307, USA.
21  */
22
23 #include "xml_tokenizer.h"
24 #include "xml/dom_docimpl.h"
25 #include "xml/dom_textimpl.h"
26 #include "xml/dom_xmlimpl.h"
27 #include "html/html_headimpl.h"
28 #include "html/html_tableimpl.h"
29 #include "misc/htmltags.h"
30 #include "misc/htmlattrs.h"
31 #include "misc/loader.h"
32
33 #include "khtmlview.h"
34 #include "khtml_part.h"
35 #include <kdebug.h>
36 #include <klocale.h>
37
38 #include <libxml/parser.h>
39 #include <libxml/parserInternals.h>
40
41 #include <qptrstack.h>
42
43 using DOM::DocumentImpl;
44 using DOM::DocumentPtr;
45 using DOM::DOMString;
46 using DOM::ElementImpl;
47 using DOM::HTMLScriptElementImpl;
48 using DOM::HTMLTableSectionElementImpl;
49 using DOM::Node;
50 using DOM::NodeImpl;
51 using DOM::ProcessingInstructionImpl;
52 using DOM::TextImpl;
53
54 namespace khtml {
55
56 const int maxErrors = 25;
57
58 // FIXME: Move to the newer libxml API that handles namespaces and dump XMLNamespace, XMLAttributes, and XMLNamespaceStack.
59
60 struct XMLNamespace {
61     QString m_prefix;
62     QString m_uri;
63     XMLNamespace* m_parent;
64     
65     int m_ref;
66     
67     XMLNamespace() :m_parent(0), m_ref(0) {}
68     
69     XMLNamespace(const QString& p, const QString& u, XMLNamespace* parent) 
70         :m_prefix(p),
71          m_uri(u),
72          m_parent(parent), 
73          m_ref(0) 
74     { 
75         if (m_parent) m_parent->ref();
76     }
77     
78     QString uriForPrefix(const QString& prefix) {
79         if (prefix == m_prefix)
80             return m_uri;
81         if (m_parent)
82             return m_parent->uriForPrefix(prefix);
83         return "";
84     }
85     
86     void ref() { m_ref++; }
87     void deref() { if (--m_ref == 0) { if (m_parent) m_parent->deref(); delete this; } }
88 };
89
90 class XMLAttributes {
91 public:
92     XMLAttributes() : _ref(0), _length(0), _names(0), _values(0), _uris(0) { }
93     XMLAttributes(const char **expatStyleAttributes);
94     ~XMLAttributes();
95     
96     XMLAttributes(const XMLAttributes &);
97     XMLAttributes &operator=(const XMLAttributes &);
98     
99     int length() const { return _length; }
100     QString qName(int index) const { return _names[index]; }
101     QString localName(int index) const;
102     QString uri(int index) const { if (!_uris) return QString::null; return _uris[index]; }
103     QString value(int index) const { return _values[index]; }
104
105     QString value(const QString &) const;
106
107     void split(XMLNamespace* ns);
108     
109 private:
110     mutable int *_ref;
111     int _length;
112     QString *_names;
113     QString *_values;
114     QString *_uris;
115 };
116
117 class XMLNamespaceStack
118 {
119 public:
120     ~XMLNamespaceStack();
121     XMLNamespace *pushNamespaces(XMLAttributes& attributes);
122     void popNamespaces();
123 private:
124     QPtrStack<XMLNamespace> m_namespaceStack;
125 };
126
127 class XMLTokenizer : public Tokenizer, public CachedObjectClient
128 {
129 public:
130     XMLTokenizer(DocumentPtr *, KHTMLView * = 0);
131     ~XMLTokenizer();
132
133     enum ErrorType { warning, nonFatal, fatal };
134
135     // from Tokenizer
136     virtual void write(const TokenizerString &str, bool);
137     virtual void finish();
138     virtual void setOnHold(bool onHold);
139     virtual bool isWaitingForScripts() const;
140
141 #ifdef KHTML_XSLT
142     void setTransformSource(DocumentImpl* doc);
143 #endif
144
145     // from CachedObjectClient
146     virtual void notifyFinished(CachedObject *finishedObj);
147
148     // callbacks from parser SAX
149     void error(ErrorType, const char *message, va_list args);
150     void startElement(const xmlChar *name, const xmlChar **libxmlAttributes);
151     void endElement();
152     void characters(const xmlChar *s, int len);
153     void processingInstruction(const xmlChar *target, const xmlChar *data);
154     void cdataBlock(const xmlChar *s, int len);
155     void comment(const xmlChar *s);
156
157 private:
158     void end();
159
160     int lineNumber() const;
161     int columnNumber() const;
162     void stopParsing();
163
164     void insertErrorMessageBlock();
165
166     void executeScripts();
167     void addScripts(NodeImpl *n);
168
169     XMLNamespace *pushNamespaces(XMLAttributes& attributes) { return m_namespaceStack.pushNamespaces(attributes); }
170     void popNamespaces() { m_namespaceStack.popNamespaces(); }
171
172     bool enterText();
173     void exitText();
174
175     DocumentPtr *m_doc;
176     KHTMLView *m_view;
177
178     QString m_xmlCode;
179
180     xmlParserCtxtPtr m_context;
181     DOM::NodeImpl *m_currentNode;
182     XMLNamespaceStack m_namespaceStack;
183
184     bool m_sawError;
185     bool m_parserStopped;
186     bool m_sawXSLTransform;
187     
188     int m_errorCount;
189     int m_lastErrorLine;
190     int m_lastErrorColumn;
191     DOMString m_errorMessages;
192
193     QPtrList<HTMLScriptElementImpl> m_scripts;
194     QPtrListIterator<HTMLScriptElementImpl> *m_scriptsIt;
195     CachedScript *m_cachedScript;
196 };
197
198 // --------------------------------
199
200 static int globalDescriptor = 0;
201
202 static int matchFunc(const char* uri)
203 {
204     return 1; // Match everything.
205 }
206
207 static void* openFunc(const char * uri) {
208     return &globalDescriptor;
209 }
210
211 static int readFunc(void* context, char* buffer, int len)
212 {
213     // Always just do 0-byte reads
214     return 0;
215 }
216
217 static int writeFunc(void* context, const char* buffer, int len)
218 {
219     // Always just do 0-byte writes
220     return 0;
221 }
222
223 static xmlParserCtxtPtr createQStringParser(xmlSAXHandlerPtr handlers, void *userData, const char* uri = NULL)
224 {
225     static bool didInit = false;
226     if (!didInit) {
227         xmlInitParser();
228         xmlRegisterInputCallbacks(matchFunc, openFunc, readFunc, NULL);
229         xmlRegisterOutputCallbacks(matchFunc, openFunc, writeFunc, NULL);
230         didInit = true;
231     }
232
233     xmlParserCtxtPtr parser = xmlCreatePushParserCtxt(handlers, userData, NULL, 0, uri);
234     const QChar BOM(0xFEFF);
235     const unsigned char BOMHighByte = *reinterpret_cast<const unsigned char *>(&BOM);
236     xmlSwitchEncoding(parser, BOMHighByte == 0xFF ? XML_CHAR_ENCODING_UTF16LE : XML_CHAR_ENCODING_UTF16BE);
237     return parser;
238 }
239
240 static void parseQString(xmlParserCtxtPtr parser, const QString &string)
241 {
242     xmlParseChunk(parser,
243         reinterpret_cast<const char *>(string.unicode()),
244         string.length() * sizeof(QChar), 1);
245 }
246
247 // --------------------------------
248
249 XMLTokenizer::XMLTokenizer(DocumentPtr *_doc, KHTMLView *_view)
250     : m_doc(_doc), m_view(_view),
251       m_context(NULL), m_currentNode(m_doc->document()),
252       m_sawError(false), m_parserStopped(false), m_errorCount(0),
253       m_lastErrorLine(0), m_scriptsIt(0), m_cachedScript(0)
254 {
255     if (m_doc)
256         m_doc->ref();
257     
258     //FIXME: XMLTokenizer should use this in a fashion similiar to how
259     //HTMLTokenizer uses loadStopped, in the future.
260     loadStopped = false;
261 }
262
263 XMLTokenizer::~XMLTokenizer()
264 {
265     if (m_doc)
266         m_doc->deref();
267     delete m_scriptsIt;
268     if (m_cachedScript)
269         m_cachedScript->deref(this);
270 }
271
272 void XMLTokenizer::write(const TokenizerString &s, bool /*appendData*/ )
273 {
274     m_xmlCode += s.toString();
275 }
276
277 void XMLTokenizer::setOnHold(bool onHold)
278 {
279     // Will we need to implement this when we do incremental XML parsing?
280 }
281
282 void XMLTokenizer::startElement(const xmlChar *name, const xmlChar **libxmlAttributes)
283 {
284     if (m_parserStopped)
285         return;
286
287     XMLAttributes atts(reinterpret_cast<const char **>(libxmlAttributes));
288     XMLNamespace *ns = pushNamespaces(atts);
289     atts.split(ns);
290     
291     QString qName = QString::fromUtf8(reinterpret_cast<const char *>(name));
292     QString uri;
293     QString prefix;
294     int colonPos = qName.find(':');
295     if (colonPos != -1) {
296         prefix = qName.left(colonPos);
297     }
298     uri = ns->uriForPrefix(prefix);
299     
300     if (m_currentNode->nodeType() == Node::TEXT_NODE)
301         exitText();
302
303     int exceptioncode = 0;
304     ElementImpl *newElement = m_doc->document()->createElementNS(uri, qName, exceptioncode);
305     if (!newElement)
306         return;
307
308     int i;
309     for (i = 0; i < atts.length(); i++) {
310         // FIXME: qualified name not supported for attributes! The prefix has been lost.
311         DOMString uri(atts.uri(i));
312         DOMString ln(atts.localName(i));
313         DOMString val(atts.value(i));
314         NodeImpl::Id id = m_doc->document()->attrId(uri.implementation(),
315                                                     ln.implementation(),
316                                                     false /* allocate */);
317         newElement->setAttribute(id, val.implementation(), exceptioncode);
318         if (exceptioncode) // exception setting attributes
319             return;
320     }
321
322     // FIXME: This hack ensures implicit table bodies get constructed in XHTML and XML files.
323     // We want to consolidate this with the HTML parser and HTML DOM code at some point.
324     // For now, it's too risky to rip that code up.
325     if (m_currentNode->id() == ID_TABLE &&
326         newElement->id() == ID_TR &&
327         m_currentNode->isHTMLElement() && newElement->isHTMLElement()) {
328         NodeImpl* implicitTBody =
329            new HTMLTableSectionElementImpl( m_doc, ID_TBODY, true /* implicit */ );
330         m_currentNode->addChild(implicitTBody);
331         if (m_view && !implicitTBody->attached())
332             implicitTBody->attach();
333         m_currentNode = implicitTBody;
334     }
335
336     if (m_currentNode->addChild(newElement)) {
337         if (m_view && !newElement->attached())
338             newElement->attach();
339         m_currentNode = newElement;
340         return;
341     }
342     else {
343         delete newElement;
344         return;
345     }
346
347     // ### DOM spec states: "if there is no markup inside an element's content, the text is contained in a
348     // single object implementing the Text interface that is the only child of the element."... do we
349     // need to ensure that empty elements always have an empty text child?
350 }
351
352 void XMLTokenizer::endElement()
353 {
354     if (m_parserStopped) return;
355     
356     popNamespaces();
357
358     if (m_currentNode->nodeType() == Node::TEXT_NODE)
359         exitText();
360     if (m_currentNode->parentNode() != 0) {
361         do {
362             m_currentNode = m_currentNode->parentNode();
363         } while (m_currentNode && m_currentNode->implicitNode());
364     }
365 // ###  else error
366 }
367
368 void XMLTokenizer::characters(const xmlChar *s, int len)
369 {
370     if (m_parserStopped) return;
371     
372     if (m_currentNode->nodeType() == Node::TEXT_NODE ||
373         m_currentNode->nodeType() == Node::CDATA_SECTION_NODE ||
374         enterText()) {
375
376         int exceptioncode = 0;
377         static_cast<TextImpl*>(m_currentNode)->appendData(QString::fromUtf8(reinterpret_cast<const char *>(s), len),
378             exceptioncode);
379     }
380 }
381
382 bool XMLTokenizer::enterText()
383 {
384     NodeImpl *newNode = m_doc->document()->createTextNode("");
385     if (m_currentNode->addChild(newNode)) {
386         m_currentNode = newNode;
387         return true;
388     }
389     else {
390         delete newNode;
391         return false;
392     }
393 }
394
395 void XMLTokenizer::exitText()
396 {
397     if (m_view && m_currentNode && !m_currentNode->attached())
398         m_currentNode->attach();
399     
400     NodeImpl* par = m_currentNode->parentNode();
401     if (par != 0)
402         m_currentNode = par;
403 }
404
405 void XMLTokenizer::error(ErrorType type, const char *message, va_list args)
406 {
407     if (m_parserStopped) {
408         return;
409     }
410
411     if (type == fatal || (m_errorCount < maxErrors && m_lastErrorLine != lineNumber() && m_lastErrorColumn != columnNumber())) {
412
413         QString format;
414         switch (type) {
415             case warning:
416 #if APPLE_CHANGES
417                 format = QString("warning on line %2 at column %3: %1");
418 #else
419                 format = i18n( "warning: %1 in line %2, column %3\n" );
420 #endif
421                 break;
422             case fatal:
423 #if APPLE_CHANGES
424                 // fall through
425 #else
426                 format = i18n( "fatal error: %1 in line %2, column %3\n" );
427                 break;
428 #endif
429             default:
430 #if APPLE_CHANGES
431                 format = QString("error on line %2 at column %3: %1");
432 #else
433                 format = i18n( "error: %1 in line %2, column %3\n" );
434 #endif
435         }
436
437         char *m;
438         vasprintf(&m, message, args);
439         m_errorMessages += format.arg(m).arg(lineNumber()).arg(columnNumber());
440         free(m);
441
442         m_lastErrorLine = lineNumber();
443         m_lastErrorColumn = columnNumber();
444         ++m_errorCount;
445     }
446
447     if (type != warning)
448         m_sawError = true;
449
450     if (type == fatal)
451         stopParsing();
452 }
453
454 void XMLTokenizer::processingInstruction(const xmlChar *target, const xmlChar *data)
455 {
456     if (m_parserStopped) {
457         return;
458     }
459
460     if (m_currentNode->nodeType() == Node::TEXT_NODE)
461         exitText();
462     // ### handle exceptions
463     ProcessingInstructionImpl *pi = m_doc->document()->createProcessingInstruction(
464         QString::fromUtf8(reinterpret_cast<const char *>(target)),
465         QString::fromUtf8(reinterpret_cast<const char *>(data)));
466     m_currentNode->addChild(pi);
467     // don't load stylesheets for standalone documents
468     if (m_doc->document()->part()) {
469         m_sawXSLTransform = !pi->checkStyleSheet();
470         if (m_sawXSLTransform)
471             // Stop the SAX parser.
472             stopParsing();
473     }
474 }
475
476 void XMLTokenizer::cdataBlock(const xmlChar *s, int len)
477 {
478     if (m_parserStopped) {
479         return;
480     }
481
482     if (m_currentNode->nodeType() == Node::TEXT_NODE)
483         exitText();
484
485     NodeImpl *newNode = m_doc->document()->createCDATASection("");
486     if (m_currentNode->addChild(newNode)) {
487         if (m_view && !newNode->attached())
488             newNode->attach();
489         m_currentNode = newNode;
490     }
491     else {
492         delete newNode;
493         return;
494     }
495
496     characters(s, len);
497
498     if (m_currentNode->parentNode() != 0)
499         m_currentNode = m_currentNode->parentNode();
500 }
501
502 void XMLTokenizer::comment(const xmlChar *s)
503 {
504     if (m_parserStopped) return;
505     
506     if (m_currentNode->nodeType() == Node::TEXT_NODE)
507         exitText();
508     // ### handle exceptions
509     m_currentNode->addChild(m_doc->document()->createComment(QString::fromUtf8(reinterpret_cast<const char *>(s))));
510 }
511
512 static void startElementHandler(void *userData, const xmlChar *name, const xmlChar **libxmlAttributes)
513 {
514     static_cast<XMLTokenizer *>(userData)->startElement(name, libxmlAttributes);
515 }
516
517 static void endElementHandler(void *userData, const xmlChar *name)
518 {
519     static_cast<XMLTokenizer *>(userData)->endElement();
520 }
521
522 static void charactersHandler(void *userData, const xmlChar *s, int len)
523 {
524     static_cast<XMLTokenizer *>(userData)->characters(s, len);
525 }
526
527 static void processingInstructionHandler(void *userData, const xmlChar *target, const xmlChar *data)
528 {
529     static_cast<XMLTokenizer *>(userData)->processingInstruction(target, data);
530 }
531
532 static void cdataBlockHandler(void *userData, const xmlChar *s, int len)
533 {
534     static_cast<XMLTokenizer *>(userData)->cdataBlock(s, len);
535 }
536
537 static void commentHandler(void *userData, const xmlChar *comment)
538 {
539     static_cast<XMLTokenizer *>(userData)->comment(comment);
540 }
541
542 static void warningHandler(void *userData, const char *message, ...)
543 {
544     va_list args;
545     va_start(args, message);
546     static_cast<XMLTokenizer *>(userData)->error(XMLTokenizer::warning, message, args);
547     va_end(args);
548 }
549
550 static void fatalErrorHandler(void *userData, const char *message, ...)
551 {
552     va_list args;
553     va_start(args, message);
554     static_cast<XMLTokenizer *>(userData)->error(XMLTokenizer::fatal, message, args);
555     va_end(args);
556 }
557
558 static void normalErrorHandler(void *userData, const char *message, ...)
559 {
560     va_list args;
561     va_start(args, message);
562     static_cast<XMLTokenizer *>(userData)->error(XMLTokenizer::nonFatal, message, args);
563     va_end(args);
564 }
565
566 void XMLTokenizer::finish()
567 {
568     xmlSAXHandler sax;
569     memset(&sax, 0, sizeof(sax));
570     sax.error = normalErrorHandler;
571     sax.fatalError = fatalErrorHandler;
572     sax.characters = charactersHandler;
573     sax.endElement = endElementHandler;
574     sax.processingInstruction = processingInstructionHandler;
575     sax.startElement = startElementHandler;
576     sax.cdataBlock = cdataBlockHandler;
577     sax.comment = commentHandler;
578     sax.warning = warningHandler;
579     m_parserStopped = false;
580     m_sawError = false;
581     m_sawXSLTransform = false;
582     m_context = createQStringParser(&sax, this, m_doc->document()->URL().ascii());
583     parseQString(m_context, m_xmlCode);
584     xmlFreeParserCtxt(m_context);
585     m_context = NULL;
586
587     if (m_sawError) {
588         insertErrorMessageBlock();
589     } else {
590         // Parsing was successful. Now locate all html <script> tags in the document and execute them
591         // one by one.
592         addScripts(m_doc->document());
593         m_scriptsIt = new QPtrListIterator<HTMLScriptElementImpl>(m_scripts);
594         executeScripts();
595     }
596
597     emit finishedParsing();
598 }
599
600 void XMLTokenizer::insertErrorMessageBlock()
601 {
602     // One or more errors occurred during parsing of the code. Display an error block to the user above
603     // the normal content (the DOM tree is created manually and includes line/col info regarding 
604     // where the errors are located)
605
606     // Create elements for display
607     int exceptioncode = 0;
608     DocumentImpl *doc = m_doc->document();
609     NodeImpl* root = doc->documentElement();
610     if (!root) {
611         root = doc->createElementNS(XHTML_NAMESPACE, "html", exceptioncode);
612         NodeImpl* body = doc->createElementNS(XHTML_NAMESPACE, "body", exceptioncode);
613         root->appendChild(body, exceptioncode);
614         doc->appendChild(root, exceptioncode);
615         root = body;
616     }
617
618     ElementImpl* reportElement = doc->createElementNS(XHTML_NAMESPACE, "parsererror", exceptioncode);
619     reportElement->setAttribute(ATTR_STYLE, "white-space: pre; border: 2px solid #c77; padding: 0 1em 0 1em; margin: 1em; background-color: #fdd; color: black");
620     ElementImpl* h3 = doc->createElementNS(XHTML_NAMESPACE, "h3", exceptioncode);
621     h3->appendChild(doc->createTextNode("This page contains the following errors:"), exceptioncode);
622     reportElement->appendChild(h3, exceptioncode);
623     ElementImpl* fixed = doc->createElementNS(XHTML_NAMESPACE, "div", exceptioncode);
624     fixed->setAttribute(ATTR_STYLE, "font-family:monospace;font-size:12px");
625     NodeImpl* textNode = doc->createTextNode(m_errorMessages);
626     fixed->appendChild(textNode, exceptioncode);
627     reportElement->appendChild(fixed, exceptioncode);
628     h3 = doc->createElementNS(XHTML_NAMESPACE, "h3", exceptioncode);
629     reportElement->appendChild(h3, exceptioncode);
630     
631     h3->appendChild(doc->createTextNode("Below is a rendering of the page up to the first error."), exceptioncode);
632 #ifdef KHTML_XSLT
633     if (doc->transformSourceDocument()) {
634         ElementImpl* par = doc->createElementNS(XHTML_NAMESPACE, "p", exceptioncode);
635         reportElement->appendChild(par, exceptioncode);
636         par->setAttribute(ATTR_STYLE, "white-space: normal");
637         par->appendChild(doc->createTextNode("This document was created as the result of an XSL transformation. The line and column numbers given are from the transformed result."), exceptioncode);
638     }
639 #endif
640     root->insertBefore(reportElement, root->firstChild(), exceptioncode);
641
642     doc->updateRendering();
643 }
644
645 void XMLTokenizer::addScripts(NodeImpl *n)
646 {
647     // Recursively go through the entire document tree, looking for html <script> tags. For each of these
648     // that is found, add it to the m_scripts list from which they will be executed
649
650     if (n->id() == ID_SCRIPT) {
651         m_scripts.append(static_cast<HTMLScriptElementImpl*>(n));
652     }
653
654     NodeImpl *child;
655     for (child = n->firstChild(); child; child = child->nextSibling())
656         addScripts(child);
657 }
658
659 void XMLTokenizer::executeScripts()
660 {
661     // Iterate through all of the html <script> tags in the document. For those that have a src attribute,
662     // start loading the script and return (executeScripts() will be called again once the script is loaded
663     // and continue where it left off). For scripts that don't have a src attribute, execute the code
664     // inside the tag
665     while (m_scriptsIt->current()) {
666         DOMString scriptSrc = m_scriptsIt->current()->getAttribute(ATTR_SRC);
667         QString charset = m_scriptsIt->current()->getAttribute(ATTR_CHARSET).string();
668
669         // don't load external scripts for standalone documents (for now)
670         if (scriptSrc != "" && m_doc->document()->part()) {
671             // we have a src attribute
672             m_cachedScript = m_doc->document()->docLoader()->requestScript(scriptSrc, charset);
673             ++(*m_scriptsIt);
674             m_cachedScript->ref(this); // will call executeScripts() again if already cached
675             return;
676         }
677         else {
678             // no src attribute - execute from contents of tag
679             QString scriptCode = "";
680             NodeImpl *child;
681             for (child = m_scriptsIt->current()->firstChild(); child; child = child->nextSibling()) {
682                 if (child->nodeType() == Node::TEXT_NODE || child->nodeType() == Node::CDATA_SECTION_NODE) {
683                     scriptCode += static_cast<TextImpl*>(child)->data().string();
684                 }
685             }
686             // the script cannot do document.write until we support incremental parsing
687             // ### handle the case where the script deletes the node or redirects to
688             // another page, etc. (also in notifyFinished())
689             // ### the script may add another script node after this one which should be executed
690             if (m_view) {
691                 m_view->part()->executeScript(scriptCode);
692             }
693             ++(*m_scriptsIt);
694         }
695     }
696
697     // All scripts have finished executing, so calculate the style for the document and close
698     // the last element
699     m_doc->document()->updateStyleSelector();
700 }
701
702 void XMLTokenizer::notifyFinished(CachedObject *finishedObj)
703 {
704     // This is called when a script has finished loading that was requested from executeScripts(). We execute
705     // the script, and then call executeScripts() again to continue iterating through the list of scripts in
706     // the document
707     if (finishedObj == m_cachedScript) {
708         DOMString scriptSource = m_cachedScript->script();
709         m_cachedScript->deref(this);
710         m_cachedScript = 0;
711         m_view->part()->executeScript(scriptSource.string());
712         executeScripts();
713     }
714 }
715
716 bool XMLTokenizer::isWaitingForScripts() const
717 {
718     return m_cachedScript != 0;
719 }
720
721 #ifdef KHTML_XSLT
722 void XMLTokenizer::setTransformSource(DocumentImpl* doc)
723 {
724     // Time to spin up a new parse and save the xmlDocPtr.
725     // Parse in a single chunk into an xmlDocPtr
726     // FIXME: Hook up error handlers so that a failure to parse the main document results in
727     // good error messages.
728     const QChar BOM(0xFEFF);
729     const unsigned char BOMHighByte = *reinterpret_cast<const unsigned char *>(&BOM);
730     xmlDocPtr sourceDoc = xmlReadMemory(reinterpret_cast<const char *>(m_xmlCode.unicode()),
731                                         m_xmlCode.length() * sizeof(QChar),
732                                         doc->URL().ascii(),
733                                         BOMHighByte == 0xFF ? "UTF-16LE" : "UTF-16BE", 
734                                         XML_PARSE_NOCDATA|XML_PARSE_DTDATTR|XML_PARSE_NOENT);
735     doc->setTransformSource(sourceDoc);
736 }
737 #endif
738
739 Tokenizer *newXMLTokenizer(DocumentPtr *d, KHTMLView *v)
740 {
741     return new XMLTokenizer(d, v);
742 }
743
744 int XMLTokenizer::lineNumber() const
745 {
746     return m_context->input->line;
747 }
748
749 int XMLTokenizer::columnNumber() const
750 {
751     return m_context->input->col;
752 }
753
754 void XMLTokenizer::stopParsing()
755 {
756     xmlStopParser(m_context);
757     m_parserStopped = true;
758 }
759
760 #if 0
761
762 bool XMLHandler::attributeDecl(const QString &/*eName*/, const QString &/*aName*/, const QString &/*type*/,
763                                const QString &/*valueDefault*/, const QString &/*value*/)
764 {
765     // qt's xml parser (as of 2.2.3) does not currently give us values for type, valueDefault and
766     // value. When it does, we can store these somewhere and have default attributes on elements
767     return true;
768 }
769
770 bool XMLHandler::externalEntityDecl(const QString &/*name*/, const QString &/*publicId*/, const QString &/*systemId*/)
771 {
772     // ### insert these too - is there anything special we have to do here?
773     return true;
774 }
775
776 bool XMLHandler::internalEntityDecl(const QString &name, const QString &value)
777 {
778     EntityImpl *e = new EntityImpl(m_doc,name);
779     // ### further parse entities inside the value and add them as separate nodes (or entityreferences)?
780     e->addChild(m_doc->document()->createTextNode(value));
781 // ### FIXME
782 //     if (m_doc->document()->doctype())
783 //         static_cast<GenericRONamedNodeMapImpl*>(m_doc->document()->doctype()->entities())->addNode(e);
784     return true;
785 }
786
787 bool XMLHandler::notationDecl(const QString &name, const QString &publicId, const QString &systemId)
788 {
789 // ### FIXME
790 //     if (m_doc->document()->doctype()) {
791 //         NotationImpl *n = new NotationImpl(m_doc,name,publicId,systemId);
792 //         static_cast<GenericRONamedNodeMapImpl*>(m_doc->document()->doctype()->notations())->addNode(n);
793 //     }
794     return true;
795 }
796
797 #endif
798
799 // --------------------------------
800
801 XMLNamespaceStack::~XMLNamespaceStack()
802 {
803     while (XMLNamespace *ns = m_namespaceStack.pop())
804         ns->deref();
805 }
806
807 void XMLNamespaceStack::popNamespaces()
808 {
809     XMLNamespace *ns = m_namespaceStack.pop();
810     if (ns)
811         ns->deref();
812 }
813
814 XMLNamespace *XMLNamespaceStack::pushNamespaces(XMLAttributes& attrs)
815 {
816     XMLNamespace *ns = m_namespaceStack.current();
817     if (!ns)
818         ns = new XMLNamespace;
819
820     // Search for any xmlns attributes.
821     for (int i = 0; i < attrs.length(); i++) {
822         QString qName = attrs.qName(i);
823         if (qName == "xmlns")
824             ns = new XMLNamespace(QString::null, attrs.value(i), ns);
825         else if (qName.startsWith("xmlns:"))
826             ns = new XMLNamespace(qName.right(qName.length()-6), attrs.value(i), ns);
827     }
828
829     m_namespaceStack.push(ns);
830     ns->ref();
831     return ns;
832 }
833
834 // --------------------------------
835
836 struct AttributeParseState {
837     QMap<QString, QString> attributes;
838     bool gotAttributes;
839 };
840
841 static void attributesStartElementHandler(void *userData, const xmlChar *name, const xmlChar **libxmlAttributes)
842 {
843     if (strcmp(reinterpret_cast<const char *>(name), "attrs") != 0) {
844         return;
845     }
846         
847     AttributeParseState *state = static_cast<AttributeParseState *>(userData);
848     
849     state->gotAttributes = true;
850     
851     XMLAttributes attributes(reinterpret_cast<const char **>(libxmlAttributes));
852     XMLNamespaceStack stack;
853     attributes.split(stack.pushNamespaces(attributes));
854     int length = attributes.length();
855     for (int i = 0; i != length; ++i) {
856         state->attributes.insert(attributes.qName(i), attributes.value(i));
857     }
858 }
859
860 QMap<QString, QString> parseAttributes(const DOMString &string, bool &attrsOK)
861 {
862     AttributeParseState state;
863     state.gotAttributes = false;
864
865     xmlSAXHandler sax;
866     memset(&sax, 0, sizeof(sax));
867     sax.startElement = attributesStartElementHandler;
868     xmlParserCtxtPtr parser = createQStringParser(&sax, &state);
869     parseQString(parser, "<?xml version=\"1.0\"?><attrs " + string.string() + " />");
870     xmlFreeParserCtxt(parser);
871
872     attrsOK = state.gotAttributes;
873     return state.attributes;
874 }
875
876 // --------------------------------
877
878 XMLAttributes::XMLAttributes(const char **saxStyleAttributes)
879     : _ref(0), _uris(0)
880 {
881     int length = 0;
882     if (saxStyleAttributes) {
883         for (const char **p = saxStyleAttributes; *p; p += 2) {
884             ++length;
885         }
886     }
887
888     _length = length;
889     if (!length) {
890         _names = 0;
891         _values = 0;
892         _uris = 0;
893     } else {
894         _names = new QString [length];
895         _values = new QString [length];
896     }
897
898     if (saxStyleAttributes) {
899         int i = 0;
900         for (const char **p = saxStyleAttributes; *p; p += 2) {
901             _names[i] = QString::fromUtf8(p[0]);
902             _values[i] = QString::fromUtf8(p[1]);
903             ++i;
904         }
905     }
906 }
907
908 XMLAttributes::~XMLAttributes()
909 {
910     if (_ref && !--*_ref) {
911         delete _ref;
912         _ref = 0;
913     }
914     if (!_ref) {
915         delete [] _names;
916         delete [] _values;
917         delete [] _uris;
918     }
919 }
920
921 XMLAttributes::XMLAttributes(const XMLAttributes &other)
922     : _ref(other._ref)
923     , _length(other._length)
924     , _names(other._names)
925     , _values(other._values)
926     , _uris(other._uris)
927 {
928     if (!_ref) {
929         _ref = new int (2);
930         other._ref = _ref;
931     } else {
932         ++*_ref;
933     }
934 }
935
936 XMLAttributes &XMLAttributes::operator=(const XMLAttributes &other)
937 {
938     if (_ref && !--*_ref) {
939         delete _ref;
940         _ref = 0;
941     }
942     if (!_ref) {
943         delete [] _names;
944         delete [] _values;
945         delete [] _uris;
946     }
947
948     _ref = other._ref;
949     _length = other._length;
950     _names = other._names;
951     _values = other._values;
952     _uris = other._uris;
953
954     if (!_ref) {
955         _ref = new int (2);
956         other._ref = _ref;
957     } else {
958         ++*_ref;
959     }
960     
961     return *this;
962 }
963
964 QString XMLAttributes::localName(int index) const
965 {
966     int colonPos = _names[index].find(':');
967     if (colonPos != -1)
968         // Peel off the prefix to return the localName.
969         return _names[index].right(_names[index].length() - colonPos - 1);
970     return _names[index];
971 }
972
973 QString XMLAttributes::value(const QString &name) const
974 {
975     for (int i = 0; i != _length; ++i) {
976         if (name == _names[i]) {
977             return _values[i];
978         }
979     }
980     return QString::null;
981 }
982
983 void XMLAttributes::split(XMLNamespace* ns)
984 {
985     for (int i = 0; i < _length; ++i) {
986         int colonPos = _names[i].find(':');
987         if (colonPos != -1) {
988             QString prefix = _names[i].left(colonPos);
989             QString uri;
990             if (prefix == "xmlns") {
991                 // FIXME: The URI is the xmlns namespace? I seem to recall DOM lvl 3 saying something about this.
992             }
993             else
994                 uri = ns->uriForPrefix(prefix);
995             
996             if (!uri.isEmpty()) {
997                 if (!_uris)
998                     _uris = new QString[_length];
999                 _uris[i] = uri;
1000             }
1001         }
1002     }
1003 }
1004
1005 }
1006
1007 #include "xml_tokenizer.moc"