2901a9fd333396767191465b95c3b09684e7ab28
[WebKit.git] / Tools / Scripts / webkitpy / layout_tests / port / test_files.py
1 #!/usr/bin/env python
2 # Copyright (C) 2010 Google Inc. All rights reserved.
3 #
4 # Redistribution and use in source and binary forms, with or without
5 # modification, are permitted provided that the following conditions are
6 # met:
7 #
8 #     * Redistributions of source code must retain the above copyright
9 # notice, this list of conditions and the following disclaimer.
10 #     * Redistributions in binary form must reproduce the above
11 # copyright notice, this list of conditions and the following disclaimer
12 # in the documentation and/or other materials provided with the
13 # distribution.
14 #     * Neither the name of Google Inc. nor the names of its
15 # contributors may be used to endorse or promote products derived from
16 # this software without specific prior written permission.
17 #
18 # THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
19 # "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
20 # LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
21 # A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
22 # OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
23 # SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
24 # LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
25 # DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
26 # THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
27 # (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
28 # OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
29
30 """This module is used to find all of the layout test files used by
31 run-webkit-tests. It exposes one public function - find() -
32 which takes an optional list of paths. If a list is passed in, the returned
33 list of test files is constrained to those found under the paths passed in,
34 i.e. calling find(["LayoutTests/fast"]) will only return files
35 under that directory."""
36
37 import glob
38 import os
39 import time
40
41 from webkitpy.common.system import logutils
42
43
44 _log = logutils.get_logger(__file__)
45
46
47 # When collecting test cases, we include any file with these extensions.
48 _supported_file_extensions = set(['.html', '.shtml', '.xml', '.xhtml', '.xhtmlmp', '.pl',
49                                   '.php', '.svg'])
50 # When collecting test cases, skip these directories
51 _skipped_directories = set(['.svn', '_svn', 'resources', 'script-tests'])
52
53
54 def find(port, paths):
55     """Finds the set of tests under port.layout_tests_dir().
56
57     Args:
58       paths: a list of command line paths relative to the layout_tests_dir()
59           to limit the search to. glob patterns are ok.
60     """
61     fs = port._filesystem
62     gather_start_time = time.time()
63     paths_to_walk = set()
64     # if paths is empty, provide a pre-defined list.
65     if paths:
66         _log.debug("Gathering tests from: %s relative to %s" % (paths, port.layout_tests_dir()))
67         for path in paths:
68             # If there's an * in the name, assume it's a glob pattern.
69             path = fs.join(port.layout_tests_dir(), path)
70             if path.find('*') > -1:
71                 filenames = fs.glob(path)
72                 paths_to_walk.update(filenames)
73             else:
74                 paths_to_walk.add(path)
75     else:
76         _log.debug("Gathering tests from: %s" % port.layout_tests_dir())
77         paths_to_walk.add(port.layout_tests_dir())
78
79     # Now walk all the paths passed in on the command line and get filenames
80     test_files = set()
81     for path in paths_to_walk:
82         if fs.isfile(path) and _is_test_file(fs, path):
83             test_files.add(fs.normpath(path))
84             continue
85
86         for root, dirs, files in os.walk(path):
87             # Don't walk skipped directories or their sub-directories.
88             if os.path.basename(root) in _skipped_directories:
89                 del dirs[:]
90                 continue
91             # This copy and for-in is slightly inefficient, but
92             # the extra walk avoidance consistently shaves .5 seconds
93             # off of total walk() time on my MacBook Pro.
94             for directory in dirs[:]:
95                 if directory in _skipped_directories:
96                     dirs.remove(directory)
97
98             for filename in files:
99                 if _is_test_file(fs, filename):
100                     filename = fs.join(root, filename)
101                     filename = fs.normpath(filename)
102                     test_files.add(filename)
103
104     gather_time = time.time() - gather_start_time
105     _log.debug("Test gathering took %f seconds" % gather_time)
106
107     return test_files
108
109
110 def _has_supported_extension(fs, filename):
111     """Return true if filename is one of the file extensions we want to run a
112     test on."""
113     extension = fs.splitext(filename)[1]
114     return extension in _supported_file_extensions
115
116
117 def _is_reference_html_file(filename):
118     """Return true if the filename points to a reference HTML file."""
119     if (filename.endswith('-expected.html') or
120         filename.endswith('-expected-mismatch.html')):
121         _log.warn("Reftests are not supported - ignoring %s" % filename)
122         return True
123     return False
124
125
126 def _is_test_file(fs, filename):
127     """Return true if the filename points to a test file."""
128     return (_has_supported_extension(fs, filename) and
129             not _is_reference_html_file(filename))