run-webkit-tests: Upload test results (new results database)
[WebKit-https.git] / Tools / Scripts / webkitpy / layout_tests / run_webkit_tests.py
1 # Copyright (C) 2010 Google Inc. All rights reserved.
2 # Copyright (C) 2010 Gabor Rapcsanyi (rgabor@inf.u-szeged.hu), University of Szeged
3 # Copyright (C) 2011, 2016 Apple Inc. All rights reserved.
4 #
5 # Redistribution and use in source and binary forms, with or without
6 # modification, are permitted provided that the following conditions are
7 # met:
8 #
9 #     * Redistributions of source code must retain the above copyright
10 # notice, this list of conditions and the following disclaimer.
11 #     * Redistributions in binary form must reproduce the above
12 # copyright notice, this list of conditions and the following disclaimer
13 # in the documentation and/or other materials provided with the
14 # distribution.
15 #     * Neither the name of Google Inc. nor the names of its
16 # contributors may be used to endorse or promote products derived from
17 # this software without specific prior written permission.
18 #
19 # THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
20 # "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
21 # LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
22 # A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
23 # OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
24 # SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
25 # LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
26 # DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
27 # THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
28 # (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
29 # OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
30
31 from __future__ import print_function
32 import logging
33 import optparse
34 import os
35 import sys
36 import traceback
37
38 from webkitpy.common.host import Host
39 from webkitpy.layout_tests.controllers.manager import Manager
40 from webkitpy.layout_tests.models.test_run_results import INTERRUPTED_EXIT_STATUS
41 from webkitpy.port import configuration_options, platform_options
42 from webkitpy.layout_tests.views import buildbot_results
43 from webkitpy.layout_tests.views import printing
44 from webkitpy.results.options import upload_options
45
46
47 _log = logging.getLogger(__name__)
48
49
50 # This is a randomly chosen exit code that can be tested against to
51 # indicate that an unexpected exception occurred.
52 EXCEPTIONAL_EXIT_STATUS = 254
53
54
55 def main(argv, stdout, stderr):
56     options, args = parse_args(argv)
57
58     if options.platform and 'test' in options.platform:
59         # It's a bit lame to import mocks into real code, but this allows the user
60         # to run tests against the test platform interactively, which is useful for
61         # debugging test failures.
62         from webkitpy.common.host_mock import MockHost
63         host = MockHost()
64     else:
65         host = Host()
66
67     if options.lint_test_files:
68         from webkitpy.layout_tests.lint_test_expectations import lint
69         return lint(host, options, stderr)
70
71     try:
72         port = host.port_factory.get(options.platform, options)
73     except NotImplementedError as e:
74         # FIXME: is this the best way to handle unsupported port names?
75         print(str(e), file=stderr)
76         return EXCEPTIONAL_EXIT_STATUS
77
78     if options.print_expectations:
79         return _print_expectations(port, options, args, stderr)
80
81     try:
82         # Force all tests to use a smaller stack so that stack overflow tests can run faster.
83         stackSizeInBytes = int(1.5 * 1024 * 1024)
84         options.additional_env_var.append('JSC_maxPerThreadStackUsage=' + str(stackSizeInBytes))
85         options.additional_env_var.append('__XPC_JSC_maxPerThreadStackUsage=' + str(stackSizeInBytes))
86         run_details = run(port, options, args, stderr)
87         if run_details.exit_code != -1 and not run_details.initial_results.keyboard_interrupted:
88             bot_printer = buildbot_results.BuildBotPrinter(stdout, options.debug_rwt_logging)
89             bot_printer.print_results(run_details)
90
91         return run_details.exit_code
92     # We still need to handle KeyboardInterrupt, at least for webkitpy unittest cases.
93     except KeyboardInterrupt:
94         return INTERRUPTED_EXIT_STATUS
95     except BaseException as e:
96         if isinstance(e, Exception):
97             print('\n%s raised: %s' % (e.__class__.__name__, str(e)), file=stderr)
98             traceback.print_exc(file=stderr)
99         return EXCEPTIONAL_EXIT_STATUS
100
101
102 def parse_args(args):
103     option_group_definitions = []
104
105     option_group_definitions.append(("Platform options", platform_options()))
106     option_group_definitions.append(("Configuration options", configuration_options()))
107     option_group_definitions.append(("Printing Options", printing.print_options()))
108
109     option_group_definitions.append(("Feature Switches", [
110         optparse.make_option("--complex-text", action="store_true", default=False,
111             help="Use the complex text code path for all text (OS X and Windows only)"),
112         optparse.make_option("--accelerated-drawing", action="store_true", default=False,
113             help="Use accelerated drawing (OS X only)"),
114         optparse.make_option("--remote-layer-tree", action="store_true", default=False,
115             help="Use the remote layer tree drawing model (OS X WebKit2 only)"),
116     ]))
117
118     option_group_definitions.append(("WebKit Options", [
119         optparse.make_option("--gc-between-tests", action="store_true", default=False,
120             help="Force garbage collection between each test"),
121         optparse.make_option("-l", "--leaks", action="store_true", default=False,
122             help="Enable leaks checking (OS X and Gtk+ only)"),
123         optparse.make_option("-g", "--guard-malloc", action="store_true", default=False,
124             help="Enable Guard Malloc (OS X only)"),
125         optparse.make_option("--threaded", action="store_true", default=False,
126             help="Run a concurrent JavaScript thread with each test"),
127         optparse.make_option("--dump-render-tree", "-1", action="store_false", default=True, dest="webkit_test_runner",
128             help="Use DumpRenderTree rather than WebKitTestRunner."),
129         # FIXME: We should merge this w/ --build-directory and only have one flag.
130         optparse.make_option("--root", action="store",
131             help="Path to a directory containing the executables needed to run tests."),
132     ]))
133
134     option_group_definitions.append(("Results Options", [
135         optparse.make_option("-p", "--pixel", "--pixel-tests", action="store_true",
136             dest="pixel_tests", help="Enable pixel-to-pixel PNG comparisons"),
137         optparse.make_option("--no-pixel", "--no-pixel-tests", action="store_false",
138             dest="pixel_tests", help="Disable pixel-to-pixel PNG comparisons"),
139         optparse.make_option("--no-sample-on-timeout", action="store_false", default=True,
140             dest="sample_on_timeout", help="Don't run sample on timeout (OS X only)"),
141         optparse.make_option("--no-ref-tests", action="store_true",
142             dest="no_ref_tests", help="Skip all ref tests"),
143         optparse.make_option("--tolerance",
144             help="Ignore image differences less than this percentage (some "
145                 "ports may ignore this option)", type="float"),
146         optparse.make_option("--results-directory", help="Location of test results"),
147         optparse.make_option("--build-directory",
148             help="Path to the directory under which build files are kept (should not include configuration)"),
149         optparse.make_option("--add-platform-exceptions", action="store_true", default=False,
150             help="Save generated results into the *most-specific-platform* directory rather than the *generic-platform* directory"),
151         optparse.make_option("--new-baseline", action="store_true",
152             default=False, help="Save generated results as new baselines "
153                  "into the *most-specific-platform* directory, overwriting whatever's "
154                  "already there. Equivalent to --reset-results --add-platform-exceptions"),
155         optparse.make_option("--reset-results", action="store_true",
156             default=False, help="Reset expectations to the "
157                  "generated results in their existing location."),
158         optparse.make_option("--no-new-test-results", action="store_false",
159             dest="new_test_results", default=True,
160             help="Don't create new baselines when no expected results exist"),
161         optparse.make_option("--treat-ref-tests-as-pixel-tests", action="store_true", default=False,
162             help="Run ref tests, but treat them as if they were traditional pixel tests"),
163
164         #FIXME: we should support a comma separated list with --pixel-test-directory as well.
165         optparse.make_option("--pixel-test-directory", action="append", default=[], dest="pixel_test_directories",
166             help="A directory where it is allowed to execute tests as pixel tests. "
167                  "Specify multiple times to add multiple directories. "
168                  "This option implies --pixel-tests. If specified, only those tests "
169                  "will be executed as pixel tests that are located in one of the "
170                  "directories enumerated with the option. Some ports may ignore this "
171                  "option while others can have a default value that can be overridden here."),
172
173         optparse.make_option("--skip-failing-tests", action="store_true",
174             default=False, help="Skip tests that are expected to fail. "
175                  "Note: When using this option, you might miss new crashes "
176                  "in these tests."),
177         optparse.make_option("--additional-drt-flag", action="append",
178             default=[], help="Additional command line flag to pass to DumpRenderTree "
179                  "Specify multiple times to add multiple flags."),
180         optparse.make_option("--driver-name", type="string",
181             help="Alternative DumpRenderTree binary to use"),
182         optparse.make_option("--additional-platform-directory", action="append",
183             default=[], help="Additional directory where to look for test "
184                  "baselines (will take precendence over platform baselines). "
185                  "Specify multiple times to add multiple search path entries."),
186         optparse.make_option("--additional-expectations", action="append", default=[],
187             help="Path to a test_expectations file that will override previous expectations. "
188                  "Specify multiple times for multiple sets of overrides."),
189         optparse.make_option("--compare-port", action="store", default=None,
190             help="Use the specified port's baselines first"),
191         optparse.make_option("--no-show-results", action="store_false",
192             default=True, dest="show_results",
193             help="Don't launch a browser with results after the tests "
194                  "are done"),
195         optparse.make_option("--full-results-html", action="store_true",
196             default=False,
197             help="Show all failures in results.html, rather than only regressions"),
198         optparse.make_option("--clobber-old-results", action="store_true",
199             default=False, help="Clobbers test results from previous runs."),
200         optparse.make_option("--http", action="store_true", dest="http",
201             default=True, help="Run HTTP and WebSocket tests (default)"),
202         optparse.make_option("--no-http", action="store_false", dest="http",
203             help="Don't run HTTP and WebSocket tests"),
204         optparse.make_option("--no-http-servers", action="store_false", dest="start_http_servers_if_needed",
205             default=True, help="Don't start HTTP servers"),
206         optparse.make_option("--ignore-metrics", action="store_true", dest="ignore_metrics",
207             default=False, help="Ignore rendering metrics related information from test "
208             "output, only compare the structure of the rendertree."),
209         optparse.make_option("--nocheck-sys-deps", action="store_true",
210             default=False,
211             help="Don't check the system dependencies (themes)"),
212         optparse.make_option("--java", action="store_true",
213             default=False,
214             help="Build java support files"),
215         optparse.make_option("--layout-tests-directory", action="store", default=None,
216             help="Override the default layout test directory.", dest="layout_tests_dir")
217     ]))
218
219     option_group_definitions.append(("Testing Options", [
220         optparse.make_option("--build", dest="build",
221             action="store_true", default=True,
222             help="Check to ensure the DumpRenderTree build is up-to-date "
223                  "(default)."),
224         optparse.make_option("--no-build", dest="build",
225             action="store_false", help="Don't check to see if the "
226                                        "DumpRenderTree build is up-to-date."),
227         optparse.make_option("-n", "--dry-run", action="store_true",
228             default=False,
229             help="Do everything but actually run the tests or upload results."),
230         optparse.make_option("--wrapper",
231             help="wrapper command to insert before invocations of "
232                  "DumpRenderTree or WebKitTestRunner; option is split on whitespace before "
233                  "running. (Example: --wrapper='valgrind --smc-check=all')"),
234         optparse.make_option("-i", "--ignore-tests", action="append", default=[],
235             help="directories or test to ignore (may specify multiple times)"),
236         optparse.make_option("--test-list", action="append",
237             help="read list of tests to run from file", metavar="FILE"),
238         optparse.make_option("--skipped", action="store", default="default",
239             help=("control how tests marked SKIP are run. "
240                  "'default' == Skip tests unless explicitly listed on the command line, "
241                  "'ignore' == Run them anyway, "
242                  "'only' == only run the SKIP tests, "
243                  "'always' == always skip, even if listed on the command line.")),
244         optparse.make_option("--force", action="store_true", default=False,
245             help="Run all tests with PASS as expected result, even those marked SKIP in the test list or " + \
246                  "those which are device-specific (implies --skipped=ignore)"),
247         optparse.make_option("--time-out-ms",
248             help="Set the timeout for each test"),
249         optparse.make_option("--order", action="store", default="natural",
250             help=("determine the order in which the test cases will be run. "
251                   "'none' == use the order in which the tests were listed either in arguments or test list, "
252                   "'natural' == use the natural order (default), "
253                   "'random' == randomize the test order.")),
254         optparse.make_option("--run-chunk",
255             help=("Run a specified chunk (n:l), the nth of len l, "
256                  "of the layout tests")),
257         optparse.make_option("--run-part", help=("Run a specified part (n:m), "
258                   "the nth of m parts, of the layout tests")),
259         optparse.make_option("--batch-size",
260             help=("Run a the tests in batches (n), after every n tests, "
261                   "DumpRenderTree is relaunched."), type="int", default=None),
262         optparse.make_option("--run-singly", action="store_true",
263             default=False, help="run a separate DumpRenderTree for each test (implies --verbose)"),
264         optparse.make_option("--child-processes",
265             help="Number of DumpRenderTrees to run in parallel."),
266         # FIXME: Display default number of child processes that will run.
267         optparse.make_option("-f", "--fully-parallel", action="store_true",
268             help="run all tests in parallel"),
269         optparse.make_option("--exit-after-n-failures", type="int", default=None,
270             help="Exit after the first N failures instead of running all "
271             "tests"),
272         optparse.make_option("--exit-after-n-crashes-or-timeouts", type="int",
273             default=None, help="Exit after the first N crashes instead of "
274             "running all tests"),
275         optparse.make_option("--iterations", type="int", default=1, help="Number of times to run the set of tests (e.g. ABCABCABC)"),
276         optparse.make_option("--repeat-each", type="int", default=1, help="Number of times to run each test (e.g. AAABBBCCC)"),
277         optparse.make_option("--retry-failures", action="store_true",
278             default=True,
279             help="Re-try any tests that produce unexpected results (default)"),
280         optparse.make_option("--no-retry-failures", action="store_false",
281             dest="retry_failures",
282             help="Don't re-try any tests that produce unexpected results."),
283         optparse.make_option("--max-locked-shards", type="int", default=0,
284             help="Set the maximum number of locked shards"),
285         optparse.make_option("--additional-env-var", type="string", action="append", default=[],
286             help="Passes that environment variable to the tests (--additional-env-var=NAME=VALUE)"),
287         optparse.make_option("--profile", action="store_true",
288             help="Output per-test profile information."),
289         optparse.make_option("--profiler", action="store",
290             help="Output per-test profile information, using the specified profiler."),
291         optparse.make_option("--no-timeout", action="store_true", default=False, help="Disable test timeouts"),
292         optparse.make_option('--display-server', choices=['xvfb', 'xorg', 'weston', 'wayland'], default='xvfb',
293             help='"xvfb": Use a virtualized X11 server. "xorg": Use the current X11 session. '
294                  '"weston": Use a virtualized Weston server. "wayland": Use the current wayland session.'),
295         optparse.make_option("--world-leaks", action="store_true", default=False, help="Check for world leaks (currently, only documents). Differs from --leaks in that this uses internal instrumentation, rather than external tools."),
296     ]))
297
298     option_group_definitions.append(("iOS Options", [
299         optparse.make_option('--no-install', action='store_const', const=False, default=True, dest='install',
300             help='Skip install step for device and simulator testing'),
301         optparse.make_option('--version', help='Specify the version of iOS to be used. By default, this will adopt the runtime for iOS Simulator.'),
302         optparse.make_option('--device-type', help='iOS Simulator device type identifier (default: i386 -> iPhone 5, x86_64 -> iPhone SE)'),
303         optparse.make_option('--dedicated-simulators', action="store_true", default=False,
304             help="If set, dedicated iOS simulators will always be created.  If not set, the script will attempt to use any currently running simulator."),
305         optparse.make_option('--show-touches', action="store_true", default=False, help="If set, a small dot will be shown where the generated touches are. Helpful for debugging touch tests."),
306     ]))
307
308     option_group_definitions.append(("Miscellaneous Options", [
309         optparse.make_option("--lint-test-files", action="store_true",
310         default=False, help=("Makes sure the test files parse for all "
311                             "configurations. Does not run any tests.")),
312         optparse.make_option("--print-expectations", action="store_true",
313         default=False, help=("Print the expected outcome for the given test, or all tests listed in TestExpectations. "
314                             "Does not run any tests.")),
315     ]))
316
317     option_group_definitions.append(("Web Platform Test Server Options", [
318         optparse.make_option("--wptserver-doc-root", type="string", help=("Set web platform server document root, relative to LayoutTests directory")),
319     ]))
320
321     # FIXME: Remove this group once the old results dashboards are deprecated.
322     option_group_definitions.append(("Legacy Result Options", [
323         optparse.make_option("--master-name", help="The name of the buildbot master."),
324         optparse.make_option("--build-name", default="DUMMY_BUILD_NAME",
325             help=("The name of the builder used in its path, e.g. webkit-rel.")),
326         optparse.make_option("--build-slave", default="DUMMY_BUILD_SLAVE",
327             help=("The name of the buildslave used. e.g. apple-macpro-6.")),
328         optparse.make_option("--test-results-server", action="append", default=[],
329             help=("If specified, upload results json files to this appengine server.")),
330         optparse.make_option("--results-server-host", action="append", default=[],
331             help=("If specified, upload results JSON file to this results server.")),
332         optparse.make_option("--additional-repository-name",
333             help=("The name of an additional subversion or git checkout")),
334         optparse.make_option("--additional-repository-path",
335             help=("The path to an additional subversion or git checkout (requires --additional-repository-name)")),
336         optparse.make_option("--allowed-host", type="string", action="append", default=[],
337             help=("If specified, tests are allowed to make requests to the specified hostname."))
338     ]))
339
340     option_group_definitions.append(('Upload Options', upload_options()))
341
342     option_parser = optparse.OptionParser(usage="%prog [options] [<path>...]")
343
344     for group_name, group_options in option_group_definitions:
345         option_group = optparse.OptionGroup(option_parser, group_name)
346         option_group.add_options(group_options)
347         option_parser.add_option_group(option_group)
348
349     return option_parser.parse_args(args)
350
351
352 def _print_expectations(port, options, args, logging_stream):
353     logger = logging.getLogger()
354     logger.setLevel(logging.DEBUG if options.debug_rwt_logging else logging.INFO)
355     try:
356         printer = printing.Printer(port, options, logging_stream, logger=logger)
357
358         _set_up_derived_options(port, options)
359         manager = Manager(port, options, printer)
360
361         exit_code = manager.print_expectations(args)
362         _log.debug("Printing expectations completed, Exit status: %d", exit_code)
363         return exit_code
364     except Exception as error:
365         _log.error('Error printing expectations: {}'.format(error))
366     finally:
367         printer.cleanup()
368         return -1
369
370
371 def _set_up_derived_options(port, options):
372     """Sets the options values that depend on other options values."""
373     if not options.child_processes:
374         options.child_processes = os.environ.get('WEBKIT_TEST_CHILD_PROCESSES')
375
376     if not options.configuration:
377         options.configuration = port.default_configuration()
378
379     if options.pixel_tests is None:
380         options.pixel_tests = port.default_pixel_tests()
381
382     if not options.time_out_ms:
383         options.time_out_ms = str(port.default_timeout_ms())
384
385     options.slow_time_out_ms = str(5 * int(options.time_out_ms))
386
387     if options.additional_platform_directory:
388         additional_platform_directories = []
389         for path in options.additional_platform_directory:
390             additional_platform_directories.append(port.host.filesystem.abspath(path))
391         options.additional_platform_directory = additional_platform_directories
392
393     if options.force:
394         if options.skipped not in ('ignore', 'default'):
395             _log.warning("--force overrides --skipped=%s" % (options.skipped))
396         options.skipped = 'ignore'
397
398     if not options.http and options.skipped in ('ignore', 'only'):
399         _log.warning("--force/--skipped=%s overrides --no-http." % (options.skipped))
400         options.http = True
401
402     if options.ignore_metrics and (options.new_baseline or options.reset_results):
403         _log.warning("--ignore-metrics has no effect with --new-baselines or with --reset-results")
404
405     if options.new_baseline:
406         options.reset_results = True
407         options.add_platform_exceptions = True
408
409     if options.pixel_test_directories:
410         options.pixel_tests = True
411         varified_dirs = set()
412         pixel_test_directories = options.pixel_test_directories
413         for directory in pixel_test_directories:
414             # FIXME: we should support specifying the directories all the ways we support it for additional
415             # arguments specifying which tests and directories to run. We should also move the logic for that
416             # to Port.
417             filesystem = port.host.filesystem
418             if not filesystem.isdir(filesystem.join(port.layout_tests_dir(), directory)):
419                 _log.warning("'%s' was passed to --pixel-test-directories, which doesn't seem to be a directory" % str(directory))
420             else:
421                 varified_dirs.add(directory)
422
423         options.pixel_test_directories = list(varified_dirs)
424
425     if options.run_singly:
426         options.verbose = True
427
428     # The GTK+ and WPE ports only support WebKit2 so they always use WKTR.
429     if options.platform in ["gtk", "wpe"]:
430         options.webkit_test_runner = True
431
432     if options.leaks:
433         options.additional_env_var.append("JSC_usePoisoning=0")
434         options.additional_env_var.append("__XPC_JSC_usePoisoning=0")
435
436 def run(port, options, args, logging_stream):
437     logger = logging.getLogger()
438     logger.setLevel(logging.DEBUG if options.debug_rwt_logging else logging.INFO)
439
440     try:
441         printer = printing.Printer(port, options, logging_stream, logger=logger)
442
443         _set_up_derived_options(port, options)
444         manager = Manager(port, options, printer)
445         printer.print_config(port.results_directory())
446
447         run_details = manager.run(args)
448         _log.debug("Testing completed, Exit status: %d" % run_details.exit_code)
449         return run_details
450     finally:
451         printer.cleanup()
452
453 if __name__ == '__main__':
454     sys.exit(main(sys.argv[1:], sys.stdout, sys.stderr))