Record evaluated-ness on workers and wrappers
[ghc.git] / testsuite / tests / perf / compiler / all.T
1 # Tests that call 'compiler_stats_num_field' are skipped when debugging is on.
2 # See testsuite/driver/testlib.py.
3
4 def no_lint(name, opts):
5    opts.compiler_always_flags = \
6        [opt for opt in opts.compiler_always_flags if opt != '-dcore-lint' and opt != '-dcmm-lint']
7
8 setTestOpts(no_lint)
9
10
11 # Note [residency]
12 #
13 # Residency (peak_megabytes_allocated and max_bytes_used) is sensitive
14 # to when the major GC runs, which makes it inherently inaccurate.
15 # Sometime an innocuous change somewhere can shift things around such
16 # that the samples occur at a different time, and the residency
17 # appears to change (up or down) when the underlying profile hasn't
18 # really changed.
19 #
20 # However, please don't just ignore changes in residency.  If you see
21 # a change in one of these figures, please check whether it is real or
22 # not as follows:
23 #
24 #  * Run the test with old and new compilers, adding +RTS -h -i0.01
25 #    (you don't need to compile anything for profiling or enable profiling
26 #    libraries to get a heap profile).
27 #  * view the heap profiles, read off the maximum residency.  If it has
28 #    really changed, then you know there's an issue.
29
30 test('T1969',
31      [# expect_broken(12437),
32       compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
33           [(wordsize(32), 30, 15),
34              # 2010-05-17 14 (x86/Windows)
35              #            15 (x86/OS X)
36              #            19 (x86/OS X)
37              # 2013-02-10 13 (x86/Windows)
38              # 2013-02-10 14 (x86/OSX)
39              # 2013-11-13 17 (x86/Windows, 64bit machine)
40              # 2015-07-11 21 (x86/Linux, 64bit machine) use +RTS -G1
41              # 2016-04-06 30 (x86/Linux, 64bit machine)
42            (wordsize(64), 68, 20)]),
43              #            28 (amd64/Linux)
44              #            34 (amd64/Linux)
45              # 2012-09-20 23 (amd64/Linux)
46              # 2012-10-03 25 (amd64/Linux if .hi exists)
47              # 2013-02-13 23, but unstable so increased to 10% range
48              # 2013-02-13 27, very unstable!
49              # 2014-09-10 29 (amd64/Linux) post-AMP-cleanup
50              # 2013-09-11 30, 10 (amd64/Linux)
51              # 2013-09-11 30, 15 (adapt to Phab CI)
52              # 2015-06-03 41, (amd64/Linux) use +RTS -G1
53              # 2015-10-28 55, (amd64/Linux) emit Typeable at definition site
54              # 2016-10-20 68, (amd64/Linux) allow top-level string literals
55              #                See the comment 16 on #8472.
56       compiler_stats_num_field('max_bytes_used',
57           [(platform('i386-unknown-mingw32'), 5719436, 20),
58                                  # 2010-05-17 5717704 (x86/Windows)
59                                  # 2013-02-10 5159748 (x86/Windows)
60                                  # 2013-02-10 5030080 (x86/Windows)
61                                  # 2013-11-13 7295012 (x86/Windows, 64bit machine)
62                                  # 2014-04-24 5719436 (x86/Windows, 64bit machine)
63            (wordsize(32), 9093608, 1),
64              #            6707308 (x86/OS X)
65              # 2009-12-31 6149572 (x86/Linux)
66              # 2014-01-22 6429864 (x86/Linux)
67              # 2014-06-29 5949188 (x86/Linux)
68              # 2015-07-11 6241108 (x86/Linux, 64bit machine) use +RTS -G1
69              # 2016-04-06 9093608 (x86/Linux, 64bit machine)
70            (wordsize(64), 17285216, 15)]),
71              # 2014-09-10 10463640, 10  # post-AMP-update (somewhat stabelish)
72                # looks like the peak is around ~10M, but we're
73                # unlikely to GC exactly on the peak.
74                # varies quite a lot with CLEANUP and BINDIST,
75                # hence 10% range.
76                # See Note [residency] to get an accurate view.
77              # 2014-09-14  9684256, 10 # try to lower it a bit more to match Phab's CI
78              # 2014-11-03 10584344,    # ghcspeed reports higher numbers consistently
79              # 2015-07-11 11670120 (amd64/Linux)
80              # 2015-10-28 15017528 (amd64/Linux) emit typeable at definition site
81              # 2016-10-12 17285216 (amd64/Linux) it's not entirely clear why
82       compiler_stats_num_field('bytes allocated',
83           [(platform('i386-unknown-mingw32'), 301784492, 5),
84                                  #            215582916 (x86/Windows)
85                                  # 2012-10-29 298921816 (x86/Windows)
86                                  # 2013-02-10 310633884 (x86/Windows)
87                                  # 2013-11-13 317975916 (x86/Windows, 64bit machine)
88                                  # 2014-04-04 301784492 (x86/Windows, 64bit machine)
89            (wordsize(32), 344730660, 1),
90              #            221667908 (x86/OS X)
91              #            274932264 (x86/Linux)
92              # 2012-10-08 303930948 (x86/Linux, new codegen)
93              # 2013-02-10 322937684 (x86/OSX)
94              # 2014-01-22 316103268 (x86/Linux)
95              # 2014-06-29 303300692 (x86/Linux)
96              # 2015-07-11 288699104 (x86/Linux, 64-bit machine) use +RTS -G1
97              # 2016-04-06 344730660 (x86/Linux, 64-bit machine)
98            (wordsize(64), 756138176, 5)]),
99              # 17/11/2009 434845560 (amd64/Linux)
100              # 08/12/2009 459776680 (amd64/Linux)
101              # 17/05/2010 519377728 (amd64/Linux)
102              # 05/08/2011 561382568 (amd64/OS X)
103              # 16/07/2012 589168872 (amd64/Linux)
104              # 20/07/2012 595936240 (amd64/Linux)
105              # 23/08/2012 606230880 (amd64/Linux)
106              # 29/08/2012 633334184 (amd64/Linux) new codegen
107              # 18/09/2012 641959976 (amd64/Linux)
108              # 19/10/2012 661832592 (amd64/Linux) -fPIC turned on
109              # 23/10/2012 642594312 (amd64/Linux) -fPIC turned off again
110              # 12/11/2012 658786936 (amd64/Linux) UNKNOWN REASON
111              # 17/1/13:   667160192 (x86_64/Linux) new demand analyser
112              # 18/10/2013 698612512 (x86_64/Linux) fix for #8456
113              # 10/02/2014 660922376 (x86_64/Linux) call arity analysis
114              # 17/07/2014 651626680 (x86_64/Linux) roundabout update
115              # 10/09/2014 630299456 (x86_64/Linux) post-AMP-cleanup
116              # 03/06/2015 581460896 (x86_64/Linux) use +RTS -G1
117              # 28/10/2015 695430728 (x86_64/Linux) emit Typeable at definition site
118              # 28/10/2015 756138176 (x86_64/Linux) inst-decl defaults go via typechecker (#12220)
119       only_ways(['normal']),
120
121       extra_hc_opts('-dcore-lint -static'),
122           # Leave -dcore-lint on for this one test, so that we have something
123           # that will catch a regression in -dcore-lint performance.
124
125       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
126       extra_hc_opts('+RTS -G1 -RTS')
127       ],
128      compile,
129      [''])
130
131 # This one tests for the space leak in the native code generator,
132 # where it holds onto the entire asm output until the end.  The space
133 # leak reappears from time to time, so it's a good idea to have a test
134 # for it.  The residency of this test will jump by 10MB to 40MB or so
135 # on x86-64 if the space leak appears.
136
137 # Only run this one if we have an NCG:
138 if 'optasm' in config.compile_ways:
139    conf_3294 = only_ways(['normal'])
140 else:
141    conf_3294 = skip
142
143 test('T3294',
144      [
145       compiler_stats_num_field('max_bytes_used', # Note [residency]
146           [(wordsize(32), 28686588, 15),
147              #            17725476 (x86/OS X)
148              #            14593500 (Windows)
149              # 2013-02-10 20651576 (x86/Windows)
150              # 2013-02-10 20772984 (x86/OSX)
151              # 2013-11-13 24009436 (x86/Windows, 64bit machine)
152              # 2014-04-24 19882188 (x86/Windows, 64bit machine)
153              # 2014-12-22 26525384 (x86/Windows) Increase due to silent superclasses?
154              # 2015-07-11 43196344 (x86/Linux, 64-bit machine) use +RTS -G1
155              # 2016-04-06 28686588 (x86/Linux, 64-bit machine)
156
157            (wordsize(64), 52992688, 20)]),
158              # prev:           25753192 (amd64/Linux)
159              # 29/08/2012:     37724352 (amd64/Linux)
160              #  (increase due to new codegen, see #7198)
161              # 13/13/2012:     44894544 (amd64/Linux)
162              #  (reason for increase unknown)
163              # 15/5/2013:      36904752  (amd64/Linux)
164              #  (reason for decrease unknown)
165              # 29/5/2013:      43224080  (amd64/Linux)
166              #  (reason for increase back to earlier value unknown)
167              # 2014-07-14:     36670800  (amd64/Linux)
168              #  (reason unknown, setting expected value somewhere in between)
169              # 2015-01-22:     45000000  (amd64/Linux)
170              #  varies between 40959592 and 52914488... increasing to +-20%
171              # 2015-10-28:     50367248  (amd64/Linux)
172              #  D757: emit Typeable instances at site of type definition
173              # 2016-07-11:     54609256  (Windows) before fix for #12227
174              # 2016-07-11:     52992688  (Windows) after fix for #12227
175
176       compiler_stats_num_field('bytes allocated',
177           [(wordsize(32), 1377050640, 5),
178            # previous:     815479800  (x86/Linux)
179            # (^ increase due to new codegen, see #7198)
180            # 2012-10-08:  1373514844 (x86/Linux)
181            # 2013-11-13: 1478325844  (x86/Windows, 64bit machine)
182            # 2014-01-12: 1565185140  (x86/Linux)
183            # 2013-04-04: 1377050640  (x86/Windows, 64bit machine)
184            (wordsize(64), 2739731144, 5)]),
185             # old:        1357587088 (amd64/Linux)
186             # 29/08/2012: 2961778696 (amd64/Linux)
187             # (^ increase due to new codegen, see #7198)
188             # 18/09/2012: 2717327208 (amd64/Linux)
189             # 08/06/2013: 2901451552 (amd64/Linux) (reason unknown)
190             # 12/12/2013: 3083825616 (amd64/Linux) (reason unknown)
191             # 18/02/2014: 2897630040 (amd64/Linux) (call arity improvements)
192             # 12/03/2014: 2705289664 (amd64/Linux) (more call arity improvements)
193             # 2014-17-07: 2671595512 (amd64/Linux) (round-about update)
194             # 2014-09-10: 2709595808 (amd64/Linux) post-AMP cleanup
195             # 2016-07-11: 2664479936 (Windows) before fix for #12227
196             # 2016-07-11: 2739731144 (Windows) after fix for #12227 (ignoring)
197       conf_3294,
198
199       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
200       extra_hc_opts('+RTS -G1 -RTS')
201       ],
202      compile,
203      [''])
204
205 test('T4801',
206      [ # expect_broken(5224),
207        # temporarily unbroken (#5227)
208 ###################################
209 # deactivated for now, as this metric became too volatile recently
210 #      compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
211 #          [(platform('x86_64-apple-darwin'), 70, 1),
212 #                           # expected value: 58 (amd64/OS X)
213 #                           # 13/01/2014 - 70
214 #           (wordsize(32), 30, 20),
215 #           (wordsize(64), 48, 20)]),
216 #            # prev:       50 (amd64/Linux)
217 #            # 19/10/2012: 64 (amd64/Linux)
218 #            #                (^ REASON UNKNOWN!)
219 #            # 12/11/2012: 49 (amd64/Linux)
220 #            #                (^ REASON UNKNOWN!)
221 #            # 28/8/13:    60 (amd64/Linux)
222 #            #                (^ REASON UNKNOWN!)
223 #            # 2014-09-10: 55 post-AMP-cleanup
224 #            # 2014-10-08: 62 (jumps between 55 and 71 observed -- GC tipping point?)
225 #            # 2014-10-13: 48 stricter seqDmdType
226
227       compiler_stats_num_field('bytes allocated',
228           [(platform('x86_64-apple-darwin'), 465653312, 10),
229            # prev:       510938976 (amd64/OS X):
230            # 2015-12-11: 465653312 (amd64/OS X) Update, bump tolerance to +/-10%
231
232            (wordsize(32), 239556572, 10),
233            # prev:        185669232 (x86/OSX)
234            # 2014-01-22:  211198056 (x86/Linux)
235            # 2014-09-03:  185242032 (Windows laptop)
236            # 2014-12-01:  203962148 (Windows laptop)
237            # 2016-04-06:  239556572 (x86/Linux)
238            (wordsize(64), 388898280, 10)]),
239             # prev:       360243576 (amd64/Linux)
240             # 19/10/2012: 447190832 (amd64/Linux) (-fPIC turned on)
241             # 19/10/2012: 392409984 (amd64/Linux) (-fPIC turned off)
242             # 2014-04-08: 362939272 (amd64/Linux) cumulation of various smaller improvements over recent commits
243             # 2014-10-08: 382056344 (amd64/Linux) stricter foldr2 488e95b
244             # 2015-10-28: 434278248 (amd64/Linux) emit Typeable at definition site
245             # 2016-10-19: 388898280 (amd64/Linux) Refactor traceRn interface (#12617)
246
247 ###################################
248 # deactivated for now, as this metric became too volatile recently
249 #
250 #     compiler_stats_num_field('max_bytes_used',
251 #         [(platform('x86_64-apple-darwin'), 25145320, 5),
252 #          (wordsize(32), 11829000, 15),
253 #            #              9651948 (x86/OSX)
254 #            #              10290952 (windows)
255 #            # 2013-02-10   11071060 (x86/Windows)
256 #            # 2013-02-10:  11207828 (x86/OSX)
257 #            # (some date): 11139444
258 #            # 2013-11-13:  11829000 (x86/Windows, 64bit machine)
259 #          (wordsize(64), 19296544, 15)]),
260 #               # prev:       20486256 (amd64/OS X)
261 #               # 30/08/2012: 17305600--20391920 (varies a lot)
262 #               # 19/10/2012: 26882576 (-fPIC turned on)
263 #               # 19/10/2012: 18619912 (-fPIC turned off)
264 #               # 24/12/2012: 21657520 (perhaps gc sampling time wibbles?)
265 #               # 10/01/2014: 25166280
266 #               # 13/01/2014: 22646000 (mostly due to #8647)
267 #               # 18/02/2014: 25002136 (call arity analysis changes)
268 #               # 12/05/2014: 25002136 (specialisation and inlining changes)
269 #               # 10/09/2014: 19296544, 10 (post-AMP-cleanup)
270 #               # 14/09/2014: 19585456, 15 (adapt to Phab CI env)
271        only_ways(['normal']),
272        extra_hc_opts('-static'),
273
274        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
275        extra_hc_opts('+RTS -G1 -RTS')
276        ],
277      compile,
278      [''])
279
280 test('T3064',
281      [compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
282           [(wordsize(32), 28, 20),
283             # expected value: 14 (x86/Linux 28-06-2012):
284             # 2013-11-13:     18 (x86/Windows, 64bit machine)
285             # 2014-01-22:     23 (x86/Linux)
286             # 2014-12-22:     23 (x86/Linux) death to silent superclasses
287             # 2015-07-11      28 (x86/Linux, 64-bit machine) use +RTS -G1
288            (wordsize(64), 66, 20)]),
289             # (amd64/Linux):            18
290             # (amd64/Linux) 2012-02-07: 26
291             # (amd64/Linux) 2013-02-12: 23; increased range to 10%
292             # (amd64/Linux) 2013-04-03: 26
293             # (amd64/Linux) 2013-09-11: 30; result of AMP patch
294             # Increased range to 20%.  peak-usage varies from 22 to 26,
295             #  depending on whether the old .hi file exists
296             # (amd64/Linux) 2013-09-11: 37; better arity analysis (weird)
297             # (amd64/Linux) (09/09/2014): 42, AMP changes (larger interfaces, more loading)
298             # (amd64/Linux) 2014-10-13: 38: Stricter seqDmdType
299             # (amd64/Linux) 2014-12-22: 27: death to silent superclasses
300             # (amd64/Linux) 2015-01-22: 32: Varies from 30 to 34, at least here.
301             # (amd64/Linux) 2015-06-03: 54: use +RTS -G1
302             # (amd64/Linux) 2016-10-25: 66: Presumably creep
303
304       compiler_stats_num_field('bytes allocated',
305           [(wordsize(32), 153261024, 10),
306             # 2011-06-28: 56380288  (x86/Linux)
307             # 2012-10-30: 111189536 (x86/Windows)
308             # 2013-11-13: 146626504 (x86/Windows, 64bit machine)
309             # 2014-01-22: 162457940 (x86/Linux)
310             # 2014-12-01: 162457940 (Windows)
311             # 2014-12-22: 122836340 (Windows) Death to silent superclasses
312             # 2016-04-06: 153261024 (x86/Linux) probably wildcard refactor
313
314            (wordsize(64), 287460128, 5)]),
315             # (amd64/Linux) (28/06/2011):  73259544
316             # (amd64/Linux) (07/02/2013): 224798696
317             # (amd64/Linux) (02/08/2013): 236404384, increase from roles
318             # (amd64/Linux) (11/09/2013): 290165632, increase from AMP warnings
319             # (amd64/Linux) (22/11/2013): 308300448, GND via Coercible and counters for constraints solving
320             # (amd64/Linux) (02/12/2013): 329795912, Coercible refactor
321             # (amd64/Linux) (11/02/2014): 308422280, optimize Coercions in simpleOptExpr
322             # (amd64/Linux) (23/05/2014): 324022680, unknown cause
323             # (amd64/Linux) (2014-07-17): 332702112, general round of updates
324             # (amd64/Linux) (2014-08-29): 313638592, w/w for INLINABLE things
325             # (amd64/Linux) (09/09/2014): 407416464, AMP changes (larger interfaces, more loading)
326             # (amd64/Linux) (14/09/2014): 385145080, BPP changes (more NoImplicitPrelude in base)
327             # (amd64/Linux) (10/12/2014): 363103840, improvements in constraint solver
328             # (Mac)         (18/12/2014): 350418600, improvements to flattener
329             # (amd64/Linux) (22/12/2014): 243670824, Ha! Death to superclass constraints, makes
330             #                                        much less code for Monad instances
331             # (amd64/Linux) (01/12/2015): 264952256, Regression due to Simon's wildcard refactor
332             #                                        Tracked as #11151.
333             # (amd64/Linux) (11/12/2015): 304344936, Regression due to TypeInType
334             #                                        Tracked as #11196
335             # (amd64/Linux) (15/4/2016): 287460128   Improvement due to using coercionKind instead
336             #                                        of zonkTcType (Trac #11882)
337
338 ###################################
339 # deactivated for now, as this metric became too volatile recently
340 #
341 #      compiler_stats_num_field('max_bytes_used',
342 #          [(wordsize(32), 11202304, 20),
343 #            # 2011-06-28:  2247016 (x86/Linux) (28/6/2011):
344 #            #(some date):  5511604
345 #            # 2013-11-13:  7218200 (x86/Windows, 64bit machine)
346 #            # 2014-04-04: 11202304 (x86/Windows, 64bit machine)
347 #           (wordsize(64), 13251728, 20)]),
348 #            # (amd64/Linux, intree) (28/06/2011):  4032024
349 #            # (amd64/Linux, intree) (07/02/2013):  9819288
350 #            # (amd64/Linux)         (14/02/2013):  8687360
351 #            # (amd64/Linux)         (18/02/2013):  9397488
352 #            # (amd64/Linux)         (02/08/2013): 10742536, increase from roles
353 #            # (amd64/Linux)         (19/08/2013): 9211816,  decrease apparently from better eta reduction
354 #            # (amd64/Linux)         (11/09/2013): 12000480, increase from AMP warnings
355 #            #                                     933cdf15a2d85229d3df04b437da31fdfbf4961f
356 #            # (amd64/Linux)         (22/11/2013): 16266992, GND via Coercible and counters for constraints solving
357 #            # (amd64/Linux)         (12/12/2013): 19821544, better One shot analysis
358 #            # (amd64/Linux)         (09/09/2014): 24357392, AMP changes (larger interfaces, more loading)
359 #            # (amd64/Linux)         (14/09/2014): 16053888, BPP changes (more NoImplicitPrelude in base)
360 #            # (amd64/Linux)         (19/09/2014): 18744992, unknown
361 #            # (amd64/Linux)         2014-10-13:   13251728, Stricter seqDmdType
362
363        only_ways(['normal']),
364
365        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
366        extra_hc_opts('+RTS -G1 -RTS')
367       ],
368      compile,
369      [''])
370
371 test('T4007',
372      normal,
373      run_command,
374      ['$MAKE -s --no-print-directory T4007'])
375
376 test('T5030',
377      [compiler_stats_num_field('bytes allocated',
378           [(wordsize(32), 345668088, 10),
379            # previous:    196457520
380            # 2012-10-08:  259547660 (x86/Linux, new codegen)
381            # 2013-11-21:  198573456 (x86 Windows, 64 bit machine)
382            # 2014-12-10:  227205560 constraint solver got worse again; more aggressive solving
383            #                        of family-applications leads to less sharing, I think
384            # 2015-07-11:  201882912 reason unknown
385            # 2016-04-06:  345668088 likely TypeInType
386
387            (wordsize(64), 794426536, 10)]),
388              # Previously 530000000 (+/- 10%)
389              # 17/1/13:   602993184  (x86_64/Linux)
390              #            (new demand analyser)
391              # 2013-06-08 538467496  (x86_64/Linux)
392              # ^ reason unknown
393              # 2013-08-02 454498592  (amd64/Linux)
394              # decrease from more aggressive coercion optimisations from roles
395              # 2013-11-12 397672152  (amd64/Linux)
396              # big decrease following better CSE and arity
397              # 2014-07-17 409314320  (amd64/Linux)
398              # general round of updates
399              # 2014-09-10 385152728  post-AMP-cleanup
400              # 2014-12-08 340969128  constraint solver perf improvements (esp kick-out)
401              # 2014-12-10 449042120  constraint solver got worse again; more aggressive solving
402              #                          of family-applications leads to less sharing, I think
403              # 2015-03-17 403932600  tweak to solver algorithm
404              # 2015-12-11 653710960  TypeInType (see #11196)
405              # 2016-10-17 794426536  20% big increase following
406              #                       31621b12 * A collection of type-inference refactorings.
407              #                       See ticket for more info
408
409        only_ways(['normal'])
410       ],
411      compile,
412      ['-freduction-depth=300'])
413
414 test('T5631',
415      [compiler_stats_num_field('bytes allocated',
416           [(wordsize(32), 570137436, 10),
417         # expected value: 392904228 (x86/Linux)
418         # 2014-04-04:     346389856 (x86 Windows, 64 bit machine)
419         # 2014-12-01:     390199244 (Windows laptop)
420         # 2016-04-06:     570137436 (amd64/Linux) many reasons
421            (wordsize(64), 1077429456, 5)]),
422         # expected value: 774595008 (amd64/Linux):
423         # expected value: 735486328 (amd64/Linux) 2012/12/12:
424         # expected value: 690742040 (amd64/Linux) Call Arity improvements
425         # 2014-09-09:     739704712 (amd64/Linux) AMP changes
426         # 2014-11-04:     776121120 (amd64/Linux) new-flatten-skolems
427         # 2015-06-01:     812288344 (amd64/Linux) unknown cause
428         # 2015-12-11:     1128828928 (amd64/Linux) TypeInType (see #11196)
429         # 2015-12-21:     1198327544 (Mac) TypeApplications (will fix with #11196)
430         # 2015-03-18:     1124068664 (Mac) optimize Unify & zonking
431         # 2016-10-19:     1024926024 (amd64/Linux) Refactor traceRn interface (#12617)
432         # 2016-11-10:     1077429456 (amd64/Linux) Stop -dno-debug-output suppressing -ddump-tc-trace
433
434        only_ways(['normal'])
435       ],
436      compile,
437      [''])
438
439 test('parsing001',
440      [compiler_stats_num_field('bytes allocated',
441           [(wordsize(32), 274000576, 10),
442            (wordsize(64), 581551384, 5)]),
443         # expected value: 587079016 (amd64/Linux)
444         # 2016-09-01:     581551384 (amd64/Linux) Restore w/w limit (#11565)
445        only_ways(['normal']),
446       ],
447      compile_fail, [''])
448
449
450 test('T783',
451      [ only_ways(['normal']),  # no optimisation for this one
452       # expected value: 175,569,928 (x86/Linux)
453       compiler_stats_num_field('bytes allocated',
454           [(wordsize(32), 249332816, 5),
455             # 2012-10-08: 226907420 (x86/Linux)
456             # 2013-02-10: 329202116 (x86/Windows)
457             # 2013-02-10: 338465200 (x86/OSX)
458             # 2014-04-04: 319179104 (x86 Windows, 64 bit machine)
459             # 2014-09-03: 223377364 (Windows) better specialisation, raft of core-to-core optimisations
460             # 2014-12-22: 235002220 (Windows) not sure why
461             # 2016-04-06: 249332816 (x86/Linux, 64-bit machine)
462
463            (wordsize(64), 488592288, 10)]),
464             # prev:       349263216 (amd64/Linux)
465             # 07/08/2012: 384479856 (amd64/Linux)
466             # 29/08/2012: 436927840 (amd64/Linux)
467             # 12/11/2012: 640324528 (amd64/Linux)
468             #   (OldCmm removed: not sure why this got worse, the
469             #    other perf tests remained about the same)
470             # 18/10/2013: 734038080 (amd64/Linux)
471             #   (fix for #8456)
472             # 24/10/2013: 654804144 (amd64/Linux)
473             #   (fix previous fix for #8456)
474             # 2014-07-17: 640031840 (amd64/Linux)
475             #   (general round of updates)
476             # 2014-08-29: 441932632 (amd64/Linux)
477             #   (better specialisation, raft of core-to-core optimisations)
478             # 2014-08-29: 719814352 (amd64/Linux)
479             #   (changed order of cmm block causes analyses to allocate much more,
480             #      but the changed order is slighly better in terms of runtime, and
481             #      this test seems to be an extreme outlier.)
482             # 2015-05-16: 548288760 (amd64/Linux)
483             #   (improved sequenceBlocks in nativeCodeGen, #10422)
484             # 2015-08-07: 470738808 (amd64/Linux)
485             #   (simplifying the switch plan code path for simple checks, #10677)
486             # 2015-08-28: 526230456 (amd64/Linux)
487             #    (D757: Emit Typeable instances at site of type definition)
488             # 2015-12-04: 1134085384 (amd64/Linux)
489             #    (D1535: Major overhaul of pattern match checker, #11162)
490             # 2016-02-03: 488592288 (amd64/Linux)
491             #    (D1795: Another overhaul of pattern match checker, #11374)
492       extra_hc_opts('-static')
493       ],
494       compile,[''])
495
496 test('T5321Fun',
497      [ only_ways(['normal']),  # no optimisation for this one
498        compiler_stats_num_field('bytes allocated',
499            [(wordsize(32), 279922360, 10),
500              # prev:       300000000
501              # 2012-10-08: 344416344 x86/Linux
502              #  (increase due to new codegen)
503              # 2014-09-03: 299656164     (specialisation and inlining)
504              # 10/12/2014: 206406188     #  Improvements in constraint solver
505              # 2016-04-06: 279922360 x86/Linux
506             (wordsize(64), 525895608, 5)])
507              # prev:       585521080
508              # 29/08/2012: 713385808     #  (increase due to new codegen)
509              # 15/05/2013: 628341952     #  (reason for decrease unknown)
510              # 24/06/2013: 694019152     #  (reason for re-increase unknown)
511              # 12/05/2014: 614409344     #  (specialisation and inlining changes)
512              # 10/09/2014: 601629032     #  post-AMP-cleanup
513              # 06/11/2014: 541287000     #  Simon's flat-skol changes to the constraint solver
514              # 10/12/2014: 408110888     #  Improvements in constraint solver
515              # 16/12/2014: 429921312     #  Flattener parameterized over roles
516              # 10/08/2015: 509921312
517              #  (undefined now takes an implicit parameter and GHC -O0 does
518              #  not recognize that the application is bottom)
519              # 11/12/2015: 565883176     #  TypeInType (see #11196)
520              # 06/01/2017: 497356688     #  Small coercion optimisations
521                                          #  The actual decrease was only 2%; earlier
522                                          #    commits had drifted down
523              # 22/01/2017: 525895608     #  Allow top-level string literals in Core. I'm not
524                                          #    convinced that this patch is
525                                          #    responsible for all of this
526                                          #    change, however. Namely I am
527                                          #    quite skeptical of the downward
528                                          #    "drift" reported above
529       ],
530       compile,[''])
531
532 test('T5321FD',
533      [ only_ways(['normal']),  # no optimisation for this one
534       compiler_stats_num_field('bytes allocated',
535           [(wordsize(32), 250757460, 10),
536             # prev:       213380256
537             # 2012-10-08: 240302920 (x86/Linux)
538             #  (increase due to new codegen)
539             # 2014-07-31: 211699816 (Windows) (-11%)
540             #  (due to better optCoercion, 5e7406d9, #9233)
541             # 2016-04-06: 250757460 (x86/Linux)
542            (wordsize(64), 477840432, 10)])
543             # prev:       418306336
544             # 29/08/2012: 492905640
545             #  (increase due to new codegen)
546             # 15/05/2013: 406039584
547             #  (reason for decrease unknown)
548             # 08/06/2013: 476497048
549             #  (reason for increase unknown)
550             # before 2014-07-17: 441997096
551             #  (with -8%, still in range, hence cause not known)
552             # 2014-07-17: 426960992 (-11% of previous value)
553             #  (due to better optCoercion, 5e7406d9, #9233)
554             # 2014-10-08  410895536
555             #  (various changes; biggest improvements due to 949ad67 and FastString package ids)
556             # 2015-08-10: 470895536
557             #  (undefined now takes an implicit parameter and GHC -O0 does
558             #  not recognize that the application is bottom)
559             # 2015-10-28: 532365376
560             #  D757: emit Typeable instances at site of type definition
561             # 2016-07-16: 477840432
562             #  Optimize handling of built-in OccNames
563       ],
564       compile,[''])
565
566 test('T5642',
567      [ only_ways(['normal']),
568        normal,
569        compiler_stats_num_field('bytes allocated',
570            [(wordsize(32), 462677300, 10),
571                      # sample from x86/Linux
572             # prev:        650000000
573             # 2014-09-03:  753045568
574             # 2014-12-10:  641085256 Improvements in constraints solver
575             # 2016-04-06:  462677300
576
577             (wordsize(64),  838316496, 10)])
578             # prev:        1300000000
579             # 2014-07-17:  1358833928 (general round of updates)
580             # 2014-08-07:  1402242360 (caused by 1fc60ea)
581 # Watch out for:
582             # 23/05/2014:  1452688392 (More aggressive specialisation means we get
583             #                          specialised copies of imported functions that
584             #                          are ultimately discarded by trimAutoRules
585             #                          It's a bizarre program with LOTS of data types)
586             # 2014-09-10:  1536924976 post-AMP-cleanup
587             # 2014-12-10:  1282916024 Improvements in constraints solver
588             # 2015-10-28:  1412808976 Emit Typeable at definition site
589             # 2015-11-22:  1071915072 Use TypeLits in the metadata encoding
590             # 2016-02-08:   950004816 Pattern match checker re-rework
591             # 2016-05-12:  1300685592 Make Generic1 poly-kinded
592             # 2016-06-05:   916484672 Refactor derived Generic instances to reduce allocations
593             # 2016-09-03:   838316496 Derive the Generic instance in perf/compiler/T5642
594       ],
595       compile,['-O'])
596
597 test('T5837',
598      [ only_ways(['normal']),
599       compiler_stats_num_field('bytes allocated',
600           [(wordsize(32), 24199320, 10),
601              # 40000000 (x86/Linux)
602              # 2013-11-13:  45520936 (x86/Windows, 64bit machine)
603              # 2014-09-03:  37096484 (Windows laptop, w/w for INLINABLE things
604              # 2014-12-01: 135914136 (Windows laptop, regression see below)
605              # 2014-12-08: 115905208  Constraint solver perf improvements (esp kick-out)
606              # 2016-04-06: 24199320  (x86/Linux, 64-bit machine) TypeInType
607
608            (wordsize(64), 52597024, 10)])
609              # sample: 3926235424 (amd64/Linux, 15/2/2012)
610              # 2012-10-02 81879216
611              # 2012-09-20 87254264 amd64/Linux
612              # 2013-09-18 90587232 amd64/Linux
613              # 2013-11-21 86795752 amd64/Linux, GND via Coercible and counters
614              #                                  for constraints solving
615              # 2014-08-29 73639840 amd64/Linux, w/w for INLINABLE things
616              # 2014-10-08 73639840 amd64/Linux, Burning Bridges and other small changes
617              # 2014-11-06 271028976       Linux, Accept big regression;
618              #   See Note [An alternative story for the inert substitution] in TcFlatten
619              # 2014-12-08 234790312 Constraint solver perf improvements (esp kick-out)
620              # 2014-12-16 231155640 Mac  Flattener parameterized over roles;
621              #                           some optimization
622              # 2015-03-17 53424304  Mac  Better depth checking; fails earlier
623              # 2015-06-09 38834096  Better "improvement"; I'm not sure whey it improves things
624              # 2015-12-11 43877520  amd64/Linux, TypeInType (see #11196)
625              # 2016-03-18 48507272  Mac, accept small regression in exchange
626              #                           for other optimisations
627              # 2016-09-15 42445672  Linux; fixing #12422
628              # 2016-09-25 41832056  amd64/Linux, Rework handling of names (D2469)
629              # 2016-10-25 52597024  amd64/Linux, the test now passes (hooray), and so
630              #                          allocates more because it goes right down the
631              #                          compilation pipeline
632       ],
633       compile, ['-freduction-depth=50'])
634
635 test('T6048',
636      [ only_ways(['optasm']),
637       compiler_stats_num_field('bytes allocated',
638           [(wordsize(32), 55701280, 10),
639             # prev:       38000000 (x86/Linux)
640             # 2012-10-08: 48887164 (x86/Linux)
641             # 2014-04-04: 62618072 (x86 Windows, 64 bit machine)
642             # 2014-09-03: 56315812 (x86 Windows, w/w for INLINABLE)
643             # 2014-12-01: 49987836 (x86 Windows)
644             # 2016-04-06: 55701280 (x86/Linux, 64-bit machine)
645
646            (wordsize(64),  94327392, 10)])
647              # 18/09/2012  97247032 amd64/Linux
648              # 16/01/2014 108578664 amd64/Linux (unknown, likely foldl-via-foldr)
649              # 18/01/2014  95960720 amd64/Linux Call Arity improvements
650              # 28/02/2014 105556793 amd64/Linux (unknown, tweak in base/4d9e7c9e3 resulted in change)
651              # 05/03/2014 110646312 amd64/Linux Call Arity became more elaborate
652              # 14/07/2014 125431448 amd64/Linux unknown reason. Even worse in GHC-7.8.3. *shurg*
653              # 29/08/2014 108354472 amd64/Linux w/w for INLINABLE things
654              # 14/09/2014  88186056 amd64/Linux BPP part1 change (more NoImplicitPreludes in base)
655              # 08/01/2014  95946688 amd64/Linux Mostly 4c834fd. Occasional spikes to 103822120!
656              # 11/03/2016 108225624 amd64/Linux unknown reason sadly; likely gradual creep.
657              # 25/11/2016  94327392 amd64/Linux Back down again hooray; still not sure why
658       ],
659       compile,[''])
660
661 test('T9020',
662      [ only_ways(['optasm']),
663       compiler_stats_num_field('bytes allocated',
664           [(wordsize(32), 343005716, 10),
665            # Original:    381360728
666            # 2014-07-31:  343005716 (Windows) (general round of updates)
667            (wordsize(64), 698401736, 10)])
668            # prev:        795469104
669            # 2014-07-17:  728263536 (general round of updates)
670            # 2014-09-10:  785871680 post-AMP-cleanup
671            # 2014-11-03:  680162056 Further Applicative and Monad adjustments
672            # 2015-10-21:  786189008 Make stronglyConnCompFromEdgedVertices deterministic
673            # 2016-01-26:  698401736 improvement from using ExpTypes instead of ReturnTvs
674            # 2016-04-06:  852298336 Refactoring of CSE #11781
675            # 2016-04-06:  698401736 Use thenIO in Applicative IO
676       ],
677       compile,[''])
678
679 test('T9675',
680      [ only_ways(['optasm']),
681        compiler_stats_num_field('max_bytes_used', # Note [residency]
682           [(wordsize(64), 38776008, 15),
683           # 2014-10-13    29596552
684           # 2014-10-13    26570896   seq the DmdEnv in seqDmdType as well
685           # 2014-10-13    18582472   different machines giving different results..
686           # 2014-10-13    22220552   use the mean
687           # 2015-06-21    28056344   switch to `+RTS -G1`, tighten bound to 15%
688           # 2015-10-28    23776640   emit Typeable at definition site
689           # 2015-12-11    30837312   TypeInType (see #11196)
690           # 2016-04-14    38776008   Final demand analyzer run
691            (wordsize(32), 18043224, 15)
692           # 2015-07-11    15341228   (x86/Linux, 64-bit machine) use +RTS -G1
693           # 2016-04-06    18043224   (x86/Linux, 64-bit machine)
694           ]),
695        compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
696           [(wordsize(64), 121, 15),
697           # 2014-10-13    66
698           # 2014-10-13    58         seq the DmdEnv in seqDmdType as well
699           # 2014-10-13    49         different machines giving different results...
700           # 2014-10-13    53         use the mean
701           # 2015-06-15    44         reduced for some reason
702           # 2015-06-21    105        switch to `+RTS -G1`
703           # 2015-12-04    88         new pattern checker (D1535)
704           # 2015-12-11    113        TypeInType (see #11196)
705           # 2016-04-14    144        Final demand analyzer run
706           # 2016-07-26    121        Unboxed sums?
707             (wordsize(32), 56, 15)
708           # 2015-07-11    56         (x86/Linux, 64-bit machine) use +RTS -G1
709           ]),
710        compiler_stats_num_field('bytes allocated',
711           [(wordsize(64), 608284152, 10)
712           # 2014-10-13    544489040
713           # 2015-10-28    608284152  emit Typeable at definition site
714           ,(wordsize(32), 279480696, 10)
715           # 2015-07-11    279480696  (x86/Linux, 64-bit machine) use +RTS -G1
716           ]),
717
718        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
719        extra_hc_opts('+RTS -G1 -RTS')
720       ],
721      compile,
722      [''])
723
724 test('T9872a',
725      [ only_ways(['normal']),
726        compiler_stats_num_field('bytes allocated',
727           [(wordsize(64), 3134866040    , 5),
728           # 2014-12-10    5521332656    Initally created
729           # 2014-12-16    5848657456    Flattener parameterized over roles
730           # 2014-12-18    2680733672    Reduce type families even more eagerly
731           # 2015-12-11    3581500440    TypeInType (see #11196)
732           # 2016-04-07    3352882080    CSE improvements
733           # 2016-10-19    3134866040    Refactor traceRn interface (#12617)
734            (wordsize(32), 1740903516, 5)
735           # was           1325592896
736           # 2016-04-06    1740903516    x86/Linux
737           ]),
738       ],
739      compile_fail,
740      [''])
741
742 test('T9872b',
743      [ only_ways(['normal']),
744        compiler_stats_num_field('bytes allocated',
745           [(wordsize(64), 4069522928, 5),
746           # 2014-12-10    6483306280    Initally created
747           # 2014-12-16    6892251912    Flattener parameterized over roles
748           # 2014-12-18    3480212048    Reduce type families even more eagerly
749           # 2015-12-11    5199926080    TypeInType (see #11196)
750           # 2016-02-08    4918990352    Improved a bit by tyConRolesRepresentational
751           # 2016-04-06:   4600233488    Refactoring of CSE #11781
752           # 2016-09-15:   4069522928    Fix #12422
753            (wordsize(32), 2422750696, 5)
754           # was           1700000000
755           # 2016-04-06    2422750696    x86/Linux
756           ]),
757       ],
758      compile_fail,
759      [''])
760 test('T9872c',
761      [ only_ways(['normal']),
762        compiler_stats_num_field('bytes allocated',
763           [(wordsize(64), 3702580928, 5),
764           # 2014-12-10    5495850096    Initally created
765           # 2014-12-16    5842024784    Flattener parameterized over roles
766           # 2014-12-18    2963554096    Reduce type families even more eagerly
767           # 2015-12-11    4723613784    TypeInType (see #11196)
768           # 2016-02-08    4454071184    Improved a bit by tyConRolesRepresentational
769           # 2016-04-06:   4306667256    Refactoring of CSE #11781
770           # 2016-09-15:   3702580928    Fixing #12422
771            (wordsize(32), 2257242896, 5)
772           # was           1500000000
773           # 2016-04-06    2257242896
774           ]),
775       ],
776      compile_fail,
777      [''])
778 test('T9872d',
779      [ only_ways(['normal']),
780        compiler_stats_num_field('bytes allocated',
781           [(wordsize(64), 478169352, 5),
782           # 2014-12-18    796071864   Initally created
783           # 2014-12-18    739189056   Reduce type families even more eagerly
784           # 2015-01-07    687562440   TrieMap leaf compression
785           # 2015-03-17    726679784   tweak to solver; probably flattens more
786           # 2015-12-11    566134504   TypeInType; see #11196
787           # 2016-02-08    534693648   Improved a bit by tyConRolesRepresentational
788           # 2016-03-18    506691240   optimize Unify & zonking
789           # 2016-12-05    478169352   using tyConIsTyFamFree, I think, but only
790           #                           a 1% improvement 482 -> 478
791            (wordsize(32), 264566040, 5)
792           # some date     328810212
793           # 2015-07-11    350369584
794           # 2016-04-06    264566040   x86/Linux
795           ]),
796       ],
797      compile,
798      [''])
799
800 test('T9961',
801      [ only_ways(['normal']),
802        compiler_stats_num_field('bytes allocated',
803           [(wordsize(64), 537297968, 5),
804           # 2015-01-12    807117816   Initally created
805           # 2015-spring   772510192   Got better
806           # 2015-05-22    663978160   Fix for #10370 improves it more
807           # 2015-10-28    708680480   x86_64/Linux   Emit Typeable at definition site
808           # 2015-12-17    745044392   x86_64/Darwin  Creep upwards
809           # 2016-03-20    519436672   x64_64/Linux   Don't use build desugaring for large lists (#11707)
810           # 2016-03-24    568526784   x64_64/Linux   Add eqInt* variants (#11688)
811           # 2016-09-01    537297968   x64_64/Linux   Restore w/w limit (#11565)
812            (wordsize(32), 275264188, 5)
813           # was           375647160
814           # 2016-04-06    275264188   x86/Linux
815           ]),
816       ],
817      compile,
818      ['-O'])
819
820 test('T9233',
821     [ only_ways(['normal']),
822       compiler_stats_num_field('bytes allocated',
823         [(wordsize(64), 861862608, 5),
824
825          # 2015-08-04    999826288     initial value
826          # 2016-04-14   1066246248     Final demand analyzer run
827          # 2016-06-18    984268712     shuffling around of Data.Functor.Identity
828          # 2017-0123     861862608     worker/wrapper evald-ness flags; 10% improvement!
829
830          (wordsize(32),  515672240, 5)   # Put in your value here if you hit this
831          # 2016-04-06    515672240     (x86/Linux) initial value
832         ]),
833       extra_clean(['T9233a.hi', 'T9233a.o'])
834     ],
835     multimod_compile,
836     ['T9233', '-v0 -O2 -fno-spec-constr'])
837
838 test('T10370',
839      [ only_ways(['optasm']),
840        compiler_stats_num_field('max_bytes_used', # Note [residency]
841           [(wordsize(64), 38221184, 15),
842           # 2015-10-22    19548720
843           # 2016-02-24    22823976   Changing Levity to RuntimeRep; not sure why this regresses though, even after some analysis
844           # 2016-04-14    28256896   final demand analyzer run
845           # 2016-08-08    33049304
846           #     This change happened because we changed the behavior
847           #     of inlining across hs-boot files, so that we don't
848           #     inline if something comes from a boot file.  This
849           #     affected stats on bootstrapped GHC.  However,
850           #     when I set -i0.01 with profiling, the heap profiles
851           #     were identical, so I think it's just GC noise.
852           # 2016-10-20    38221184   Allow top-level string literals.
853           #                          See the comment 16 on #8472.
854            (wordsize(32), 11371496, 15),
855           # 2015-10-22    11371496
856           ]),
857        compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
858           [(wordsize(64), 146, 15),
859           # 2015-10-22     76
860           # 2016-04-14    101 final demand analyzer run
861           # 2016-08-08    121 see above
862           # 2017-01-18    146 Allow top-level string literals in Core
863            (wordsize(32),  39, 15),
864           # 2015-10-22     39
865           ]),
866        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
867        extra_hc_opts('+RTS -G1 -RTS')
868      ],
869      compile,
870      [''])
871
872 test('T10547',
873      [ compiler_stats_num_field('bytes allocated',
874           [(wordsize(64), 31041520, 20),
875           # initial:    39165544
876           # 25/11/2106: 31041520 Linux   Around the time of refactoring the constraint solver;
877           #                              but I think that only pushed it over the edge
878           ]),
879      ],
880      compile_fail,
881      ['-fprint-expanded-synonyms'])
882
883 test('T12227',
884      [ only_ways(['normal']),
885        compiler_stats_num_field('bytes allocated',
886           [(wordsize(64), 1715827784, 5),
887           # 2016-07-11    5650186880 (Windows) before fix for #12227
888           # 2016-07-11    1822822016 (Windows) after fix for #12227
889           # 2016-12-20    1715827784 after d250d493 (INLINE in Traversable dms)
890           #                          (or thereabouts in the commit history)
891           ]),
892      ],
893      compile,
894      # Use `-M1G` to prevent memory thrashing with ghc-8.0.1.
895      ['-O2 -ddump-hi -ddump-to-file +RTS -M1G'])
896
897 test('T12425',
898      [ only_ways(['optasm']),
899        compiler_stats_num_field('bytes allocated',
900           [(wordsize(64), 133380960, 5),
901           # initial:    125831400
902           # 2017-01-18: 133380960  Allow top-level string literals in Core
903           ]),
904      ],
905      compile,
906      [''])
907
908 test('T12234',
909      [ only_ways(['optasm']),
910        compiler_stats_num_field('bytes allocated',
911           [(platform('x86_64-unknown-mingw32'), 77949232, 5),
912           # initial:      77949232
913            (wordsize(64), 76848856, 5),
914           # initial:      72958288
915           # 2016-01-17:   76848856  (x86-64, Linux. drift?)
916           ]),
917      ],
918      compile,
919      [''])
920
921 test('T13035',
922      [ only_ways(['normal']),
923        compiler_stats_num_field('bytes allocated',
924           [(wordsize(64), 95269000, 5),
925           # 2017-01-05   90595208 initial
926           # 2017-01-19   95269000 Allow top-level string literals in Core
927           ]),
928      ],
929      compile,
930      [''] )
931
932 test('T13056',
933      [ only_ways(['optasm']),
934        compiler_stats_num_field('bytes allocated',
935          [(wordsize(64), 520166912, 5),
936          # 2017-01-06    520166912 initial
937          ]),
938      ],
939      compile,
940      ['-O1'])
941
942 test('T12707',
943      [ compiler_stats_num_field('bytes allocated',
944           [(wordsize(64), 1348865648, 5),
945           # initial:    1271577192
946           # 2017-01-22: 1348865648  Allow top-level strings in Core
947           ]),
948      ],
949      compile,
950      [''])