affc2671a861b3fc9ec517934c18583a91fe1bcd
[ghc.git] / testsuite / tests / perf / compiler / all.T
1 # Tests that call 'compiler_stats_num_field' are skipped when debugging is on.
2 # See testsuite/driver/testlib.py.
3
4 def no_lint(name, opts):
5    opts.compiler_always_flags = \
6        [opt for opt in opts.compiler_always_flags if opt != '-dcore-lint' and opt != '-dcmm-lint']
7
8 setTestOpts(no_lint)
9
10
11 # Note [residency]
12 #
13 # Residency (peak_megabytes_allocated and max_bytes_used) is sensitive
14 # to when the major GC runs, which makes it inherently inaccurate.
15 # Sometime an innocuous change somewhere can shift things around such
16 # that the samples occur at a different time, and the residency
17 # appears to change (up or down) when the underlying profile hasn't
18 # really changed.
19 #
20 # However, please don't just ignore changes in residency.  If you see
21 # a change in one of these figures, please check whether it is real or
22 # not as follows:
23 #
24 #  * Run the test with old and new compilers, adding +RTS -h -i0.01
25 #    (you don't need to compile anything for profiling or enable profiling
26 #    libraries to get a heap profile).
27 #  * view the heap profiles, read off the maximum residency.  If it has
28 #    really changed, then you know there's an issue.
29
30 test('T1969',
31      [compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
32           [(wordsize(32), 21, 15),
33              # 2010-05-17 14 (x86/Windows)
34              #            15 (x86/OS X)
35              #            19 (x86/OS X)
36              # 2013-02-10 13 (x86/Windows)
37              # 2013-02-10 14 (x86/OSX)
38              # 2013-11-13 17 (x86/Windows, 64bit machine)
39              # 2015-07-11 21 (x86/Linux, 64bit machine) use +RTS -G1
40            (wordsize(64), 41, 20)]),
41              #            28 (amd64/Linux)
42              #            34 (amd64/Linux)
43              # 2012-09-20 23 (amd64/Linux)
44              # 2012-10-03 25 (amd64/Linux if .hi exists)
45              # 2013-02-13 23, but unstable so increased to 10% range
46              # 2013-02-13 27, very unstable!
47              # 2014-09-10 29 (amd64/Linux) post-AMP-cleanup
48              # 2013-09-11 30, 10 (amd64/Linux)
49              # 2013-09-11 30, 15 (adapt to Phab CI)
50              # 2015-06-03 41, (amd64/Linux) use +RTS -G1
51       compiler_stats_num_field('max_bytes_used',
52           [(platform('i386-unknown-mingw32'), 5719436, 20),
53                                  # 2010-05-17 5717704 (x86/Windows)
54                                  # 2013-02-10 5159748 (x86/Windows)
55                                  # 2013-02-10 5030080 (x86/Windows)
56                                  # 2013-11-13 7295012 (x86/Windows, 64bit machine)
57                                  # 2014-04-24 5719436 (x86/Windows, 64bit machine)
58            (wordsize(32), 6241108, 1),
59              #            6707308 (x86/OS X)
60              # 2009-12-31 6149572 (x86/Linux)
61              # 2014-01-22 6429864 (x86/Linux)
62              # 2014-06-29 5949188 (x86/Linux)
63              # 2015-07-11 6241108 (x86/Linux, 64bit machine) use +RTS -G1
64            (wordsize(64), 11000000, 15)]),
65              # 2014-09-10 10463640, 10  # post-AMP-update (somewhat stabelish)
66                # looks like the peak is around ~10M, but we're
67                # unlikely to GC exactly on the peak.
68                # varies quite a lot with CLEANUP and BINDIST,
69                # hence 10% range.
70                # See Note [residency] to get an accurate view.
71              # 2014-09-14  9684256, 10 # try to lower it a bit more to match Phab's CI
72              # 2014-11-03 10584344,    # ghcspeed reports higher numbers consistently
73              # 2015-07-11 11670120 (amd64/Linux)
74       compiler_stats_num_field('bytes allocated',
75           [(platform('i386-unknown-mingw32'), 301784492, 5),
76                                  #            215582916 (x86/Windows)
77                                  # 2012-10-29 298921816 (x86/Windows)
78                                  # 2013-02-10 310633884 (x86/Windows)
79                                  # 2013-11-13 317975916 (x86/Windows, 64bit machine)
80                                  # 2014-04-04 301784492 (x86/Windows, 64bit machine)
81            (wordsize(32), 288699104, 1),
82              #            221667908 (x86/OS X)
83              #            274932264 (x86/Linux)
84              # 2012-10-08 303930948 (x86/Linux, new codegen)
85              # 2013-02-10 322937684 (x86/OSX)
86              # 2014-01-22 316103268 (x86/Linux)
87              # 2014-06-29 303300692 (x86/Linux)
88              # 2015-07-11 288699104 (x86/Linux, 64-bit machine) use +RTS -G1
89            (wordsize(64), 581460896, 5)]),
90              # 17/11/2009 434845560 (amd64/Linux)
91              # 08/12/2009 459776680 (amd64/Linux)
92              # 17/05/2010 519377728 (amd64/Linux)
93              # 05/08/2011 561382568 (amd64/OS X)
94              # 16/07/2012 589168872 (amd64/Linux)
95              # 20/07/2012 595936240 (amd64/Linux)
96              # 23/08/2012 606230880 (amd64/Linux)
97              # 29/08/2012 633334184 (amd64/Linux) new codegen
98              # 18/09/2012 641959976 (amd64/Linux)
99              # 19/10/2012 661832592 (amd64/Linux) -fPIC turned on
100              # 23/10/2012 642594312 (amd64/Linux) -fPIC turned off again
101              # 12/11/2012 658786936 (amd64/Linux) UNKNOWN REASON
102              # 17/1/13:   667160192 (x86_64/Linux) new demand analyser
103              # 18/10/2013 698612512 (x86_64/Linux) fix for #8456
104              # 10/02/2014 660922376 (x86_64/Linux) call arity analysis
105              # 17/07/2014 651626680 (x86_64/Linux) roundabout update
106              # 10/09/2014 630299456 (x86_64/Linux) post-AMP-cleanup
107              # 03/06/2015 581460896 (x86_64/Linux) use +RTS -G1
108       only_ways(['normal']),
109
110       extra_hc_opts('-dcore-lint -static'),
111           # Leave -dcore-lint on for this one test, so that we have something
112           # that will catch a regression in -dcore-lint performance.
113
114       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
115       extra_hc_opts('+RTS -G1 -RTS')
116       ],
117      compile,
118      [''])
119
120 # This one tests for the space leak in the native code generator,
121 # where it holds onto the entire asm output until the end.  The space
122 # leak reappears from time to time, so it's a good idea to have a test
123 # for it.  The residency of this test will jump by 10MB to 40MB or so
124 # on x86-64 if the space leak appears.
125
126 # Only run this one if we have an NCG:
127 if 'optasm' in config.compile_ways:
128    conf_3294 = only_ways(['normal'])
129 else:
130    conf_3294 = skip
131
132 test('T3294',
133      [
134       compiler_stats_num_field('max_bytes_used', # Note [residency]
135           [(wordsize(32), 43196344, 15),
136              #            17725476 (x86/OS X)
137              #            14593500 (Windows)
138              # 2013-02-10 20651576 (x86/Windows)
139              # 2013-02-10 20772984 (x86/OSX)
140              # 2013-11-13 24009436 (x86/Windows, 64bit machine)
141              # 2014-04-24 19882188 (x86/Windows, 64bit machine)
142              # 2014-12-22 26525384 (x86/Windows) Increase due to silent superclasses?
143              # 2015-07-11 43196344 (x86/Linux, 64-bit machine) use +RTS -G1
144
145            (wordsize(64), 45000000, 20)]),
146              # prev:           25753192 (amd64/Linux)
147              # 29/08/2012:     37724352 (amd64/Linux)
148              #  (increase due to new codegen, see #7198)
149              # 13/13/2012:     44894544 (amd64/Linux)
150              #  (reason for increase unknown)
151              # 15/5/2013:      36904752  (amd64/Linux)
152              #  (reason for decrease unknown)
153              # 29/5/2013:      43224080  (amd64/Linux)
154              #  (reason for increase back to earlier value unknown)
155              # 2014-07-14:     36670800  (amd64/Linux)
156              #  (reason unknown, setting expected value somewhere in between)
157              # 2015-01-22:     45000000  (amd64/Linux)
158              #  varies between 40959592 and 52914488... increasing to +-20%
159
160       compiler_stats_num_field('bytes allocated',
161           [(wordsize(32), 1377050640, 5),
162            # previous:     815479800  (x86/Linux)
163            # (^ increase due to new codegen, see #7198)
164            # 2012-10-08:  1373514844 (x86/Linux)
165            # 2013-11-13: 1478325844  (x86/Windows, 64bit machine)
166            # 2014-01-12: 1565185140  (x86/Linux)
167            # 2013-04-04: 1377050640  (x86/Windows, 64bit machine)
168            (wordsize(64), 2709595808, 5)]),
169             # old:        1357587088 (amd64/Linux)
170             # 29/08/2012: 2961778696 (amd64/Linux)
171             # (^ increase due to new codegen, see #7198)
172             # 18/09/2012: 2717327208 (amd64/Linux)
173             # 08/06/2013: 2901451552 (amd64/Linux) (reason unknown)
174             # 12/12/2013: 3083825616 (amd64/Linux) (reason unknown)
175             # 18/02/2014: 2897630040 (amd64/Linux) (call arity improvements)
176             # 12/03/2014: 2705289664 (amd64/Linux) (more call arity improvements)
177             # 2014-17-07: 2671595512 (amd64/Linux) (round-about update)
178             # 2014-09-10: 2709595808 (amd64/Linux) post-AMP cleanup
179       conf_3294,
180
181       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
182       extra_hc_opts('+RTS -G1 -RTS')
183       ],
184      compile,
185      [''])
186
187 test('T4801',
188      [ # expect_broken(5224),
189        # temporarily unbroken (#5227)
190 ###################################
191 # deactivated for now, as this metric became too volatile recently
192 #      compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
193 #          [(platform('x86_64-apple-darwin'), 70, 1),
194 #                           # expected value: 58 (amd64/OS X)
195 #                           # 13/01/2014 - 70
196 #           (wordsize(32), 30, 20),
197 #           (wordsize(64), 48, 20)]),
198 #            # prev:       50 (amd64/Linux)
199 #            # 19/10/2012: 64 (amd64/Linux)
200 #            #                (^ REASON UNKNOWN!)
201 #            # 12/11/2012: 49 (amd64/Linux)
202 #            #                (^ REASON UNKNOWN!)
203 #            # 28/8/13:    60 (amd64/Linux)
204 #            #                (^ REASON UNKNOWN!)
205 #            # 2014-09-10: 55 post-AMP-cleanup
206 #            # 2014-10-08: 62 (jumps between 55 and 71 observed -- GC tipping point?)
207 #            # 2014-10-13: 48 stricter seqDmdType
208
209       compiler_stats_num_field('bytes allocated',
210           [(platform('x86_64-apple-darwin'), 434058304, 5),
211                            # expected value: 510938976 (amd64/OS X):
212
213            (wordsize(32), 203962148, 10),
214            # prev:        185669232 (x86/OSX)
215            # 2014-01-22:  211198056 (x86/Linux)
216            # 2014-09-03:  185242032 (Windows laptop)
217            # 2014-12-01:  203962148 (Windows laptop)
218            (wordsize(64), 382056344, 10)]),
219             # prev:       360243576 (amd64/Linux)
220             # 19/10/2012: 447190832 (amd64/Linux) (-fPIC turned on)
221             # 19/10/2012: 392409984 (amd64/Linux) (-fPIC turned off)
222             # 2014-04-08: 362939272 (amd64/Linux) cumulation of various smaller improvements over recent commits
223             # 2014-10-08: 382056344 (amd64/Linux) stricter foldr2 488e95b
224
225 ###################################
226 # deactivated for now, as this metric became too volatile recently
227 #
228 #     compiler_stats_num_field('max_bytes_used',
229 #         [(platform('x86_64-apple-darwin'), 25145320, 5),
230 #          (wordsize(32), 11829000, 15),
231 #            #              9651948 (x86/OSX)
232 #            #              10290952 (windows)
233 #            # 2013-02-10   11071060 (x86/Windows)
234 #            # 2013-02-10:  11207828 (x86/OSX)
235 #            # (some date): 11139444
236 #            # 2013-11-13:  11829000 (x86/Windows, 64bit machine)
237 #          (wordsize(64), 19296544, 15)]),
238 #               # prev:       20486256 (amd64/OS X)
239 #               # 30/08/2012: 17305600--20391920 (varies a lot)
240 #               # 19/10/2012: 26882576 (-fPIC turned on)
241 #               # 19/10/2012: 18619912 (-fPIC turned off)
242 #               # 24/12/2012: 21657520 (perhaps gc sampling time wibbles?)
243 #               # 10/01/2014: 25166280
244 #               # 13/01/2014: 22646000 (mostly due to #8647)
245 #               # 18/02/2014: 25002136 (call arity analysis changes)
246 #               # 12/05/2014: 25002136 (specialisation and inlining changes)
247 #               # 10/09/2014: 19296544, 10 (post-AMP-cleanup)
248 #               # 14/09/2014: 19585456, 15 (adapt to Phab CI env)
249        only_ways(['normal']),
250        extra_hc_opts('-static'),
251
252        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
253        extra_hc_opts('+RTS -G1 -RTS')
254        ],
255      compile,
256      [''])
257
258 test('T3064',
259      [compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
260           [(wordsize(32), 28, 20),
261             # expected value: 14 (x86/Linux 28-06-2012):
262             # 2013-11-13:     18 (x86/Windows, 64bit machine)
263             # 2014-01-22:     23 (x86/Linux)
264             # 2014-12-22:     23 (x86/Linux) death to silent superclasses
265             # 2015-07-11      28 (x86/Linux, 64-bit machine) use +RTS -G1
266            (wordsize(64), 54, 20)]),
267             # (amd64/Linux):            18
268             # (amd64/Linux) 2012-02-07: 26
269             # (amd64/Linux) 2013-02-12: 23; increased range to 10%
270             # (amd64/Linux) 2013-04-03: 26
271             # (amd64/Linux) 2013-09-11: 30; result of AMP patch
272             # Increased range to 20%.  peak-usage varies from 22 to 26,
273             #  depending on whether the old .hi file exists
274             # (amd64/Linux) 2013-09-11: 37; better arity analysis (weird)
275             # (amd64/Linux) (09/09/2014): 42, AMP changes (larger interfaces, more loading)
276             # (amd64/Linux) 2014-10-13: 38: Stricter seqDmdType
277             # (amd64/Linux) 2014-12-22: 27: death to silent superclasses
278             # (amd64/Linux) 2015-01-22: 32: Varies from 30 to 34, at least here.
279             # (amd64/Linux) 2015-06-03: 54: use +RTS -G1
280
281       compiler_stats_num_field('bytes allocated',
282           [(wordsize(32), 122836340, 10),
283             # 2011-06-28: 56380288  (x86/Linux)
284             # 2012-10-30: 111189536 (x86/Windows)
285             # 2013-11-13: 146626504 (x86/Windows, 64bit machine)
286             # 2014-01-22: 162457940 (x86/Linux)
287             # 2014-12-01: 162457940 (Windows)
288             # 2014-12-22: 122836340 (Windows) Death to silent superclasses
289
290            (wordsize(64), 243670824, 5)]),
291             # (amd64/Linux) (28/06/2011):  73259544
292             # (amd64/Linux) (07/02/2013): 224798696
293             # (amd64/Linux) (02/08/2013): 236404384, increase from roles
294             # (amd64/Linux) (11/09/2013): 290165632, increase from AMP warnings
295             # (amd64/Linux) (22/11/2013): 308300448, GND via Coercible and counters for constraints solving
296             # (amd64/Linux) (02/12/2013): 329795912, Coercible refactor
297             # (amd64/Linux) (11/02/2014): 308422280, optimize Coercions in simpleOptExpr
298             # (amd64/Linux) (23/05/2014): 324022680, unknown cause
299             # (amd64/Linux) (2014-07-17): 332702112, general round of updates
300             # (amd64/Linux) (2014-08-29): 313638592, w/w for INLINABLE things
301             # (amd64/Linux) (09/09/2014): 407416464, AMP changes (larger interfaces, more loading)
302             # (amd64/Linux) (14/09/2014): 385145080, BPP changes (more NoImplicitPrelude in base)
303             # (amd64/Linux) (10/12/2014): 363103840, improvements in constraint solver
304             # (Mac)         (18/12/2014): 350418600, improvements to flattener
305             # (amd64/Linux) (22/12/2014): 243670824, Ha! Death to superclass constraints, makes
306             #                                        much less code for Monad instances
307
308 ###################################
309 # deactivated for now, as this metric became too volatile recently
310 #
311 #      compiler_stats_num_field('max_bytes_used',
312 #          [(wordsize(32), 11202304, 20),
313 #            # 2011-06-28:  2247016 (x86/Linux) (28/6/2011):
314 #            #(some date):  5511604
315 #            # 2013-11-13:  7218200 (x86/Windows, 64bit machine)
316 #            # 2014-04-04: 11202304 (x86/Windows, 64bit machine)
317 #           (wordsize(64), 13251728, 20)]),
318 #            # (amd64/Linux, intree) (28/06/2011):  4032024
319 #            # (amd64/Linux, intree) (07/02/2013):  9819288
320 #            # (amd64/Linux)         (14/02/2013):  8687360
321 #            # (amd64/Linux)         (18/02/2013):  9397488
322 #            # (amd64/Linux)         (02/08/2013): 10742536, increase from roles
323 #            # (amd64/Linux)         (19/08/2013): 9211816,  decrease apparently from better eta reduction
324 #            # (amd64/Linux)         (11/09/2013): 12000480, increase from AMP warnings
325 #            #                                     933cdf15a2d85229d3df04b437da31fdfbf4961f
326 #            # (amd64/Linux)         (22/11/2013): 16266992, GND via Coercible and counters for constraints solving
327 #            # (amd64/Linux)         (12/12/2013): 19821544, better One shot analysis
328 #            # (amd64/Linux)         (09/09/2014): 24357392, AMP changes (larger interfaces, more loading)
329 #            # (amd64/Linux)         (14/09/2014): 16053888, BPP changes (more NoImplicitPrelude in base)
330 #            # (amd64/Linux)         (19/09/2014): 18744992, unknown
331 #            # (amd64/Linux)         2014-10-13:   13251728, Stricter seqDmdType
332
333        only_ways(['normal']),
334
335        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
336        extra_hc_opts('+RTS -G1 -RTS')
337       ],
338      compile,
339      [''])
340
341 test('T4007',
342      normal,
343      run_command,
344      ['$MAKE -s --no-print-directory T4007'])
345
346 test('T5030',
347      [compiler_stats_num_field('bytes allocated',
348           [(wordsize(32), 201882912, 10),
349            # previous:    196457520
350            # 2012-10-08:  259547660 (x86/Linux, new codegen)
351            # 2013-11-21:  198573456 (x86 Windows, 64 bit machine)
352            # 2014-12-10:  227205560 constraint solver got worse again; more aggressive solving
353            #                        of family-applications leads to less sharing, I think
354            # 2015-07-11:  201882912 reason unknown
355
356            (wordsize(64), 403932600, 10)]),
357              # Previously 530000000 (+/- 10%)
358              # 17/1/13:   602993184  (x86_64/Linux)
359              #            (new demand analyser)
360              # 2013-06-08 538467496  (x86_64/Linux)
361              # ^ reason unknown
362              # 2013-08-02 454498592  (amd64/Linux)
363              # decrease from more aggressive coercion optimisations from roles
364              # 2013-11-12 397672152  (amd64/Linux)
365              # big decrease following better CSE and arity
366              # 2014-07-17 409314320  (amd64/Linux)
367              # general round of updates
368              # 2014-09-10 385152728  post-AMP-cleanup
369              # 2014-12-08 340969128  constraint solver perf improvements (esp kick-out)
370              # 2014-12-10 449042120  constraint solver got worse again; more aggressive solving
371              #                          of family-applications leads to less sharing, I think
372              # 2015-03-17 403932600  tweak to solver algorithm
373
374        only_ways(['normal'])
375       ],
376      compile,
377      ['-freduction-depth=300'])
378
379 test('T5631',
380      [compiler_stats_num_field('bytes allocated',
381           [(wordsize(32), 390199244, 10),
382         # expected value: 392904228 (x86/Linux)
383         # 2014-04-04:     346389856 (x86 Windows, 64 bit machine)
384         # 2014-12-01:     390199244 (Windows laptop)
385            (wordsize(64), 812288344, 5)]),
386         # expected value: 774595008 (amd64/Linux):
387         # expected value: 735486328 (amd64/Linux) 2012/12/12:
388         # expected value: 690742040 (amd64/Linux) Call Arity improvements
389         # 2014-09-09:     739704712 (amd64/Linux) AMP changes
390         # 2014-11-04:     776121120 (amd64/Linux) new-flatten-skolems
391         # 2015-06-01:     812288344 (amd64/Linux) unknown cause
392        only_ways(['normal'])
393       ],
394      compile,
395      [''])
396
397 test('parsing001',
398      [compiler_stats_num_field('bytes allocated',
399           [(wordsize(32), 274000576, 10),
400            (wordsize(64), 587079016, 5)]),
401         # expected value: 587079016 (amd64/Linux)
402        only_ways(['normal']),
403       ],
404      compile_fail, [''])
405
406
407 test('T783',
408      [ only_ways(['normal']),  # no optimisation for this one
409       # expected value: 175,569,928 (x86/Linux)
410       compiler_stats_num_field('bytes allocated',
411           [(wordsize(32), 235002220, 5),
412             # 2012-10-08: 226907420 (x86/Linux)
413             # 2013-02-10: 329202116 (x86/Windows)
414             # 2013-02-10: 338465200 (x86/OSX)
415             # 2014-04-04: 319179104 (x86 Windows, 64 bit machine)
416             # 2014-09-03: 223377364 (Windows) better specialisation, raft of core-to-core optimisations
417             # 2014-12-22: 235002220 (Windows) not sure why
418
419            (wordsize(64), 470738808, 10)]),
420             # prev:       349263216 (amd64/Linux)
421             # 07/08/2012: 384479856 (amd64/Linux)
422             # 29/08/2012: 436927840 (amd64/Linux)
423             # 12/11/2012: 640324528 (amd64/Linux)
424             #   (OldCmm removed: not sure why this got worse, the
425             #    other perf tests remained about the same)
426             # 18/10/2013: 734038080 (amd64/Linux)
427             #   (fix for #8456)
428             # 24/10/2013: 654804144 (amd64/Linux)
429             #   (fix previous fix for #8456)
430             # 2014-07-17: 640031840 (amd64/Linux)
431             #   (general round of updates)
432             # 2014-08-29: 441932632  (amd64/Linux)
433             #   (better specialisation, raft of core-to-core optimisations)
434             # 2014-08-29: 719814352  (amd64/Linux)
435             #   (changed order of cmm block causes analyses to allocate much more,
436             #    but the changed order is slighly better in terms of runtime, and
437             #    this test seems to be an extreme outlier.)
438             # 2015-05-16: 548288760  (amd64/Linux)
439             #   (improved sequenceBlocks in nativeCodeGen, #10422)
440             # 2015-08-07: 470738808  (amd64/Linux)
441             #   (simplifying the switch plan code path for simple checks, #10677)
442       extra_hc_opts('-static')
443       ],
444       compile,[''])
445
446 test('T5321Fun',
447      [ only_ways(['normal']),  # no optimisation for this one
448        compiler_stats_num_field('bytes allocated',
449            [(wordsize(32), 206406188, 10),
450              # prev:       300000000
451              # 2012-10-08: 344416344 x86/Linux
452              #  (increase due to new codegen)
453              # 2014-09-03: 299656164     (specialisation and inlining)
454              # 10/12/2014: 206406188     #  Improvements in constraint solver
455             (wordsize(64), 429921312, 10)])
456              # prev:       585521080
457              # 29/08/2012: 713385808     #  (increase due to new codegen)
458              # 15/05/2013: 628341952     #  (reason for decrease unknown)
459              # 24/06/2013: 694019152     #  (reason for re-increase unknown)
460              # 12/05/2014: 614409344     #  (specialisation and inlining changes)
461              # 10/09/2014: 601629032     #  post-AMP-cleanup
462              # 06/11/2014: 541287000     #  Simon's flat-skol changes to the constraint solver
463              # 10/12/2014: 408110888     #  Improvements in constraint solver
464              # 16/12/2014: 429921312     #  Flattener parameterized over roles
465       ],
466       compile,[''])
467
468 test('T5321FD',
469      [ only_ways(['normal']),  # no optimisation for this one
470       compiler_stats_num_field('bytes allocated',
471           [(wordsize(32), 211699816, 10),
472             # prev:       213380256
473             # 2012-10-08: 240302920 (x86/Linux)
474             #  (increase due to new codegen)
475             # 2014-07-31: 211699816 (Windows) (-11%)
476             #  (due to better optCoercion, 5e7406d9, #9233)
477            (wordsize(64), 410895536, 10)])
478             # prev:       418306336
479             # 29/08/2012: 492905640
480             #  (increase due to new codegen)
481             # 15/05/2013: 406039584
482             #  (reason for decrease unknown)
483             # 08/06/2013: 476497048
484             #  (reason for increase unknown)
485             # before 2014-07-17: 441997096
486             #  (with -8%, still in range, hence cause not known)
487             # 2014-07-17: 426960992 (-11% of previous value)
488             #  (due to better optCoercion, 5e7406d9, #9233)
489             # 2014-10-08  410895536
490             #  (various changes; biggest improvements due to 949ad67 and FastString package ids)
491       ],
492       compile,[''])
493
494 test('T5642',
495      [ only_ways(['normal']),
496        compiler_stats_num_field('bytes allocated',
497            [(wordsize(32), 641085256, 10),
498                      # sample from x86/Linux
499             # prev:        650000000
500             # 2014-09-03:  753045568
501             # 2014-12-10:  641085256 Improvements in constraints solver
502
503             (wordsize(64), 1282916024, 10)])
504             # prev:        1300000000
505             # 2014-07-17:  1358833928 (general round of updates)
506             # 2014-08-07:  1402242360 (caused by 1fc60ea)
507 # Watch out for:
508             # 23/05/2014:  1452688392 (More aggressive specialisation means we get
509             #                          specialised copies of imported functions that
510             #                          are ultimately discarded by trimAutoRules
511             #                          It's a bizarre program with LOTS of data types)
512             # 2014-09-10:  1536924976 post-AMP-cleanup
513             # 2014-12-10:  1282916024 Improvements in constraints solver
514       ],
515       compile,['-O'])
516
517 test('T5837',
518      [ only_ways(['normal']),
519       compiler_stats_num_field('bytes allocated',
520           [(wordsize(32), 115905208, 10),
521              # 40000000 (x86/Linux)
522              # 2013-11-13:  45520936 (x86/Windows, 64bit machine)
523              # 2014-09-03:  37096484 (Windows laptop, w/w for INLINABLE things
524              # 2014-12-01: 135914136 (Windows laptop, regression see below)
525              # 2014-12-08  115905208  Constraint solver perf improvements (esp kick-out)
526
527            (wordsize(64), 38834096, 10)])
528              # sample: 3926235424 (amd64/Linux, 15/2/2012)
529              # 2012-10-02 81879216
530              # 2012-09-20 87254264 amd64/Linux
531              # 2013-09-18 90587232 amd64/Linux
532              # 2013-11-21 86795752 amd64/Linux, GND via Coercible and counters
533              #                                  for constraints solving
534              # 2014-08-29 73639840 amd64/Linux, w/w for INLINABLE things
535              # 2014-10-08 73639840 amd64/Linux, Burning Bridges and other small changes
536              # 2014-11-06 271028976       Linux, Accept big regression;
537              #   See Note [An alternative story for the inert substitution] in TcFlatten
538              # 2014-12-08 234790312 Constraint solver perf improvements (esp kick-out)
539              # 2014-12-16 231155640 Mac  Flattener parameterized over roles;
540              #                           some optimization
541              # 2015-03-17 53424304  Mac  Better depth checking; fails earlier
542              # 2015-06-09 38834096  Better "improvement"; I'm not sure whey it improves things
543       ],
544       compile_fail,['-freduction-depth=50'])
545
546 test('T6048',
547      [ only_ways(['optasm']),
548       compiler_stats_num_field('bytes allocated',
549           [(wordsize(32), 49987836, 10),
550             # prev:       38000000 (x86/Linux)
551             # 2012-10-08: 48887164 (x86/Linux)
552             # 2014-04-04: 62618072 (x86 Windows, 64 bit machine)
553             # 2014-09-03: 56315812 (x86 Windows, w/w for INLINEAVBLE)
554             # 2014-12-01: 49987836 (x86 Windows)
555
556            (wordsize(64),  95946688, 12)])
557              # 18/09/2012  97247032 amd64/Linux
558              # 16/01/2014 108578664 amd64/Linux (unknown, likely foldl-via-foldr)
559              # 18/01/2014  95960720 amd64/Linux Call Arity improvements
560              # 28/02/2014 105556793 amd64/Linux (unknown, tweak in base/4d9e7c9e3 resulted in change)
561              # 05/03/2014 110646312 amd64/Linux Call Arity became more elaborate
562              # 14/07/2014 125431448 amd64/Linux unknown reason. Even worse in GHC-7.8.3. *shurg*
563              # 29/08/2014 108354472 amd64/Linux w/w for INLINABLE things
564              # 14/09/2014  88186056 amd64/Linux BPP part1 change (more NoImplicitPreludes in base)
565              # 08/01/2014  95946688 amd64/Linux Mostly 4c834fd. Occasional spikes to 103822120!
566       ],
567       compile,[''])
568
569 test('T9020',
570      [ only_ways(['optasm']),
571       compiler_stats_num_field('bytes allocated',
572           [(wordsize(32), 343005716, 10),
573            # Original:    381360728
574            # 2014-07-31:  343005716 (Windows) (general round of updates)
575            (wordsize(64), 680162056, 10)])
576            # prev:        795469104
577            # 2014-07-17:  728263536 (general round of updates)
578            # 2014-09-10:  785871680 post-AMP-cleanup
579            # 2014-11-03:  680162056 Further Applicative and Monad adjustments
580       ],
581       compile,[''])
582
583 test('T9675',
584      [ only_ways(['optasm']),
585        compiler_stats_num_field('max_bytes_used', # Note [residency]
586           [(wordsize(64), 28056344, 15),
587           # 2014-10-13    29596552
588           # 2014-10-13    26570896   seq the DmdEnv in seqDmdType as well
589           # 2014-10-13    18582472   different machines giving different results..
590           # 2014-10-13    22220552   use the mean
591           # 2015-06-21    28056344   switch to `+RTS -G1`, tighten bound to 15%
592            (wordsize(32), 15341228, 15)
593           # 2015-07-11    15341228   (x86/Linux, 64-bit machine) use +RTS -G1
594           ]),
595        compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
596           [(wordsize(64), 105, 15),
597           # 2014-10-13    66
598           # 2014-10-13    58         seq the DmdEnv in seqDmdType as well
599           # 2014-10-13    49         different machines giving different results...
600           # 2014-10-13    53         use the mean
601           # 2015-06-15    44         reduced for some reason
602           # 2015-06-21    105        switch to `+RTS -G1`
603             (wordsize(32), 56, 15)
604           # 2015-07-11    56         (x86/Linux, 64-bit machine) use +RTS -G1
605           ]),
606        compiler_stats_num_field('bytes allocated',
607           [(wordsize(64), 544489040, 10)
608           # 2014-10-13    544489040
609           ,(wordsize(32), 279480696, 10)
610           # 2015-07-11    279480696  (x86/Linux, 64-bit machine) use +RTS -G1
611           ]),
612
613        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
614        extra_hc_opts('+RTS -G1 -RTS')
615       ],
616      compile,
617      [''])
618
619 test('T9872a',
620      [ only_ways(['normal']),
621        compiler_stats_num_field('bytes allocated',
622           [(wordsize(64), 2680733672, 5),
623           # 2014-12-10    5521332656    Initally created
624           # 2014-12-16    5848657456    Flattener parameterized over roles
625           # 2014-12-18    2680733672    Reduce type families even more eagerly
626            (wordsize(32), 1325592896, 5)
627           ]),
628       ],
629      compile_fail,
630      [''])
631
632 test('T9872b',
633      [ only_ways(['normal']),
634        compiler_stats_num_field('bytes allocated',
635           [(wordsize(64), 3480212048, 5),
636           # 2014-12-10    6483306280    Initally created
637           # 2014-12-16    6892251912    Flattener parameterized over roles
638           # 2014-12-18    3480212048    Reduce type families even more eagerly
639            (wordsize(32), 1700000000, 5)
640           ]),
641       ],
642      compile_fail,
643      [''])
644 test('T9872c',
645      [ only_ways(['normal']),
646        compiler_stats_num_field('bytes allocated',
647           [(wordsize(64), 2963554096, 5),
648           # 2014-12-10    5495850096    Initally created
649           # 2014-12-16    5842024784    Flattener parameterized over roles
650           # 2014-12-18    2963554096    Reduce type families even more eagerly
651            (wordsize(32), 1500000000, 5)
652           ]),
653       ],
654      compile_fail,
655      [''])
656 test('T9872d',
657      [ only_ways(['normal']),
658        compiler_stats_num_field('bytes allocated',
659           [(wordsize(64), 726679784, 5),
660           # 2014-12-18    796071864   Initally created
661           # 2014-12-18    739189056   Reduce type families even more eagerly
662           # 2015-01-07    687562440   TrieMap leaf compression
663           # 2015-03-17    726679784   tweak to solver; probably flattens more
664            (wordsize(32), 350369584, 5)
665           # some date     328810212
666           # 2015-07-11    350369584
667           ]),
668       ],
669      compile,
670      [''])
671
672 test('T9961',
673      [ only_ways(['normal']),
674        compiler_stats_num_field('bytes allocated',
675           [(wordsize(64), 663978160, 5),
676           # 2015-01-12    807117816   Initally created
677           # 2015-spring   772510192   Got better
678           # 2015-05-22    663978160   Fix for #10370 improves it more
679            (wordsize(32), 375647160, 5)
680           ]),
681       ],
682      compile,
683      ['-O'])
684
685 test('T9233',
686     [ only_ways(['normal']),
687       compiler_stats_num_field('bytes allocated',
688         [(wordsize(64), 999826288, 5),
689                  # 999826288   4 Aug 2015   initial value
690          (wordsize(32), 1, 5)   # Put in your value here if you hit this
691         ]),
692       extra_clean(['T9233a.hi', 'T9233a.o'])
693     ],
694     multimod_compile,
695     ['T9233', '-v0 -O2 -fno-spec-constr'])