Better stats for T5837
[ghc.git] / testsuite / tests / perf / compiler / all.T
1 # Tests that call 'compiler_stats_num_field' are skipped when debugging is on.
2 # See testsuite/driver/testlib.py.
3
4 def no_lint(name, opts):
5    opts.compiler_always_flags = \
6        [opt for opt in opts.compiler_always_flags if opt != '-dcore-lint' and opt != '-dcmm-lint']
7
8 setTestOpts(no_lint)
9
10
11 # Note [residency]
12 #
13 # Residency (peak_megabytes_allocated and max_bytes_used) is sensitive
14 # to when the major GC runs, which makes it inherently inaccurate.
15 # Sometime an innocuous change somewhere can shift things around such
16 # that the samples occur at a different time, and the residency
17 # appears to change (up or down) when the underlying profile hasn't
18 # really changed.
19 #
20 # However, please don't just ignore changes in residency.  If you see
21 # a change in one of these figures, please check whether it is real or
22 # not as follows:
23 #
24 #  * Run the test with old and new compilers, adding +RTS -h -i0.01
25 #    (you don't need to compile anything for profiling or enable profiling
26 #    libraries to get a heap profile).
27 #  * view the heap profiles, read off the maximum residency.  If it has
28 #    really changed, then you know there's an issue.
29
30 test('T1969',
31      [# expect_broken(12437),
32       compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
33           [(wordsize(32), 30, 15),
34              # 2010-05-17 14 (x86/Windows)
35              #            15 (x86/OS X)
36              #            19 (x86/OS X)
37              # 2013-02-10 13 (x86/Windows)
38              # 2013-02-10 14 (x86/OSX)
39              # 2013-11-13 17 (x86/Windows, 64bit machine)
40              # 2015-07-11 21 (x86/Linux, 64bit machine) use +RTS -G1
41              # 2016-04-06 30 (x86/Linux, 64bit machine)
42            (wordsize(64), 78, 20)]),
43              #            28 (amd64/Linux)
44              #            34 (amd64/Linux)
45              # 2012-09-20 23 (amd64/Linux)
46              # 2012-10-03 25 (amd64/Linux if .hi exists)
47              # 2013-02-13 23, but unstable so increased to 10% range
48              # 2013-02-13 27, very unstable!
49              # 2014-09-10 29 (amd64/Linux) post-AMP-cleanup
50              # 2013-09-11 30, 10 (amd64/Linux)
51              # 2013-09-11 30, 15 (adapt to Phab CI)
52              # 2015-06-03 41, (amd64/Linux) use +RTS -G1
53              # 2015-10-28 55, (amd64/Linux) emit Typeable at definition site
54              # 2016-10-20 68, (amd64/Linux) allow top-level string literals
55              #                See the comment 16 on #8472.
56              # 2017-02-17 83  (amd64/Linux) Type-indexed Typeable
57              # 2017-03-31 61  (amd64/Linux) Fix memory leak in simplifier
58              # 2018-01-25 78  (amd64/Linux) Use CoreExpr for EvTerm
59       compiler_stats_num_field('max_bytes_used',
60           [(platform('i386-unknown-mingw32'), 5719436, 20),
61                                  # 2010-05-17 5717704 (x86/Windows)
62                                  # 2013-02-10 5159748 (x86/Windows)
63                                  # 2013-02-10 5030080 (x86/Windows)
64                                  # 2013-11-13 7295012 (x86/Windows, 64bit machine)
65                                  # 2014-04-24 5719436 (x86/Windows, 64bit machine)
66            (wordsize(32), 9418680, 1),
67              #            6707308 (x86/OS X)
68              # 2009-12-31 6149572 (x86/Linux)
69              # 2014-01-22 6429864 (x86/Linux)
70              # 2014-06-29 5949188 (x86/Linux)
71              # 2015-07-11 6241108 (x86/Linux, 64-bit machine) use +RTS -G1
72              # 2016-04-06 9093608 (x86/Linux, 64-bit machine)
73              # 2017-03-24 9261052 (x86/Linux, 64-bit machine)
74              # 2017-04-06 9418680 (x86/Linux, 64-bit machine)
75
76            (wordsize(64), 22311600, 15)]),
77              # 2014-09-10 10463640, 10  # post-AMP-update (somewhat stabelish)
78                # looks like the peak is around ~10M, but we're
79                # unlikely to GC exactly on the peak.
80                # varies quite a lot with CLEANUP and BINDIST,
81                # hence 10% range.
82                # See Note [residency] to get an accurate view.
83              # 2014-09-14  9684256, 10 # try to lower it a bit more to match Phab's CI
84              # 2014-11-03 10584344,    # ghcspeed reports higher numbers consistently
85              # 2015-07-11 11670120 (amd64/Linux)
86              # 2015-10-28 15017528 (amd64/Linux) emit typeable at definition site
87              # 2016-10-12 17285216 (amd64/Linux) it's not entirely clear why
88              # 2017-02-01 19924328 (amd64/Linux) Join points (#12988)
89              # 2017-02-14 16393848 Early inline patch
90              # 2017-03-31 16679176 Fix memory leak in simplifier
91              # 2017-08-25 19199872 Refactor the Mighty Simplifier
92              # 2018-02-19 22311600 (amd64/Linux) Unknown
93
94       compiler_stats_num_field('bytes allocated',
95           [(platform('i386-unknown-mingw32'), 301784492, 5),
96                                  #            215582916 (x86/Windows)
97                                  # 2012-10-29 298921816 (x86/Windows)
98                                  # 2013-02-10 310633884 (x86/Windows)
99                                  # 2013-11-13 317975916 (x86/Windows, 64bit machine)
100                                  # 2014-04-04 301784492 (x86/Windows, 64bit machine)
101            (wordsize(32), 324586096, 1),
102              #            221667908 (x86/OS X)
103              #            274932264 (x86/Linux)
104              # 2012-10-08 303930948 (x86/Linux, new codegen)
105              # 2013-02-10 322937684 (x86/OSX)
106              # 2014-01-22 316103268 (x86/Linux)
107              # 2014-06-29 303300692 (x86/Linux)
108              # 2015-07-11 288699104 (x86/Linux, 64-bit machine) use +RTS -G1
109              # 2016-04-06 344730660 (x86/Linux, 64-bit machine)
110              # 2017-03-24 324586096 (x86/Linux, 64-bit machine)
111            (wordsize(64), 659863176, 5)]),
112              # 2009-11-17 434845560 (amd64/Linux)
113              # 2009-12-08 459776680 (amd64/Linux)
114              # 2010-05-17 519377728 (amd64/Linux)
115              # 2011-08-05 561382568 (amd64/OS X)
116              # 2012-07-16 589168872 (amd64/Linux)
117              # 2012-07-20 595936240 (amd64/Linux)
118              # 2012-08-23 606230880 (amd64/Linux)
119              # 2012-08-29 633334184 (amd64/Linux) new codegen
120              # 2012-09-18 641959976 (amd64/Linux)
121              # 2012-10-19 661832592 (amd64/Linux) -fPIC turned on
122              # 2012-10-23 642594312 (amd64/Linux) -fPIC turned off again
123              # 2012-11-12 658786936 (amd64/Linux) UNKNOWN REASON
124              # 2013-91-17 667160192 (x86_64/Linux) new demand analyser
125              # 2013-10-18 698612512 (x86_64/Linux) fix for #8456
126              # 2014-02-10 660922376 (x86_64/Linux) call arity analysis
127              # 2014-07-17 651626680 (x86_64/Linux) roundabout update
128              # 2014-09-10 630299456 (x86_64/Linux) post-AMP-cleanup
129              # 2015-06-03 581460896 (x86_64/Linux) use +RTS -G1
130              # 2015-10-28 695430728 (x86_64/Linux) emit Typeable at definition site
131              # 2015-10-28 756138176 (x86_64/Linux) inst-decl defaults go via typechecker (#12220)
132              # 2017-02-17 831733376 (x86_64/Linux) Type-indexed Typeable
133              # 2017-02-25 695354904 (x86_64/Linux) Early inlining patch
134              # 2017-04-21 659863176 (x86_64/Linux) Unknown
135       only_ways(['normal']),
136
137       extra_hc_opts('-dcore-lint -static'),
138           # Leave -dcore-lint on for this one test, so that we have something
139           # that will catch a regression in -dcore-lint performance.
140
141       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
142       extra_hc_opts('+RTS -G1 -RTS')
143       ],
144      compile,
145      [''])
146
147 # This one tests for the space leak in the native code generator,
148 # where it holds onto the entire asm output until the end.  The space
149 # leak reappears from time to time, so it's a good idea to have a test
150 # for it.  The residency of this test will jump by 10MB to 40MB or so
151 # on x86-64 if the space leak appears.
152
153 # Only run this one if we have an NCG:
154 if 'optasm' in config.compile_ways:
155    conf_3294 = only_ways(['normal'])
156 else:
157    conf_3294 = skip
158
159 test('T3294',
160      [
161       compiler_stats_num_field('max_bytes_used', # Note [residency]
162           [(wordsize(32), 28686588, 15),
163              #            17725476 (x86/OS X)
164              #            14593500 (Windows)
165              # 2013-02-10 20651576 (x86/Windows)
166              # 2013-02-10 20772984 (x86/OSX)
167              # 2013-11-13 24009436 (x86/Windows, 64bit machine)
168              # 2014-04-24 19882188 (x86/Windows, 64bit machine)
169              # 2014-12-22 26525384 (x86/Windows) Increase due to silent superclasses?
170              # 2015-07-11 43196344 (x86/Linux, 64-bit machine) use +RTS -G1
171              # 2016-04-06 28686588 (x86/Linux, 64-bit machine)
172
173            (wordsize(64), 34050960, 20)]),
174              # prev:           25753192 (amd64/Linux)
175              # 29/08/2012:     37724352 (amd64/Linux)
176              #  (increase due to new codegen, see #7198)
177              # 13/13/2012:     44894544 (amd64/Linux)
178              #  (reason for increase unknown)
179              # 15/5/2013:      36904752  (amd64/Linux)
180              #  (reason for decrease unknown)
181              # 29/5/2013:      43224080  (amd64/Linux)
182              #  (reason for increase back to earlier value unknown)
183              # 2014-07-14:     36670800  (amd64/Linux)
184              #  (reason unknown, setting expected value somewhere in between)
185              # 2015-01-22:     45000000  (amd64/Linux)
186              #  varies between 40959592 and 52914488... increasing to +-20%
187              # 2015-10-28:     50367248  (amd64/Linux)
188              #  D757: emit Typeable instances at site of type definition
189              # 2016-07-11:     54609256  (Windows) before fix for #12227
190              # 2016-07-11:     52992688  (Windows) after fix for #12227
191              # 2017-02-17:     63131248  (amd64/Linux) Type indexed Typeable
192              # 2017-05-14:     34050960  (amd64/Linux) Two-pass CmmLayoutStack
193
194       compiler_stats_num_field('bytes allocated',
195           [(wordsize(32), 1377050640, 5),
196            # previous:     815479800  (x86/Linux)
197            # (^ increase due to new codegen, see #7198)
198            # 2012-10-08:  1373514844 (x86/Linux)
199            # 2013-11-13: 1478325844  (x86/Windows, 64bit machine)
200            # 2014-01-12: 1565185140  (x86/Linux)
201            # 2013-04-04: 1377050640  (x86/Windows, 64bit machine)
202            (wordsize(64), 1858491504, 5)]),
203             # old:        1357587088 (amd64/Linux)
204             # 29/08/2012: 2961778696 (amd64/Linux)
205             # (^ increase due to new codegen, see #7198)
206             # 18/09/2012: 2717327208 (amd64/Linux)
207             # 08/06/2013: 2901451552 (amd64/Linux) (reason unknown)
208             # 12/12/2013: 3083825616 (amd64/Linux) (reason unknown)
209             # 18/02/2014: 2897630040 (amd64/Linux) (call arity improvements)
210             # 12/03/2014: 2705289664 (amd64/Linux) (more call arity improvements)
211             # 2014-17-07: 2671595512 (amd64/Linux) (round-about update)
212             # 2014-09-10: 2709595808 (amd64/Linux) post-AMP cleanup
213             # 2016-07-11: 2664479936 (Windows) before fix for #12227
214             # 2016-07-11: 2739731144 (Windows) after fix for #12227 (ignoring)
215             # 2017-02-17: 2758641264 (amd64/Linux) (Type indexed Typeable)
216             # 2017-05-14: 2253557280 (amd64/Linux) Two-pass CmmLayoutStack
217             # 2017-10-24: 1858491504 (amd64/Linux) Improved linear regAlloc
218       conf_3294,
219
220       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
221       extra_hc_opts('+RTS -G1 -RTS')
222       ],
223      compile,
224      [''])
225
226 test('T4801',
227      [ # expect_broken(5224),
228        # temporarily unbroken (#5227)
229 ###################################
230 # deactivated for now, as this metric became too volatile recently
231 #      compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
232 #          [(platform('x86_64-apple-darwin'), 70, 1),
233 #                           # expected value: 58 (amd64/OS X)
234 #                           # 13/01/2014 - 70
235 #           (wordsize(32), 30, 20),
236 #           (wordsize(64), 48, 20)]),
237 #            # prev:       50 (amd64/Linux)
238 #            # 19/10/2012: 64 (amd64/Linux)
239 #            #                (^ REASON UNKNOWN!)
240 #            # 12/11/2012: 49 (amd64/Linux)
241 #            #                (^ REASON UNKNOWN!)
242 #            # 28/8/13:    60 (amd64/Linux)
243 #            #                (^ REASON UNKNOWN!)
244 #            # 2014-09-10: 55 post-AMP-cleanup
245 #            # 2014-10-08: 62 (jumps between 55 and 71 observed -- GC tipping point?)
246 #            # 2014-10-13: 48 stricter seqDmdType
247
248       compiler_stats_num_field('bytes allocated',
249           [(platform('x86_64-apple-darwin'), 417302064, 10),
250            # prev:       510938976 (amd64/OS X):
251            # 2015-12-11: 465653312 (amd64/OS X) Update, bump tolerance to +/-10%
252            # 2017-03-24: 417302064 (amd64/OS X) Correlated with Linux improvement
253
254            (wordsize(32), 199856388, 10),
255            # prev:        185669232 (x86/OSX)
256            # 2014-01-22:  211198056 (x86/Linux)
257            # 2014-09-03:  185242032 (Windows laptop)
258            # 2014-12-01:  203962148 (Windows laptop)
259            # 2016-04-06:  239556572 (x86/Linux)
260            # 2017-03-24:  199856388 (x86/Linux)
261            (wordsize(64), 388898280, 10)]),
262             # prev:       360243576 (amd64/Linux)
263             # 19/10/2012: 447190832 (amd64/Linux) (-fPIC turned on)
264             # 19/10/2012: 392409984 (amd64/Linux) (-fPIC turned off)
265             # 2014-04-08: 362939272 (amd64/Linux) cumulation of various smaller improvements over recent commits
266             # 2014-10-08: 382056344 (amd64/Linux) stricter foldr2 488e95b
267             # 2015-10-28: 434278248 (amd64/Linux) emit Typeable at definition site
268             # 2016-10-19: 388898280 (amd64/Linux) Refactor traceRn interface (#12617)
269
270 ###################################
271 # deactivated for now, as this metric became too volatile recently
272 #
273 #     compiler_stats_num_field('max_bytes_used',
274 #         [(platform('x86_64-apple-darwin'), 25145320, 5),
275 #          (wordsize(32), 11829000, 15),
276 #            #              9651948 (x86/OSX)
277 #            #              10290952 (windows)
278 #            # 2013-02-10   11071060 (x86/Windows)
279 #            # 2013-02-10:  11207828 (x86/OSX)
280 #            # (some date): 11139444
281 #            # 2013-11-13:  11829000 (x86/Windows, 64bit machine)
282 #          (wordsize(64), 19296544, 15)]),
283 #               # prev:       20486256 (amd64/OS X)
284 #               # 30/08/2012: 17305600--20391920 (varies a lot)
285 #               # 19/10/2012: 26882576 (-fPIC turned on)
286 #               # 19/10/2012: 18619912 (-fPIC turned off)
287 #               # 24/12/2012: 21657520 (perhaps gc sampling time wibbles?)
288 #               # 10/01/2014: 25166280
289 #               # 13/01/2014: 22646000 (mostly due to #8647)
290 #               # 18/02/2014: 25002136 (call arity analysis changes)
291 #               # 12/05/2014: 25002136 (specialisation and inlining changes)
292 #               # 10/09/2014: 19296544, 10 (post-AMP-cleanup)
293 #               # 14/09/2014: 19585456, 15 (adapt to Phab CI env)
294        only_ways(['normal']),
295        extra_hc_opts('-static'),
296
297        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
298        extra_hc_opts('+RTS -G1 -RTS')
299        ],
300      compile,
301      [''])
302
303 test('T3064',
304      [compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
305           [(wordsize(32), 36, 20),
306             # expected value: 14 (x86/Linux 28-06-2012):
307             # 2013-11-13:     18 (x86/Windows, 64bit machine)
308             # 2014-01-22:     23 (x86/Linux)
309             # 2014-12-22:     23 (x86/Linux) death to silent superclasses
310             # 2015-07-11:     28 (x86/Linux, 64-bit machine) use +RTS -G1
311             # 2017-04-06:     36 (x86/Linux, 64-bit machine) it's unclear
312
313            (wordsize(64), 66, 20)]),
314             # (amd64/Linux):            18
315             # (amd64/Linux) 2012-02-07: 26
316             # (amd64/Linux) 2013-02-12: 23; increased range to 10%
317             # (amd64/Linux) 2013-04-03: 26
318             # (amd64/Linux) 2013-09-11: 30; result of AMP patch
319             # Increased range to 20%.  peak-usage varies from 22 to 26,
320             #  depending on whether the old .hi file exists
321             # (amd64/Linux) 2013-09-11: 37; better arity analysis (weird)
322             # (amd64/Linux) (09/09/2014): 42, AMP changes (larger interfaces, more loading)
323             # (amd64/Linux) 2014-10-13: 38: Stricter seqDmdType
324             # (amd64/Linux) 2014-12-22: 27: death to silent superclasses
325             # (amd64/Linux) 2015-01-22: 32: Varies from 30 to 34, at least here.
326             # (amd64/Linux) 2015-06-03: 54: use +RTS -G1
327             # (amd64/Linux) 2016-10-25: 66: Presumably creep
328
329       compiler_stats_num_field('bytes allocated',
330           [(wordsize(32), 134044092, 10),
331             # 2011-06-28: 56380288  (x86/Linux)
332             # 2012-10-30: 111189536 (x86/Windows)
333             # 2013-11-13: 146626504 (x86/Windows, 64bit machine)
334             # 2014-01-22: 162457940 (x86/Linux)
335             # 2014-12-01: 162457940 (Windows)
336             # 2014-12-22: 122836340 (Windows) Death to silent superclasses
337             # 2016-04-06: 153261024 (x86/Linux) probably wildcard refactor
338             # 2017-03-24: 134044092 (x86/Linux, 64-bit machine) Update
339
340            (wordsize(64), 258505536, 5)]),
341             # (amd64/Linux) (2011-06-28):  73259544
342             # (amd64/Linux) (2013-02-07): 224798696
343             # (amd64/Linux) (2013-08-02): 236404384, increase from roles
344             # (amd64/Linux) (2013-09-11): 290165632, increase from AMP warnings
345             # (amd64/Linux) (2013-11-22): 308300448, GND via Coercible and counters for constraints solving
346             # (amd64/Linux) (2013-12-02): 329795912, Coercible refactor
347             # (amd64/Linux) (2014-02-11): 308422280, optimize Coercions in simpleOptExpr
348             # (amd64/Linux) (2014-05-23): 324022680, unknown cause
349             # (amd64/Linux) (2014-07-17): 332702112, general round of updates
350             # (amd64/Linux) (2014-08-29): 313638592, w/w for INLINABLE things
351             # (amd64/Linux) (2014-09-09): 407416464, AMP changes (larger interfaces, more loading)
352             # (amd64/Linux) (2014-09-14): 385145080, BPP changes (more NoImplicitPrelude in base)
353             # (amd64/Linux) (2014-12-10): 363103840, improvements in constraint solver
354             # (Mac)         (2014-12-18): 350418600, improvements to flattener
355             # (amd64/Linux) (2014-12-22): 243670824, Ha! Death to superclass constraints, makes
356             #                                        much less code for Monad instances
357             # (amd64/Linux) (2015-12-01): 264952256, Regression due to Simon's wildcard refactor
358             #                                        Tracked as #11151.
359             # (amd64/Linux) (2015-12-11): 304344936, Regression due to TypeInType
360             #                                        Tracked as #11196
361             # (amd64/Linux) (2016-04-15): 287460128  Improvement due to using coercionKind instead
362             #                                        of zonkTcType (Trac #11882)
363             # (amd64/Darwin) (2017-01-23): 306222424 Presumably creep from recent changes (Typeable?)
364             # (amd64/Linux) (2017-02-14): 259815560  Early inline patch: 9% improvement
365             # (amd64/Linux) (2017-03-31): 265950920  Fix memory leak in simplifier
366             # (amd64/Linux) (2017-05-01): 281509496  Avoid excessive space usage from unfoldings in CoreTidy
367             # (amd64/Linux) (2017-05-01): 258505536  I think this is improvement in coercionKind e4ab65bd
368
369 ###################################
370 # deactivated for now, as this metric became too volatile recently
371 #
372 #      compiler_stats_num_field('max_bytes_used',
373 #          [(wordsize(32), 11202304, 20),
374 #            # 2011-06-28:  2247016 (x86/Linux) (28/6/2011):
375 #            #(some date):  5511604
376 #            # 2013-11-13:  7218200 (x86/Windows, 64bit machine)
377 #            # 2014-04-04: 11202304 (x86/Windows, 64bit machine)
378 #           (wordsize(64), 13251728, 20)]),
379 #            # (amd64/Linux, intree) (28/06/2011):  4032024
380 #            # (amd64/Linux, intree) (07/02/2013):  9819288
381 #            # (amd64/Linux)         (14/02/2013):  8687360
382 #            # (amd64/Linux)         (18/02/2013):  9397488
383 #            # (amd64/Linux)         (02/08/2013): 10742536, increase from roles
384 #            # (amd64/Linux)         (19/08/2013): 9211816,  decrease apparently from better eta reduction
385 #            # (amd64/Linux)         (11/09/2013): 12000480, increase from AMP warnings
386 #            #                                     933cdf15a2d85229d3df04b437da31fdfbf4961f
387 #            # (amd64/Linux)         (22/11/2013): 16266992, GND via Coercible and counters for constraints solving
388 #            # (amd64/Linux)         (12/12/2013): 19821544, better One shot analysis
389 #            # (amd64/Linux)         (09/09/2014): 24357392, AMP changes (larger interfaces, more loading)
390 #            # (amd64/Linux)         (14/09/2014): 16053888, BPP changes (more NoImplicitPrelude in base)
391 #            # (amd64/Linux)         (19/09/2014): 18744992, unknown
392 #            # (amd64/Linux)         2014-10-13:   13251728, Stricter seqDmdType
393
394        only_ways(['normal']),
395
396        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
397        extra_hc_opts('+RTS -G1 -RTS')
398       ],
399      compile,
400      [''])
401
402 test('T4007',
403      normal,
404      run_command,
405      ['$MAKE -s --no-print-directory T4007'])
406
407 test('T5030',
408      [compiler_stats_num_field('bytes allocated',
409           [(wordsize(32), 345668088, 10),
410            # previous:    196457520
411            # 2012-10-08:  259547660 (x86/Linux, new codegen)
412            # 2013-11-21:  198573456 (x86 Windows, 64 bit machine)
413            # 2014-12-10:  227205560 constraint solver got worse again; more aggressive solving
414            #                        of family-applications leads to less sharing, I think
415            # 2015-07-11:  201882912 reason unknown
416            # 2016-04-06:  345668088 likely TypeInType
417
418            (wordsize(64), 794426536, 10)]),
419              # Previously 530000000 (+/- 10%)
420              # 17/1/13:   602993184  (x86_64/Linux)
421              #            (new demand analyser)
422              # 2013-06-08 538467496  (x86_64/Linux)
423              # ^ reason unknown
424              # 2013-08-02 454498592  (amd64/Linux)
425              # decrease from more aggressive coercion optimisations from roles
426              # 2013-11-12 397672152  (amd64/Linux)
427              # big decrease following better CSE and arity
428              # 2014-07-17 409314320  (amd64/Linux)
429              # general round of updates
430              # 2014-09-10 385152728  post-AMP-cleanup
431              # 2014-12-08 340969128  constraint solver perf improvements (esp kick-out)
432              # 2014-12-10 449042120  constraint solver got worse again; more aggressive solving
433              #                          of family-applications leads to less sharing, I think
434              # 2015-03-17 403932600  tweak to solver algorithm
435              # 2015-12-11 653710960  TypeInType (see #11196)
436              # 2016-10-17 794426536  20% big increase following
437              #                       31621b12 * A collection of type-inference refactorings.
438              #                       See ticket for more info
439
440        only_ways(['normal'])
441       ],
442      compile,
443      ['-freduction-depth=300'])
444
445 test('T5631',
446      [compiler_stats_num_field('bytes allocated',
447           [(wordsize(32), 570137436, 10),
448         # expected value: 392904228 (x86/Linux)
449         # 2014-04-04:     346389856 (x86 Windows, 64 bit machine)
450         # 2014-12-01:     390199244 (Windows laptop)
451         # 2016-04-06:     570137436 (amd64/Linux) many reasons
452            (wordsize(64), 1106015512, 5)]),
453         # expected value: 774595008 (amd64/Linux):
454         # expected value: 735486328 (amd64/Linux) 2012/12/12:
455         # expected value: 690742040 (amd64/Linux) Call Arity improvements
456         # 2014-09-09:     739704712 (amd64/Linux) AMP changes
457         # 2014-11-04:     776121120 (amd64/Linux) new-flatten-skolems
458         # 2015-06-01:     812288344 (amd64/Linux) unknown cause
459         # 2015-12-11:     1128828928 (amd64/Linux) TypeInType (see #11196)
460         # 2015-12-21:     1198327544 (Mac) TypeApplications (will fix with #11196)
461         # 2015-03-18:     1124068664 (Mac) optimize Unify & zonking
462         # 2016-10-19:     1024926024 (amd64/Linux) Refactor traceRn interface (#12617)
463         # 2016-11-10:     1077429456 (amd64/Linux) Stop -dno-debug-output suppressing -ddump-tc-trace
464         # 2017-02-17:     1517484488 (amd64/Linux) Type-indexed Typeable
465         # 2017-03-03:     1065147968 (amd64/Linux) Share Typeable KindReps
466         # 2017-03-31:     1037482512 (amd64/Linux) Fix memory leak in simplifier
467         # 2017-07-27:     1106015512 (Mac) Regresssion from tracking visibility in TypeEqOrigin
468         #                                  should be fixed by #14037
469        only_ways(['normal'])
470       ],
471      compile,
472      [''])
473
474 test('parsing001',
475      [compiler_stats_num_field('bytes allocated',
476           [(wordsize(32), 232777056, 10),
477         # Initial:        274000576
478         # 2017-03-24:     232777056
479            (wordsize(64), 490228304, 5)]),
480         # expected value: 587079016 (amd64/Linux)
481         # 2016-09-01:     581551384 (amd64/Linux) Restore w/w limit (#11565)
482         # 2016-12-19:     493730288 (amd64/Linux) Join points (#12988)
483         # 2017-02-14:     463931280 Early inlining patch; acutal improvement 7%
484         # 2017-12-11:     490228304 BlockArguments
485        only_ways(['normal']),
486       ],
487      compile_fail, [''])
488
489
490 test('T783',
491      [ only_ways(['normal']),  # no optimisation for this one
492       # expected value: 175,569,928 (x86/Linux)
493       compiler_stats_num_field('bytes allocated',
494           [(wordsize(32), 225911912, 5),
495             # 2012-10-08: 226907420 (x86/Linux)
496             # 2013-02-10: 329202116 (x86/Windows)
497             # 2013-02-10: 338465200 (x86/OSX)
498             # 2014-04-04: 319179104 (x86 Windows, 64 bit machine)
499             # 2014-09-03: 223377364 (Windows) better specialisation, raft of core-to-core optimisations
500             # 2014-12-22: 235002220 (Windows) not sure why
501             # 2016-04-06: 249332816 (x86/Linux, 64-bit machine)
502             # 2017-03-24: 225911912 (x86/Linux, 64-bit machine)
503
504            (wordsize(64), 481875416, 10)]),
505             # prev:       349263216 (amd64/Linux)
506             # 07/08/2012: 384479856 (amd64/Linux)
507             # 29/08/2012: 436927840 (amd64/Linux)
508             # 12/11/2012: 640324528 (amd64/Linux)
509             #   (OldCmm removed: not sure why this got worse, the
510             #    other perf tests remained about the same)
511             # 18/10/2013: 734038080 (amd64/Linux)
512             #   (fix for #8456)
513             # 24/10/2013: 654804144 (amd64/Linux)
514             #   (fix previous fix for #8456)
515             # 2014-07-17: 640031840 (amd64/Linux)
516             #   (general round of updates)
517             # 2014-08-29: 441932632 (amd64/Linux)
518             #   (better specialisation, raft of core-to-core optimisations)
519             # 2014-08-29: 719814352 (amd64/Linux)
520             #   (changed order of cmm block causes analyses to allocate much more,
521             #      but the changed order is slighly better in terms of runtime, and
522             #      this test seems to be an extreme outlier.)
523             # 2015-05-16: 548288760 (amd64/Linux)
524             #   (improved sequenceBlocks in nativeCodeGen, #10422)
525             # 2015-08-07: 470738808 (amd64/Linux)
526             #   (simplifying the switch plan code path for simple checks, #10677)
527             # 2015-08-28: 526230456 (amd64/Linux)
528             #    (D757: Emit Typeable instances at site of type definition)
529             # 2015-12-04: 1134085384 (amd64/Linux)
530             #    (D1535: Major overhaul of pattern match checker, #11162)
531             # 2016-02-03: 488592288 (amd64/Linux)
532             #    (D1795: Another overhaul of pattern match checker, #11374)
533             # 2017-02-14    436978192    Early inlining: 5% improvement
534             # 2017-09-08    481875416    Unknown
535
536       extra_hc_opts('-static')
537       ],
538       compile,[''])
539
540 test('T5321Fun',
541      [ only_ways(['normal']),  # no optimisation for this one
542        compiler_stats_num_field('bytes allocated',
543            [(wordsize(32), 244387620, 10),
544              # prev:       300000000
545              # 2012-10-08: 344416344 x86/Linux
546              #  (increase due to new codegen)
547              # 2014-09-03: 299656164     (specialisation and inlining)
548              # 2014-12-10: 206406188     #  Improvements in constraint solver
549              # 2016-04-06: 279922360 x86/Linux
550              # 2017-03-24: 244387620 x86/Linux (64-bit machine)
551
552             (wordsize(64), 423774560, 5)])
553              # prev:       585521080
554              # 2012-08-29: 713385808     #  (increase due to new codegen)
555              # 2013-05-15: 628341952     #  (reason for decrease unknown)
556              # 2013-06-24: 694019152     #  (reason for re-increase unknown)
557              # 2014-05-12: 614409344     #  (specialisation and inlining changes)
558              # 2014-09-10: 601629032     #  post-AMP-cleanup
559              # 2014-11-06: 541287000     #  Simon's flat-skol changes to the constraint solver
560              # 2014-12-10: 408110888     #  Improvements in constraint solver
561              # 2014-12-16: 429921312     #  Flattener parameterized over roles
562              # 2015-08-10: 509921312
563              #  (undefined now takes an implicit parameter and GHC -O0 does
564              #  not recognize that the application is bottom)
565              # 2015-12-11: 565883176     #  TypeInType (see #11196)
566              # 2017-01-06: 497356688     #  Small coercion optimisations
567                                          #  The actual decrease was only 2%; earlier
568                                          #    commits had drifted down
569              # 2017-01-22: 525895608     #  Allow top-level string literals in Core. I'm not
570                                          #    convinced that this patch is
571                                          #    responsible for all of this
572                                          #    change, however. Namely I am
573                                          #    quite skeptical of the downward
574                                          #    "drift" reported above
575              # 2017-01-31: 498135752     #  Join points (#12988)
576              # 2017-02-23: 524706256     #  Type-indexed Typeable? (on Darwin)
577              # 2017-02-25: 488295304     #  Early inlining patch
578              # 2017-05-14: 449577856     #  (amd64/Linxu) Two-pass CmmLayoutStack
579              # 2017-12-13: 423774560     #  (amd64/Linxu) Typechecker improvements
580       ],
581       compile,[''])
582
583 test('T5321FD',
584      [ only_ways(['normal']),  # no optimisation for this one
585       compiler_stats_num_field('bytes allocated',
586           [(wordsize(32), 250757460, 10),
587             # prev:       213380256
588             # 2012-10-08: 240302920 (x86/Linux)
589             #  (increase due to new codegen)
590             # 2014-07-31: 211699816 (Windows) (-11%)
591             #  (due to better optCoercion, 5e7406d9, #9233)
592             # 2016-04-06: 250757460 (x86/Linux)
593
594            (wordsize(64), 415136648, 10)])
595             # prev:       418306336
596             # 29/08/2012: 492905640
597             #  (increase due to new codegen)
598             # 15/05/2013: 406039584
599             #  (reason for decrease unknown)
600             # 08/06/2013: 476497048
601             #  (reason for increase unknown)
602             # before 2014-07-17: 441997096
603             #  (with -8%, still in range, hence cause not known)
604             # 2014-07-17: 426960992 (-11% of previous value)
605             #  (due to better optCoercion, 5e7406d9, #9233)
606             # 2014-10-08  410895536
607             #  (various changes; biggest improvements due to 949ad67 and FastString package ids)
608             # 2015-08-10: 470895536
609             #  (undefined now takes an implicit parameter and GHC -O0 does
610             #  not recognize that the application is bottom)
611             # 2015-10-28: 532365376
612             #  D757: emit Typeable instances at site of type definition
613             # 2016-07-16: 477840432
614             #  Optimize handling of built-in OccNames
615             # 2017-05-14: 415136648 (amd64/Linux) Two-pass CmmLayoutStack
616       ],
617       compile,[''])
618
619 test('T5642',
620      [ only_ways(['normal']),
621        normal,
622        compiler_stats_num_field('bytes allocated',
623            [(wordsize(32), 413517560, 10),
624                      # sample from x86/Linux
625             # prev:        650000000
626             # 2014-09-03:  753045568
627             # 2014-12-10:  641085256 Improvements in constraints solver
628             # 2016-04-06:  462677300
629             # 2017-03-24:  413517560 (x86/Linux, 64-bit machine)
630
631             (wordsize(64),  838316496, 10)])
632             # prev:        1300000000
633             # 2014-07-17:  1358833928 (general round of updates)
634             # 2014-08-07:  1402242360 (caused by 1fc60ea)
635 # Watch out for:
636             # 23/05/2014:  1452688392 (More aggressive specialisation means we get
637             #                          specialised copies of imported functions that
638             #                          are ultimately discarded by trimAutoRules
639             #                          It's a bizarre program with LOTS of data types)
640             # 2014-09-10:  1536924976 post-AMP-cleanup
641             # 2014-12-10:  1282916024 Improvements in constraints solver
642             # 2015-10-28:  1412808976 Emit Typeable at definition site
643             # 2015-11-22:  1071915072 Use TypeLits in the metadata encoding
644             # 2016-02-08:   950004816 Pattern match checker re-rework
645             # 2016-05-12:  1300685592 Make Generic1 poly-kinded
646             # 2016-06-05:   916484672 Refactor derived Generic instances to reduce allocations
647             # 2016-09-03:   838316496 Derive the Generic instance in perf/compiler/T5642
648       ],
649       compile,['-O'])
650
651 test('T5837',
652      [ only_ways(['normal']),
653       compiler_stats_num_field('bytes allocated',
654           [(wordsize(32), 27028956, 10),
655              # 40000000 (x86/Linux)
656              # 2013-11-13:  45520936 (x86/Windows, 64bit machine)
657              # 2014-09-03:  37096484 (Windows laptop, w/w for INLINABLE things
658              # 2014-12-01: 135914136 (Windows laptop, regression see below)
659              # 2014-12-08: 115905208  Constraint solver perf improvements (esp kick-out)
660              # 2016-04-06: 24199320  (x86/Linux, 64-bit machine) TypeInType
661              # 2017-03-24: 27028956  (x86/Linux, 64-bit machine)
662
663            (platform('x86_64-unknown-mingw32'), 54793816, 7),
664              # 2017-02-19                       59161648 (x64/Windows) - Unknown
665              # 2017-04-21                       54985248 (x64/Windows) - Unknown
666              # 2017-12-24                       54793816 (x64/Windows) - Unknown
667
668            (wordsize(64), 51294232, 7)])
669              # sample: 3926235424 (amd64/Linux, 15/2/2012)
670              # 2012-10-02 81879216
671              # 2012-09-20 87254264 amd64/Linux
672              # 2013-09-18 90587232 amd64/Linux
673              # 2013-11-21 86795752 amd64/Linux, GND via Coercible and counters
674              #                                  for constraints solving
675              # 2014-08-29 73639840 amd64/Linux, w/w for INLINABLE things
676              # 2014-10-08 73639840 amd64/Linux, Burning Bridges and other small changes
677              # 2014-11-06 271028976       Linux, Accept big regression;
678              #   See Note [An alternative story for the inert substitution] in TcFlatten
679              # 2014-12-08 234790312 Constraint solver perf improvements (esp kick-out)
680              # 2014-12-16 231155640 Mac  Flattener parameterized over roles;
681              #                           some optimization
682              # 2015-03-17 53424304  Mac  Better depth checking; fails earlier
683              # 2015-06-09 38834096  Better "improvement"; I'm not sure whey it improves things
684              # 2015-12-11 43877520  amd64/Linux, TypeInType (see #11196)
685              # 2016-03-18 48507272  Mac, accept small regression in exchange
686              #                           for other optimisations
687              # 2016-09-15 42445672  Linux; fixing #12422
688              # 2016-09-25 41832056  amd64/Linux, Rework handling of names (D2469)
689              # 2016-10-25 52597024  amd64/Linux, the test now passes (hooray), and so
690              #                          allocates more because it goes right down the
691              #                          compilation pipeline
692              # 2017-01-24 57861352  amd64/Linux, very likely due to the top-level strings
693              #                          in Core patch.
694              # 2017-02-07 50253880  Another improvement in SetLevels.  I don't think
695              #                      all the gain here is from this patch, but I think it
696              #                      just pushed it over the edge, so I'm re-centreing, and
697              #                      changing to 5% tolerance
698              # 2017-02-07 53592736  amd64/Linux Simon's earlier decrease appears
699              #                      to be environmentally-dependent.
700              #                      Also bumped acceptance threshold to 7%.
701              # 2017-02-20 58648600  amd64/Linux Type-indexed Typeable
702              # 2017-02-28 54151864  amd64/Linux Likely drift due to recent simplifier improvements
703              # 2017-02-25 52625920  amd64/Linux Early inlining patch
704              # 2017-09-06 56782344  amd64/Linux Drift manifest in unrelated LLVM patch
705              # 2017-10-24 52089424  amd64/linux Fix space leak in BinIface.getSymbolTable
706              # 2018-02-19 55813608  amd64/Linux Unknown
707              # 2018-02-27 51294232  amd64/Linux Better still, I'm not sure why
708       ],
709       compile, ['-freduction-depth=50'])
710
711 test('T6048',
712      [ only_ways(['optasm']),
713       compiler_stats_num_field('bytes allocated',
714           [(wordsize(32), 55701280, 10),
715             # prev:       38000000 (x86/Linux)
716             # 2012-10-08: 48887164 (x86/Linux)
717             # 2014-04-04: 62618072 (x86 Windows, 64 bit machine)
718             # 2014-09-03: 56315812 (x86 Windows, w/w for INLINABLE)
719             # 2014-12-01: 49987836 (x86 Windows)
720             # 2016-04-06: 55701280 (x86/Linux, 64-bit machine)
721
722            (wordsize(64), 90996312, 10)])
723              # 2012-09-18  97247032 amd64/Linux
724              # 2014-01-16 108578664 amd64/Linux (unknown, likely foldl-via-foldr)
725              # 2014-01-18  95960720 amd64/Linux Call Arity improvements
726              # 2014-02-28 105556793 amd64/Linux (unknown, tweak in base/4d9e7c9e3 resulted in change)
727              # 2014-03-05 110646312 amd64/Linux Call Arity became more elaborate
728              # 2014-07-14 125431448 amd64/Linux unknown reason. Even worse in GHC-7.8.3. *shurg*
729              # 2014-08-29 108354472 amd64/Linux w/w for INLINABLE things
730              # 2014-09-14  88186056 amd64/Linux BPP part1 change (more NoImplicitPreludes in base)
731              # 2014-01-08  95946688 amd64/Linux Mostly 4c834fd. Occasional spikes to 103822120!
732              # 2016-03-11 108225624 amd64/Linux unknown reason sadly; likely gradual creep.
733              # 2016-11-25  94327392 amd64/Linux Back down again hooray; still not sure why
734              # 2017-02-17 115715592 amd64/Linux Type-indexed Typeable
735              # 2017-04-28 90996312 Join point refactoring
736       ],
737       compile,[''])
738
739 test('T9020',
740      [ only_ways(['optasm']),
741       compiler_stats_num_field('bytes allocated',
742           [(wordsize(32), 249904136, 10),
743            # Original:    381360728
744            # 2014-07-31:  343005716 (Windows) (general round of updates)
745            # 2017-03-24:  249904136 (x86/Linux, 64-bit machine)
746
747            (wordsize(64), 423163832, 10)])
748            # prev:        795469104
749            # 2014-07-17:  728263536 (general round of updates)
750            # 2014-09-10:  785871680 post-AMP-cleanup
751            # 2014-11-03:  680162056 Further Applicative and Monad adjustments
752            # 2015-10-21:  786189008 Make stronglyConnCompFromEdgedVertices deterministic
753            # 2016-01-26:  698401736 improvement from using ExpTypes instead of ReturnTvs
754            # 2016-04-06:  852298336 Refactoring of CSE #11781
755            # 2016-04-06:  698401736 Use thenIO in Applicative IO
756            # 2017-02-03:  764866144 Join points
757            # 2017-02-14:  500707080 Early inline patch; 35% decrease!
758            #                        Program size collapses in first simplification
759            # 2017-03-31:  493596312 Fix memory leak in simplifier
760            # 2017-04-28:  423163832  Remove exponential behaviour in simplifier
761       ],
762       compile,[''])
763
764 test('T9675',
765      [ only_ways(['optasm']),
766        compiler_stats_num_field('max_bytes_used', # Note [residency]
767           [(wordsize(64), 17675240, 15),
768           # 2014-10-13    29596552
769           # 2014-10-13    26570896   seq the DmdEnv in seqDmdType as well
770           # 2014-10-13    18582472   different machines giving different results..
771           # 2014-10-13    22220552   use the mean
772           # 2015-06-21    28056344   switch to `+RTS -G1`, tighten bound to 15%
773           # 2015-10-28    23776640   emit Typeable at definition site
774           # 2015-12-11    30837312   TypeInType (see #11196)
775           # 2016-03-14    38776008   Final demand analyzer run
776           # 2016-04-01    29871032   Fix leaks in demand analysis
777           # 2016-04-30    17675240   Fix leaks in tidy unfoldings
778            (wordsize(32), 18043224, 15)
779           # 2015-07-11    15341228   (x86/Linux, 64-bit machine) use +RTS -G1
780           # 2016-04-06    18043224   (x86/Linux, 64-bit machine)
781           ]),
782        compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
783           [(wordsize(64), 63, 15),
784           # 2014-10-13    66
785           # 2014-10-13    58         seq the DmdEnv in seqDmdType as well
786           # 2014-10-13    49         different machines giving different results...
787           # 2014-10-13    53         use the mean
788           # 2015-06-15    44         reduced for some reason
789           # 2015-06-21    105        switch to `+RTS -G1`
790           # 2015-12-04    88         new pattern checker (D1535)
791           # 2015-12-11    113        TypeInType (see #11196)
792           # 2016-04-14    144        Final demand analyzer run
793           # 2016-07-26    121        Unboxed sums?
794           # 2017-04-30    63         Fix leaks in tidy unfoldings
795             (wordsize(32), 56, 15)
796           # 2015-07-11    56         (x86/Linux, 64-bit machine) use +RTS -G1
797           ]),
798        compiler_stats_num_field('bytes allocated',
799           [(wordsize(64), 656137960, 10)
800           # 2014-10-13    544489040
801           # 2015-10-28    608284152  emit Typeable at definition site
802           # 2017-02-17    731171072  Type-indexed Typeable
803           # 2017-03-13    656137960  Put join ceiling underneath lambdas?
804
805           ,(wordsize(32), 322901484, 10)
806           # 2015-07-11    279480696  (x86/Linux, 64-bit machine) use +RTS -G1
807           # 2017-03-24    322901484  (x86/Linux, 64-bit machine)
808
809           ]),
810
811        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
812        extra_hc_opts('+RTS -G1 -RTS')
813       ],
814      compile,
815      [''])
816
817 test('T9872a',
818      [ only_ways(['normal']),
819        compiler_stats_num_field('bytes allocated',
820           [(wordsize(64), 3005891848, 5),
821           # 2014-12-10    5521332656    Initally created
822           # 2014-12-16    5848657456    Flattener parameterized over roles
823           # 2014-12-18    2680733672    Reduce type families even more eagerly
824           # 2015-12-11    3581500440    TypeInType (see #11196)
825           # 2016-04-07    3352882080    CSE improvements
826           # 2016-10-19    3134866040    Refactor traceRn interface (#12617)
827           # 2017-02-17    3298422648    Type-indexed Typeable
828           # 2017-02-25    3005891848    Early inlining patch
829
830            (wordsize(32), 1493198244, 5)
831           # was           1325592896
832           # 2016-04-06    1740903516    x86/Linux
833           # 2017-03-24    1493198244    x86/Linux, 64-bit machine
834           ]),
835       ],
836      compile_fail,
837      [''])
838
839 test('T9872b',
840      [ only_ways(['normal']),
841        compiler_stats_num_field('bytes allocated',
842           [(wordsize(64), 3730686224, 5),
843           # 2014-12-10    6483306280    Initally created
844           # 2014-12-16    6892251912    Flattener parameterized over roles
845           # 2014-12-18    3480212048    Reduce type families even more eagerly
846           # 2015-12-11    5199926080    TypeInType (see #11196)
847           # 2016-02-08    4918990352    Improved a bit by tyConRolesRepresentational
848           # 2016-04-06:   4600233488    Refactoring of CSE #11781
849           # 2016-09-15:   4069522928    Fix #12422
850           # 2017-02-14    3730686224    Early inlining: 5% improvement
851
852            (wordsize(32), 1894037608, 5)
853           # was           1700000000
854           # 2016-04-06    2422750696    x86/Linux
855           # 2017-03-24    1894037608    x86/Linux, 64-bit machine
856           ]),
857       ],
858      compile_fail,
859      [''])
860 test('T9872c',
861      [ only_ways(['normal']),
862        compiler_stats_num_field('bytes allocated',
863           [(wordsize(64), 3404346032, 5),
864           # 2014-12-10    5495850096    Initally created
865           # 2014-12-16    5842024784    Flattener parameterized over roles
866           # 2014-12-18    2963554096    Reduce type families even more eagerly
867           # 2015-12-11    4723613784    TypeInType (see #11196)
868           # 2016-02-08    4454071184    Improved a bit by tyConRolesRepresentational
869           # 2016-04-06:   4306667256    Refactoring of CSE #11781
870           # 2016-09-15:   3702580928    Fixing #12422
871           # 2017-02-14    3404346032    Early inlining: 5% improvement
872
873            (wordsize(32), 1727582260, 5)
874           # was           1500000000
875           # 2016-04-06    2257242896
876           # 2017-03-24    1727582260    x86/Linux, 64-bit machine
877           ]),
878       ],
879      compile_fail,
880      [''])
881 test('T9872d',
882      [ only_ways(['normal']),
883        compiler_stats_num_field('bytes allocated',
884           [(wordsize(64), 462817352, 5),
885           # 2014-12-18    796071864   Initally created
886           # 2014-12-18    739189056   Reduce type families even more eagerly
887           # 2015-01-07    687562440   TrieMap leaf compression
888           # 2015-03-17    726679784   tweak to solver; probably flattens more
889           # 2015-12-11    566134504   TypeInType; see #11196
890           # 2016-02-08    534693648   Improved a bit by tyConRolesRepresentational
891           # 2016-03-18    506691240   optimize Unify & zonking
892           # 2016-12-05    478169352   using tyConIsTyFamFree, I think, but only
893           #                           a 1% improvement 482 -> 478
894           # 2017-02-17    535565128   Type-indexed Typeable
895           # 2017-02-25    498855104   Early inlining
896           # 2017-03-03    462817352   Share Typeable KindReps
897
898            (wordsize(32), 232954000, 5)
899           # some date     328810212
900           # 2015-07-11    350369584
901           # 2016-04-06    264566040   x86/Linux
902           # 2017-03-24    232954000   x86/Linux, 64-bit machine
903           ]),
904       ],
905      compile,
906      [''])
907
908 test('T9961',
909      [ only_ways(['normal']),
910        compiler_stats_num_field('bytes allocated',
911           [(wordsize(64), 498326216, 5),
912           # 2015-01-12    807117816   Initally created
913           # 2015-spring   772510192   Got better
914           # 2015-05-22    663978160   Fix for #10370 improves it more
915           # 2015-10-28    708680480   x86_64/Linux   Emit Typeable at definition site
916           # 2015-12-17    745044392   x86_64/Darwin  Creep upwards
917           # 2016-03-20    519436672   x64_64/Linux   Don't use build desugaring for large lists (#11707)
918           # 2016-03-24    568526784   x64_64/Linux   Add eqInt* variants (#11688)
919           # 2016-09-01    537297968   x64_64/Linux   Restore w/w limit (#11565)
920           # 2016-12-19    571246936   x64_64/Linux   Join points (#12988)
921           # 2017-02-14    498326216   Early inline patch; 13% improvement
922
923            (wordsize(32), 255409052, 5)
924           # was           375647160
925           # 2016-04-06    275264188   x86/Linux
926           # 2017-03-24    255409052   x86/Linux, 64-bit machine
927           ]),
928       ],
929      compile,
930      ['-O'])
931
932 test('T9233',
933     [ only_ways(['normal']),
934       compiler_stats_num_field('bytes allocated',
935         [(wordsize(64),  924299320, 5),
936          # 2015-08-04    999826288     initial value
937          # 2016-04-14   1066246248     Final demand analyzer run
938          # 2016-06-18    984268712     shuffling around of Data.Functor.Identity
939          # 2017-01-20    920101608     Improvement to SetLevels apparently saved 4.2% in
940          #                             compiler allocation.  Program size seems virtually
941          #                             unchanged; maybe the compiler itself is a little faster
942          # 2017-01-23    861862608     worker/wrapper evald-ness flags; another 5% improvement!
943          # 2017-02-01    894486272     Join points
944          # 2017-02-07    884436192     Another improvement to SetLevels
945          # 2017-02-17    974530192     Type-indexed Typeable
946          # 2017-03-21    924299320     It's unclear
947
948          (wordsize(32),  460112888, 5)
949          # 2016-04-06    515672240     (x86/Linux) initial value
950          # 2017-03-24    460112888     x86/Linux, 64-bit machine
951         ]),
952       extra_clean(['T9233a.hi', 'T9233a.o'])
953     ],
954     multimod_compile,
955     ['T9233', '-v0 -O2 -fno-spec-constr'])
956
957 test('T10370',
958      [ only_ways(['optasm']),
959        compiler_stats_num_field('max_bytes_used', # Note [residency]
960           [(wordsize(64), 31524048, 15),
961           # 2015-10-22    19548720
962           # 2016-02-24    22823976   Changing Levity to RuntimeRep; not sure why this regresses though, even after some analysis
963           # 2016-04-14    28256896   final demand analyzer run
964           # 2016-08-08    33049304
965           #     This change happened because we changed the behavior
966           #     of inlining across hs-boot files, so that we don't
967           #     inline if something comes from a boot file.  This
968           #     affected stats on bootstrapped GHC.  However,
969           #     when I set -i0.01 with profiling, the heap profiles
970           #     were identical, so I think it's just GC noise.
971           # 2016-10-20    38221184   Allow top-level string literals.
972           #                          See the comment 16 on #8472.
973           # 2017-02-17    51126304   Type-indexed Typeable
974           # 2017-02-27    43455848   Likely drift from recent simplifier improvements
975           # 2017-02-25    41291976   Early inline patch
976           # 2017-04-30    31524048   Fix leaks in tidy unfoldings
977
978            (wordsize(32), 19276304, 15),
979           # 2015-10-22    11371496
980           # 2017-03-24    19276304 (x86/Linux, 64-bit machine)
981           ]),
982        compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
983           [(wordsize(64), 117, 15),
984           # 2015-10-22     76
985           # 2016-04-14    101 final demand analyzer run
986           # 2016-08-08    121 see above
987           # 2017-01-18    146 Allow top-level string literals in Core
988           # 2017-02-17    187 Type-indexed Typeable
989           # 2017-02-25    154 Early inline patch
990           # 2017-04-30    117 Fix leaks in tidy unfoldings
991            (wordsize(32),  69, 15),
992           # 2015-10-22     39
993           # 2017-03-24     69
994           ]),
995        # Use `+RTS -G1` for more stable residency measurements. Note [residency].
996        extra_hc_opts('+RTS -G1 -RTS')
997      ],
998      compile,
999      [''])
1000
1001 test('T10547',
1002      [ compiler_stats_num_field('bytes allocated',
1003           [(platform('x86_64-unknown-mingw32'), 37485128, 20),
1004           # 2017-02-19                         37485128 (x64/Windows) - Unknown
1005
1006            (wordsize(64), 37681360, 20),
1007           # initial:    39165544
1008           # 2016-11-25: 31041520 Linux   Around the time of refactoring the constraint solver;
1009           #                              but I think that only pushed it over the edge
1010           # 2017-02-20: 38681216 Linux   Type-indexed Typeable
1011           ]),
1012      ],
1013      compile_fail,
1014      ['-fprint-expanded-synonyms'])
1015
1016 test('T12227',
1017      [ only_ways(['normal']),
1018        compiler_stats_num_field('bytes allocated',
1019           [(wordsize(64), 812869424, 5),
1020           # 2016-07-11    5650186880 (Windows) before fix for #12227
1021           # 2016-07-11    1822822016 (Windows) after fix for #12227
1022           # 2016-12-20    1715827784 after d250d493 (INLINE in Traversable dms)
1023           #                          (or thereabouts in the commit history)
1024           # 2017-02-14    1060158624  Early inlining: 35% improvement
1025           # 2018-01-04    812869424   Drop unused givens (#13032): 23% better
1026           ]),
1027      ],
1028      compile,
1029      # Use `-M1G` to prevent memory thrashing with ghc-8.0.1.
1030      ['-O2 -ddump-hi -ddump-to-file +RTS -M1G'])
1031
1032 test('T12425',
1033      [ only_ways(['optasm']),
1034        compiler_stats_num_field('bytes allocated',
1035           [(wordsize(64), 134780272, 5),
1036           # initial:      125831400
1037           # 2017-01-18:   133380960  Allow top-level string literals in Core
1038           # 2017-02-17:   153611448  Type-indexed Typeable
1039           # 2017-03-03:   142256192  Share Typeable KindReps
1040           # 2017-03-21:   134334800  Unclear
1041           # 2017-04-28:   127500136  Remove exponential behaviour in simplifier
1042           # 2017-05-23:   134780272  Addition of llvm-targets in dynflags (D3352)
1043           ]),
1044      ],
1045      compile,
1046      [''])
1047
1048 test('T12234',
1049      [ only_ways(['optasm']),
1050        compiler_stats_num_field('bytes allocated',
1051           [(platform('x86_64-unknown-mingw32'), 79889200, 5),
1052           # initial:      83032768
1053           # 2017-02-19    89180624 (x64/Windows) - Unknown
1054           # 2017-02-25    79889200 (x64/Windows) - Early inline patch
1055            (wordsize(64), 81696664, 5),
1056           # initial:      72958288
1057           # 2016-01-17:   76848856  (x86-64, Linux. drift?)
1058           # 2017-02-01:   80882208  (Use superclass instances when solving)
1059           # 2017-02-05:   74374440  (Probably OccAnal fixes)
1060           # 2017-02-17:   86525344  (Type-indexed Typeable)
1061           # 2017-02-25:   83032768  (Early inline patch)
1062           # 2017-09-07:   81696664  (Semigroup=>Monoid patch, D3927)
1063           ]),
1064      ],
1065      compile,
1066      [''])
1067
1068 test('T12545',
1069      [ only_ways(['normal']),
1070        compiler_stats_num_field('bytes allocated',
1071           [(wordsize(64), 3538652464, 5),
1072           # 2017-06-08    3538652464  initial
1073           ]),
1074        extra_clean(['T12545a.hi', 'T12545a.o'])
1075      ],
1076      multimod_compile,
1077      ['T12545', '-v0'] )
1078
1079 test('T13035',
1080      [ only_ways(['normal']),
1081        compiler_stats_num_field('bytes allocated',
1082           [(wordsize(64), 118665640, 5),
1083           # 2017-01-05   90595208  initial
1084           # 2017-01-19   95269000  Allow top-level string literals in Core
1085           # 2017-02-05   88806416  Probably OccAnal fixes
1086           # 2017-02-17   103890200 Type-indexed Typeable
1087           # 2017-02-25   98390488  Early inline patch
1088           # 2017-03-21   93249744  It's unclear
1089           # 2017-07-19   118665640 Generate Typeable bindings for data instances
1090           ]),
1091      ],
1092      compile,
1093      [''] )
1094
1095 test('T13056',
1096      [ only_ways(['optasm']),
1097        compiler_stats_num_field('bytes allocated',
1098          [(wordsize(64), 440548592, 10),
1099          # 2017-01-06    520166912 initial
1100          # 2017-01-31    546800240 Join points (#12988)
1101          # 2017-02-07    524611224 new SetLevels
1102          # 2017-02-14    440548592 Early inline patch: 16% improvement
1103          # 2017-04-21    417860736 (darwin)
1104          # 2017-04-22    Increase to +/- 10% (Darwin and Linux differ significantly)
1105          ]),
1106      ],
1107      compile,
1108      ['-O1'])
1109
1110 test('T12707',
1111      [ compiler_stats_num_field('bytes allocated',
1112           [(wordsize(64), 1163821528, 5),
1113           # initial:    1271577192
1114           # 2017-01-22: 1348865648  Allow top-level strings in Core
1115           # 2017-01-31: 1280336112  Join points (#12988)
1116           # 2017-02-11: 1310037632  Check local family instances vs imports
1117           # 2017-02-23: 1386110512  Type-indexed Typeable? (on Darwin)
1118           # 2017-03-02: 1231809592  Drift from recent simplifier improvements
1119           # 2017-05-14: 1163821528  (amd64/Linux) Two-pass CmmLayoutStack
1120           ]),
1121      ],
1122      compile,
1123      [''])
1124
1125 test('T12150',
1126      [ only_ways(['optasm']),
1127        compiler_stats_num_field('bytes allocated',
1128           [(wordsize(64), 73769936, 5)
1129           # initial:    70773000
1130           # 2017-08-25: 74358208  Refactor the Mighty Simplifier
1131           # 2017-08-25: 78300680  Drift
1132           # 2017-10-25: 73769936  amd64/linux Fix space leak in BinIface.getSymbolTable
1133           ]),
1134      ],
1135     compile,
1136      [''])
1137
1138 test('T13379',
1139      [ compiler_stats_num_field('bytes allocated',
1140           [(platform('x86_64-apple-darwin'), 453166912, 10),
1141           # 453166912: add osx-specific after two-pass CmmLayoutStack
1142            (wordsize(64), 411597856, 10),
1143           # initial:    411597856
1144           # widen window to 10%, Darwin had 449080520, a 9.1% difference
1145           ]),
1146      ],
1147      compile,
1148      [''])
1149
1150 test('MultiLayerModules',
1151      [ compiler_stats_num_field('bytes allocated',
1152           [(wordsize(64), 5619893176, 10),
1153           # initial:    12139116496
1154           # 2017-05-12: 6956533312   Revert "Use a deterministic map for imp_dep_mods"
1155           # 2017-05-31: 6294813000   Faster checkFamInstConsistency
1156           # 2018-01-21: 5619893176   Allocate less in plus_mod_dep
1157           ]),
1158        pre_cmd('./genMultiLayerModules'),
1159        extra_files(['genMultiLayerModules']),
1160      ],
1161      multimod_compile,
1162      ['MultiLayerModules', '-v0'])
1163
1164 test('ManyConstructors',
1165      [ compiler_stats_num_field('bytes allocated',
1166           [(wordsize(64), 4246959352, 10),
1167           # initial:    8130527160
1168           # 2018-01-05: 4246959352  Lift constructor tag allocation out of a loop
1169           ]),
1170        pre_cmd('./genManyConstructors'),
1171        extra_files(['genManyConstructors']),
1172      ],
1173      multimod_compile,
1174      ['ManyConstructors', '-v0'])
1175
1176 test('ManyAlternatives',
1177      [ compiler_stats_num_field('bytes allocated',
1178           [(wordsize(64), 1398898072, 10),
1179           # initial:    1756999240
1180           # 2018-01-20: 1398898072  Use IntSet in Dataflow
1181           ]),
1182        pre_cmd('./genManyAlternatives'),
1183        extra_files(['genManyAlternatives']),
1184      ],
1185      multimod_compile,
1186      ['ManyAlternatives', '-v0'])
1187
1188 test('T13701',
1189      [ compiler_stats_num_field('bytes allocated',
1190           [(platform('x86_64-apple-darwin'), 2217187888, 10),
1191            (platform('x86_64-unknown-linux'), 2133380768, 10),
1192            # initial:     2511285600
1193            # 2017-06-23:  2188045288    treat banged variable bindings as FunBinds
1194            # 2017-07-11:  2187920960
1195            # 2017-07-12:  2412223768    inconsistency between Ben's machine and Harbormaster?
1196            # 2017-07-17:  2133380768    Resolved the issue causing the inconsistencies in this test
1197           ]),
1198        pre_cmd('./genT13701'),
1199        extra_files(['genT13701']),
1200      ],
1201      multimod_compile,
1202      ['T13701', '-v0'])
1203
1204 test('T13719',
1205      [ compiler_stats_num_field('bytes allocated',
1206           [(wordsize(64), 5187889872, 10),
1207           # initial:    49907410784
1208           # 2017-05-31: 5187889872   Faster checkFamInstConsistency
1209           ]),
1210        pre_cmd('./genT13719'),
1211        extra_files(['genT13719']),
1212      ],
1213      multimod_compile,
1214      ['T13719', '-v0'])
1215
1216 test('Naperian',
1217      [ reqlib('vector'),
1218        only_ways(['optasm']),
1219        compiler_stats_num_field('bytes allocated',
1220           [(platform('x86_64-unknown-mingw32'), 54116696, 10),
1221            # 2017-12-24                       54116696 (x64/Windows) - Unknown
1222           (wordsize(64), 53576760, 10)])
1223            # 2018-01-25                       53576760 (x64/Linux) - The previous value looked very wrong
1224      ],
1225      compile,
1226      [''])
1227
1228 test ('T9630',
1229       [ compiler_stats_num_field('max_bytes_used', # Note [residency]
1230           [(platform('x86_64-unknown-mingw32'),   39867088, 15),
1231           # 2017-12-24:                     34171816 (x64/Windows)
1232           (wordsize(64), 35324712, 15)
1233           # initial:    56955240
1234           # 2017-06-07: 41568168     Stop the specialiser generating loopy code
1235           # 2018-02-25: 35324712     It's not entirely clear
1236           ]),
1237       extra_clean(['T9630a.hi', 'T9630a.o'])
1238       ],
1239       multimod_compile,
1240       ['T9630', '-v0 -O'])