Compiler perf has improved a bit
[ghc.git] / testsuite / tests / perf / compiler / all.T
1 def no_lint(name, opts):
2    opts.compiler_always_flags = \
3        filter(lambda opt: opt != '-dcore-lint' and opt != '-dcmm-lint', opts.compiler_always_flags)
4
5 setTestOpts(no_lint)
6
7
8 # Note [residency]
9 #
10 # Residency (peak_megabytes_allocated and max_bytes_used) is sensitive
11 # to when the major GC runs, which makes it inherently inaccurate.
12 # Sometime an innocuous change somewhere can shift things around such
13 # that the samples occur at a different time, and the residency
14 # appears to change (up or down) when the underlying profile hasn't
15 # really changed.
16 #
17 # However, please don't just ignore changes in residency.  If you see
18 # a change in one of these figures, please check whether it is real or
19 # not as follows:
20 #
21 #  * Run the test with old and new compilers, adding +RTS -h -i0.01
22 #    (you don't need to compile anything for profiling or enable profiling
23 #    libraries to get a heap profile).
24 #  * view the heap profiles, read off the maximum residency.  If it has
25 #    really changed, then you know there's an issue.
26
27 test('T1969',
28      [compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
29           [(wordsize(32), 17, 15),
30              # 2010-05-17 14 (x86/Windows)
31              #            15 (x86/OS X)
32              #            19 (x86/OS X)
33              # 2013-02-10 13 (x86/Windows)
34              # 2013-02-10 14 (x86/OSX)
35              # 2013-11-13 17 (x86/Windows, 64bit machine)
36            (wordsize(64), 30, 15)]),
37              #            28 (amd64/Linux)
38              #            34 (amd64/Linux)
39              # 2012-09-20 23 (amd64/Linux)
40              # 2012-10-03 25 (amd64/Linux if .hi exists)
41              # 2013-02-13 23, but unstable so increased to 10% range
42              # 2013-02-13 27, very unstable!
43              # 2013-09-11 30 (amd64/Linux)
44       compiler_stats_num_field('max_bytes_used',
45           [(platform('i386-unknown-mingw32'), 5719436, 20),
46                                  # 2010-05-17 5717704 (x86/Windows)
47                                  # 2013-02-10 5159748 (x86/Windows)
48                                  # 2013-02-10 5030080 (x86/Windows)
49                                  # 2013-11-13 7295012 (x86/Windows, 64bit machine)
50                                  # 2014-04-24 5719436 (x86/Windows, 64bit machine)
51            (wordsize(32), 5949188, 1),
52              #            6707308 (x86/OS X)
53              # 2009-12-31 6149572 (x86/Linux)
54              # 2014-01-22 6429864 (x86/Linux)
55              # 2014-06-29 5949188 (x86/Linux)
56            (wordsize(64), 11000000, 20)]),
57                # looks like the peak is around ~10M, but we're
58                # unlikely to GC exactly on the peak.
59                # varies quite a lot with CLEANUP and BINDIST,
60                # hence 10% range.
61                # See Note [residency] to get an accurate view.
62       compiler_stats_num_field('bytes allocated',
63           [(platform('i386-unknown-mingw32'), 301784492, 5),
64                                  #            215582916 (x86/Windows)
65                                  # 2012-10-29 298921816 (x86/Windows)
66                                  # 2013-02-10 310633884 (x86/Windows)
67                                  # 2013-11-13 317975916 (x86/Windows, 64bit machine)
68                                  # 2014-04-04 301784492 (x86/Windows, 64bit machine)
69            (wordsize(32), 303300692, 1),
70              #            221667908 (x86/OS X)
71              #            274932264 (x86/Linux)
72              # 2012-10-08 303930948 (x86/Linux, new codegen)
73              # 2013-02-10 322937684 (x86/OSX)
74              # 2014-01-22 316103268 (x86/Linux)
75              # 2014-06-29 303300692 (x86/Linux)
76            (wordsize(64), 651626680, 5)]),
77              # 17/11/2009 434845560 (amd64/Linux)
78              # 08/12/2009 459776680 (amd64/Linux)
79              # 17/05/2010 519377728 (amd64/Linux)
80              # 05/08/2011 561382568 (amd64/OS X)
81              # 16/07/2012 589168872 (amd64/Linux)
82              # 20/07/2012 595936240 (amd64/Linux)
83              # 23/08/2012 606230880 (amd64/Linux)
84              # 29/08/2012 633334184 (amd64/Linux) new codegen
85              # 18/09/2012 641959976 (amd64/Linux)
86              # 19/10/2012 661832592 (amd64/Linux) -fPIC turned on
87              # 23/10/2012 642594312 (amd64/Linux) -fPIC turned off again
88              # 12/11/2012 658786936 (amd64/Linux) UNKNOWN REASON
89              # 17/1/13:   667160192 (x86_64/Linux) new demand analyser
90              # 18/10/2013 698612512 (x86_64/Linux) fix for #8456
91              # 10/02/2014 660922376 (x86_64/Linux) call artiy analysis
92              # 17/07/2014 651626680 (x86_64/Linux) roundabout update
93       only_ways(['normal']),
94
95       extra_hc_opts('-dcore-lint -static')
96           # Leave -dcore-lint on for this one test, so that we have something
97           # that will catch a regression in -dcore-lint performance.
98       ],
99      compile,
100      [''])
101
102 # This one tests for the space leak in the native code generator,
103 # where it holds onto the entire asm output until the end.  The space
104 # leak reappears from time to time, so it's a good idea to have a test
105 # for it.  The residency of this test will jump by 10MB to 40MB or so
106 # on x86-64 if the space leak appears.
107
108 # Only run this one if we have an NCG:
109 if 'optasm' in config.compile_ways:
110    conf_3294 = only_ways(['normal'])
111 else:
112    conf_3294 = skip
113
114 test('T3294',
115      [
116       compiler_stats_num_field('max_bytes_used', # Note [residency]
117           [(wordsize(32), 19882188, 15),
118              #            17725476 (x86/OS X)
119              #            14593500 (Windows)
120              # 2013-02-10 20651576 (x86/Windows)
121              # 2013-02-10 20772984 (x86/OSX)
122              # 2013-11-13 24009436 (x86/Windows, 64bit machine)
123              # 2014-04-24 19882188 (x86/Windows, 64bit machine)
124            (wordsize(64), 40000000, 15)]),
125              # prev:           25753192 (amd64/Linux)
126              # 29/08/2012:     37724352 (amd64/Linux)
127              #  (increase due to new codegen, see #7198)
128              # 13/13/2012:     44894544 (amd64/Linux)
129              #  (reason for increase unknown)
130              # 15/5/2013:      36904752  (amd64/Linux)
131              #  (reason for decrease unknown)
132              # 29/5/2013:      43224080  (amd64/Linux)
133              #  (reason for increase back to earlier value unknown)
134              # 2014-07-14:     36670800  (amd64/Linux)
135              #  (reason unknown, setting expected value somewhere in between)
136
137       compiler_stats_num_field('bytes allocated',
138           [(wordsize(32), 1377050640, 5),
139            # previous:     815479800  (x86/Linux)
140            # (^ increase due to new codegen, see #7198)
141            # 2012-10-08:  1373514844 (x86/Linux)
142            # 2013-11-13: 1478325844  (x86/Windows, 64bit machine)
143            # 2014-01-12: 1565185140  (x86/Linux)
144            # 2013-04-04: 1377050640  (x86/Windows, 64bit machine)
145            (wordsize(64), 2671595512, 5)]),
146             # old:        1357587088 (amd64/Linux)
147             # 29/08/2012: 2961778696 (amd64/Linux)
148             # (^ increase due to new codegen, see #7198)
149             # 18/09/2012: 2717327208 (amd64/Linux)
150             # 08/06/2013: 2901451552 (amd64/Linux) (reason unknown)
151             # 12/12/2013: 3083825616 (amd64/Linux) (reason unknown)
152             # 18/02/2014: 2897630040 (amd64/Linux) (call arity improvements)
153             # 12/03/2014: 2705289664 (amd64/Linux) (more call arity improvements)
154             # 2014-17-07: 2671595512 (amd64/Linux) (round-about update)
155       conf_3294
156       ],
157      compile,
158      [''])
159
160 test('T4801',
161      [ # expect_broken(5224),
162        # temporarily unbroken (#5227)
163       compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
164           [(platform('x86_64-apple-darwin'), 70, 1),
165                            # expected value: 58 (amd64/OS X)
166                            # 13/01/2014 - 70
167            (wordsize(32), 30, 20),
168            (wordsize(64), 60, 20)]),
169             # prev:       50 (amd64/Linux)
170             # 19/10/2012: 64 (amd64/Linux)
171             #                (^ REASON UNKNOWN!)
172             # 12/11/2012: 49 (amd64/Linux)
173             #                (^ REASON UNKNOWN!)
174             # 28/8/13:    60 (amd64/Linux)
175             #                (^ REASON UNKNOWN!)
176
177       compiler_stats_num_field('bytes allocated',
178           [(platform('x86_64-apple-darwin'), 464872776, 5),
179                            # expected value: 510938976 (amd64/OS X):
180
181            (wordsize(32), 211198056, 10),
182            # prev:        185669232 (x86/OSX)
183            # 2014-01-22:  211198056 (x86/Linux)
184            (wordsize(64), 392409984, 10)]),
185             # prev:       360243576 (amd64/Linux)
186             # 19/10/2012: 447190832 (amd64/Linux) (-fPIC turned on)
187             # 19/10/2012: 392409984 (amd64/Linux) (-fPIC turned off)
188
189       compiler_stats_num_field('max_bytes_used',
190           [(platform('x86_64-apple-darwin'), 25145320, 5),
191            (wordsize(32), 11829000, 15),
192              #              9651948 (x86/OSX)
193              #              10290952 (windows)
194              # 2013-02-10   11071060 (x86/Windows)
195              # 2013-02-10:  11207828 (x86/OSX)
196              # (some date): 11139444
197              # 2013-11-13:  11829000 (x86/Windows, 64bit machine)
198            (wordsize(64), 25002136, 10)]),
199                 # prev:       20486256 (amd64/OS X)
200                 # 30/08/2012: 17305600--20391920 (varies a lot)
201                 # 19/10/2012: 26882576 (-fPIC turned on)
202                 # 19/10/2012: 18619912 (-fPIC turned off)
203                 # 24/12/2012: 21657520 (perhaps gc sampling time wibbles?)
204                 # 10/01/2014: 25166280 
205                 # 13/01/2014: 22646000 (mostly due to #8647)
206                 # 18/02/2014: 25002136 (call arity analysis changes)
207        only_ways(['normal']),
208        extra_hc_opts('-static')
209       ],
210      compile,
211      [''])
212
213 test('T3064',
214      [# expect_broken( 3064 ),
215       compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
216           [(wordsize(32), 23, 20),
217             # expected value: 14 (x86/Linux 28-06-2012):
218             # 2013-11-13:     18 (x86/Windows, 64bit machine)
219             # 2014-01-22:     23 (x86/Linux)
220            (wordsize(64), 42, 20)]),
221             # (amd64/Linux):            18
222             # (amd64/Linux) 2012-02-07: 26
223             # (amd64/Linux) 2013-02-12: 23; increased range to 10%
224             # (amd64/Linux) 2013-04-03: 26
225             # (amd64/Linux) 2013-09-11: 30; result of AMP patch
226             # Increased range to 20%.  peak-usage varies from 22 to 26,
227             #  depending on whether the old .hi file exists
228             # (amd64/Linux) 2013-09-11: 37; better arity analysis (weird)
229
230       compiler_stats_num_field('bytes allocated',
231           [(wordsize(32), 162457940, 10),
232             # 2011-06-28: 56380288  (x86/Linux)
233             # 2012-10-30: 111189536 (x86/Windows)
234             # 2013-11-13: 146626504 (x86/Windows, 64bit machine)
235             # 2014-01-22: 162457940 (x86/Linux)
236            (wordsize(64), 332702112, 5)]),
237             # (amd64/Linux) (28/06/2011):  73259544
238             # (amd64/Linux) (07/02/2013): 224798696
239             # (amd64/Linux) (02/08/2013): 236404384, increase from roles
240             # (amd64/Linux) (11/09/2013): 290165632, increase from AMP warnings
241             # (amd64/Linux) (22/11/2013): 308300448, GND via Coercible and counters for constraints solving
242                 # (amd64/Linux) (02/12/2013): 329795912, Coercible refactor
243             # (amd64/Linux) (11/02/2014): 308422280, optimize Coercions in simpleOptExpr
244             # (amd64/Linux) (23/05/2014): 324022680, unknown cause
245             # (amd64/Linux) (2014-07-17): 332702112, general round of updates
246
247       compiler_stats_num_field('max_bytes_used',
248           [(wordsize(32), 11202304, 20),
249             # 2011-06-28:  2247016 (x86/Linux) (28/6/2011):
250             #(some date):  5511604
251             # 2013-11-13:  7218200 (x86/Windows, 64bit machine)
252             # 2014-04-04: 11202304 (x86/Windows, 64bit machine)
253            (wordsize(64), 19821544, 20)]),
254             # (amd64/Linux, intree) (28/06/2011):  4032024
255             # (amd64/Linux, intree) (07/02/2013):  9819288
256             # (amd64/Linux)         (14/02/2013):  8687360
257             # (amd64/Linux)         (18/02/2013):  9397488
258             # (amd64/Linux)         (02/08/2013): 10742536, increase from roles
259             # (amd64/Linux)         (19/08/2013): 9211816,  decrease apparently from better eta reduction
260             # (amd64/Linux)         (11/09/2013): 12000480, increase from AMP warnings
261             #                                     933cdf15a2d85229d3df04b437da31fdfbf4961f
262             # (amd64/Linux)         (22/11/2013): 16266992, GND via Coercible and counters for constraints solving
263             # (amd64/Linux)         (12/12/2013): 19821544, better One shot analysis
264        only_ways(['normal'])
265       ],
266      compile,
267      [''])
268
269 test('T4007',
270      normal,
271      run_command,
272      ['$MAKE -s --no-print-directory T4007'])
273
274 test('T5030',
275      [compiler_stats_num_field('bytes allocated',
276           [(wordsize(32), 198573456, 10),
277            # previous:    196457520
278            # 2012-10-08:  259547660 (x86/Linux, new codegen)
279            # 2013-11-21:  198573456 (x86 Windows, 64 bit machine)
280            (wordsize(64), 409314320, 10)]),
281              # Previously 530000000 (+/- 10%)
282              # 17/1/13:   602993184  (x86_64/Linux)
283              #            (new demand analyser)
284              # 2013-06-08 538467496  (x86_64/Linux)
285              # ^ reason unknown
286              # 2013-08-02 454498592  (amd64/Linux)
287              # decrease from more aggressive coercion optimisations from roles
288              # 2013-11-12 397672152  (amd64/Linux)
289              # big decrease following better CSE and arity
290              # 2014-07-17 409314320  (amd64/Linux)
291              # general round of updates
292
293        only_ways(['normal'])
294       ],
295      compile,
296      ['-fcontext-stack=300'])
297
298 test('T5631',
299      [compiler_stats_num_field('bytes allocated',
300           [(wordsize(32), 346389856, 10),
301         # expected value: 392904228 (x86/Linux)
302         # 2014-04-04:     346389856 (x86 Windows, 64 bit machine)
303            (wordsize(64), 690742040, 5)]),
304         # expected value: 774595008 (amd64/Linux):
305         # expected value: 735486328 (amd64/Linux) 2012/12/12:
306         # expected value: 690742040 (amd64/Linux) Call Arity improvements
307        only_ways(['normal'])
308       ],
309      compile,
310      [''])
311
312 test('parsing001',
313      [compiler_stats_num_field('bytes allocated',
314           [(wordsize(32), 274000576, 10),
315            (wordsize(64), 587079016, 5)]),
316         # expected value: 587079016 (amd64/Linux)
317        only_ways(['normal']),
318       ],
319      compile_fail, [''])
320
321
322 test('T783',
323      [ only_ways(['normal']),  # no optimisation for this one
324       # expected value: 175,569,928 (x86/Linux)
325       compiler_stats_num_field('bytes allocated',
326           [(wordsize(32), 319179104, 5),
327             # 2012-10-08: 226907420 (x86/Linux)
328             # 2013-02-10: 329202116 (x86/Windows)
329             # 2013-02-10: 338465200 (x86/OSX)
330             # 2014-04-04: 319179104 (x86 Windows, 64 bit machine)
331            (wordsize(64), 640031840, 10)]),
332             # prev:       349263216 (amd64/Linux)
333             # 07/08/2012: 384479856 (amd64/Linux)
334             # 29/08/2012: 436927840 (amd64/Linux)
335             # 12/11/2012: 640324528 (amd64/Linux)
336             #   (OldCmm removed: not sure why this got worse, the
337             #    other perf tests remained about the same)
338             # 18/10/2013: 734038080 (amd64/Linux)
339             #   (fix for #8456)
340             # 24/10/2013: 654804144 (amd64/Linux)
341             #   (fix previous fix for #8456)
342             # 2014-07-17: 640031840 (amd64/Linux)
343             #   (general round of updates)
344       extra_hc_opts('-static')
345       ],
346       compile,[''])
347
348 test('T5321Fun',
349      [ only_ways(['normal']),  # no optimisation for this one
350        compiler_stats_num_field('bytes allocated',
351            [(wordsize(32), 344416344, 10),
352              # prev:       300000000
353              # 2012-10-08: 344416344 x86/Linux
354              #  (increase due to new codegen)
355             (wordsize(64), 694019152, 10)])
356              # prev:       585521080
357              # 29/08/2012: 713385808
358              #  (increase due to new codegen)
359              # 15/05/2013: 628341952
360              #  (reason for decrease unknown)
361              # 24/06/2013: 694019152
362              #  (reason for re-increase unknown)
363       ],
364       compile,[''])
365
366 test('T5321FD',
367      [ only_ways(['normal']),  # no optimisation for this one
368       compiler_stats_num_field('bytes allocated',
369           [(wordsize(32), 211699816, 10),
370             # prev:       213380256
371             # 2012-10-08: 240302920 (x86/Linux)
372             #  (increase due to new codegen)
373             # 2014-07-31: 211699816 (Windows) (-11%)
374             #  (due to better optCoercion, 5e7406d9, #9233)
375            (wordsize(64), 426960992, 10)])
376             # prev:       418306336
377             # 29/08/2012: 492905640
378             #  (increase due to new codegen)
379             # 15/05/2013: 406039584
380             #  (reason for decrease unknown)
381             # 08/06/2013: 476497048
382             #  (reason for increase unknown)
383             # before 2014-07-17: 441997096
384             #  (with -8%, still in range, hence cause not known)
385             # 2014-07-17: 426960992 (-11% of previous value)
386             #  (due to better optCoercion, 5e7406d9, #9233)
387       ],
388       compile,[''])
389
390 test('T5642',
391      [ only_ways(['normal']),
392        compiler_stats_num_field('bytes allocated',
393            [(wordsize(32), 650000000, 10),
394                      # sample from x86/Linux
395             (wordsize(64), 1358833928, 10)])
396             # prev:        1300000000
397             # 2014-07-17:  1358833928 (general round of updates)
398       ],
399       compile,['-O'])
400
401 test('T5837',
402      [ only_ways(['normal']),
403       compiler_stats_num_field('bytes allocated',
404           [(wordsize(32), 45520936 , 10),
405              # 40000000 (x86/Linux)
406              # 2013-11-13: 45520936 (x86/Windows, 64bit machine)
407            (wordsize(64), 86795752, 10)])
408              # sample: 3926235424 (amd64/Linux, 15/2/2012)
409              # 2012-10-02 81879216
410              # 2012-09-20 87254264 amd64/Linux
411              # 2013-09-18 90587232 amd64/Linux
412              # 2013-11-21 86795752 amd64/Linux, GND via Coercible and counters
413              #                                  for constraints solving
414       ],
415       compile_fail,['-ftype-function-depth=50'])
416
417 test('T6048',
418      [ only_ways(['optasm']),
419       compiler_stats_num_field('bytes allocated',
420           [(wordsize(32), 62618072, 10),
421             # prev:       38000000 (x86/Linux)
422             # 2012-10-08: 48887164 (x86/Linux)
423             # 2014-04-04: 62618072 (x86 Windows, 64 bit machine)
424            (wordsize(64), 125431448, 12)])
425              # 18/09/2012  97247032 amd64/Linux
426              # 16/01/2014 108578664 amd64/Linux (unknown, likely foldl-via-foldr)
427              # 18/01/2014  95960720 amd64/Linux Call Arity improvements
428              # 28/02/2014 105556793 amd64/Linux (unknown, tweak in base/4d9e7c9e3 resulted in change)
429              # 05/03/2014 110646312 amd64/Linux Call Arity became more elaborate
430              # 14/07/2014 125431448 amd64/Linux unknown reason. Even worse in GHC-7.8.3. *shurg*
431       ],
432       compile,[''])
433
434 test('T9020',
435      [ only_ways(['optasm']),
436       compiler_stats_num_field('bytes allocated',
437           [(wordsize(32), 343005716, 10),
438            # Original:    381360728
439            # 2014-07-31:  343005716 (Windows) (general round of updates)
440            (wordsize(64), 728263536, 10)])
441            # prev:        795469104
442            # 2014-07-17:  728263536 (general round of updates)
443       ],
444       compile,[''])