Update perf numbers for 32-bit This has not been done for ages
[ghc.git] / testsuite / tests / perf / compiler / all.T
1 def no_lint(name, opts):
2    opts.compiler_always_flags = \
3        filter(lambda opt: opt != '-dcore-lint' and opt != '-dcmm-lint', opts.compiler_always_flags)
4
5 setTestOpts(no_lint)
6
7
8 # Note [residency]
9 #
10 # Residency (peak_megabytes_allocated and max_bytes_used) is sensitive
11 # to when the major GC runs, which makes it inherently inaccurate.
12 # Sometime an innocuous change somewhere can shift things around such
13 # that the samples occur at a different time, and the residency
14 # appears to change (up or down) when the underlying profile hasn't
15 # really changed.
16 #
17 # However, please don't just ignore changes in residency.  If you see
18 # a change in one of these figures, please check whether it is real or
19 # not as follows:
20 #
21 #  * Run the test with old and new compilers, adding +RTS -h -i0.01
22 #    (you don't need to compile anything for profiling or enable profiling
23 #    libraries to get a heap profile).
24 #  * view the heap profiles, read off the maximum residency.  If it has
25 #    really changed, then you know there's an issue.
26
27 test('T1969',
28      [compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
29           [(wordsize(32), 17, 15),
30              # 2010-05-17 14 (x86/Windows)
31              #            15 (x86/OS X)
32              #            19 (x86/OS X)
33              # 2013-02-10 13 (x86/Windows)
34              # 2013-02-10 14 (x86/OSX)
35              # 2013-11-13 17 (x86/Windows, 64bit machine)
36            (wordsize(64), 30, 15)]),
37              #            28 (amd64/Linux)
38              #            34 (amd64/Linux)
39              # 2012-09-20 23 (amd64/Linux)
40              # 2012-10-03 25 (amd64/Linux if .hi exists)
41              # 2013-02-13 23, but unstable so increased to 10% range
42              # 2013-02-13 27, very unstable!
43              # 2013-09-11 30 (amd64/Linux)
44       compiler_stats_num_field('max_bytes_used',
45           [(platform('i386-unknown-mingw32'), 7295012, 20),
46                                  # 2010-05-17 5717704 (x86/Windows)
47                                  # 2013-02-10 5159748 (x86/Windows)
48                                  # 2013-02-10 5030080 (x86/Windows)
49                                  # 2013-11-13 7295012 (x86/Windows, 64bit machine)
50            (wordsize(32), 6149572, 1),
51              #            6707308 (x86/OS X)
52              # 2009-12-31 6149572 (x86/Linux)
53            (wordsize(64), 11,000,000, 20)]),
54                # looks like the peak is around ~10M, but we're
55                # unlikely to GC exactly on the peak.
56                # varies quite a lot with CLEANUP and BINDIST,
57                # hence 10% range.
58                # See Note [residency] to get an accurate view.
59       compiler_stats_num_field('bytes allocated',
60           [(platform('i386-unknown-mingw32'), 317975916, 5),
61                                  #            215582916 (x86/Windows)
62                                  # 2012-10-29 298921816 (x86/Windows)
63                                  # 2013-02-10 310633884 (x86/Windows)
64                                  # 2013-11-13 317975916 (x86/Windows, 64bit machine)
65            (wordsize(32), 322937684, 1),
66              #            221667908 (x86/OS X)
67              #            274932264 (x86/Linux)
68              # 2012-10-08 303930948 (x86/Linux, new codegen)
69              # 2013-02-10 322937684 (x86/OSX)
70            (wordsize(64), 698612512, 5)]),
71              # 17/11/2009 434845560 (amd64/Linux)
72              # 08/12/2009 459776680 (amd64/Linux)
73              # 17/05/2010 519377728 (amd64/Linux)
74              # 05/08/2011 561382568 (amd64/OS X)
75              # 16/07/2012 589168872 (amd64/Linux)
76              # 20/07/2012 595936240 (amd64/Linux)
77              # 23/08/2012 606230880 (amd64/Linux)
78              # 29/08/2012 633334184 (amd64/Linux)
79              #            (^ new codegen)
80              # 18/09/2012 641959976 (amd64/Linux)
81              # 19/10/2012 661832592 (amd64/Linux)
82              #            (^ -fPIC turned on)
83              # 23/10/2012 642594312 (amd64/Linux)
84              #            (^ -fPIC turned off again)
85              # 12/11/2012 658786936 (amd64/Linux)
86              #            (^ UNKNOWN REASON )
87              # 17/1/13:   667160192 (x86_64/Linux)
88              #            (^ new demand analyser)
89              # 18/10/2013 698612512 (x86_64/Linux)
90              #            (fix for #8456)
91       only_ways(['normal']),
92
93       extra_hc_opts('-dcore-lint -static')
94           # Leave -dcore-lint on for this one test, so that we have something
95           # that will catch a regression in -dcore-lint performance.
96       ],
97      compile,
98      [''])
99
100 # This one tests for the space leak in the native code generator,
101 # where it holds onto the entire asm output until the end.  The space
102 # leak reappears from time to time, so it's a good idea to have a test
103 # for it.  The residency of this test will jump by 10MB to 40MB or so
104 # on x86-64 if the space leak appears.
105
106 # Only run this one if we have an NCG:
107 if 'optasm' in config.compile_ways:
108    conf_3294 = only_ways(['normal'])
109 else:
110    conf_3294 = skip
111
112 test('T3294',
113      [
114       compiler_stats_num_field('max_bytes_used', # Note [residency]
115           [(wordsize(32), 24009436, 15),
116              #            17725476 (x86/OS X)
117              #            14593500 (Windows)
118              # 2013-02-10 20651576 (x86/Windows)
119              # 2013-02-10 20772984 (x86/OSX)
120              # 2013-11-13 24009436 (x86/Windows, 64bit machine)
121            (wordsize(64), 43224080, 15)]),
122              # prev:           25753192 (amd64/Linux)
123              # 29/08/2012:     37724352 (amd64/Linux)
124              #  (increase due to new codegen, see #7198)
125              # 13/13/2012:     44894544 (amd64/Linux)
126              #  (reason for increase unknown)
127              # 15/5/2013:      36904752  (amd64/Linux)
128              #  (reason for decrease unknown)
129              # 29/5/2013:      43224080  (amd64/Linux)
130              #  (reason for increase back to earlier value unknown)
131
132       compiler_stats_num_field('bytes allocated',
133           [(wordsize(32), 1478325844, 5),
134            # previous:     815479800  (x86/Linux)
135            # (^ increase due to new codegen, see #7198)
136            # 2012-10-08:  1373514844 (x86/Linux)
137            # 2013-11-13: 1478325844 (x86/Windows, 64bit machine)
138            (wordsize(64), 3083825616, 5)]),
139             # old:        1357587088 (amd64/Linux)
140             # 29/08/2012: 2961778696 (amd64/Linux)
141             # (^ increase due to new codegen, see #7198)
142             # 18/09/2012: 2717327208 (amd64/Linux)
143             # 08/06/2013: 2901451552 (amd64/Linux)
144             # (^ reason unknown)
145             # 12/12/2013: 3083825616 (amd64/Linux)
146             # (^ reason unknown)
147       conf_3294
148       ],
149      compile,
150      [''])
151
152 test('T4801',
153      [ # expect_broken(5224),
154        # temporarily unbroken (#5227)
155       compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
156           [(platform('x86_64-apple-darwin'), 58, 1),
157                            # expected value: 58 (amd64/OS X)
158            (wordsize(32), 30, 20),
159            (wordsize(64), 60, 20)]),
160             # prev:       50 (amd64/Linux)
161             # 19/10/2012: 64 (amd64/Linux)
162             #                (^ REASON UNKNOWN!)
163             # 12/11/2012: 49 (amd64/Linux)
164             #                (^ REASON UNKNOWN!)
165             # 28/8/13:    60 (amd64/Linux)
166             #                (^ REASON UNKNOWN!)
167
168       compiler_stats_num_field('bytes allocated',
169           [(platform('x86_64-apple-darwin'), 510938976, 5),
170                            # expected value: 510938976 (amd64/OS X):
171
172            (wordsize(32), 185669232, 10),
173         # expected value: 228286660 (x86/OS X)
174
175            (wordsize(64), 392409984, 10)]),
176             # prev:       360243576 (amd64/Linux)
177             # 19/10/2012: 447190832 (amd64/Linux) (-fPIC turned on)
178             # 19/10/2012: 392409984 (amd64/Linux) (-fPIC turned off)
179
180       compiler_stats_num_field('max_bytes_used',
181           [(platform('x86_64-apple-darwin'), 21657520, 5),
182            (wordsize(32), 11829000, 15),
183              #              9651948 (x86/OSX)
184              #              10290952 (windows)
185              # 2013-02-10   11071060 (x86/Windows)
186              # 2013-02-10:  11207828 (x86/OSX)
187              # (some date): 11139444
188              # 2013-11-13:  11829000 (x86/Windows, 64bit machine)
189            (wordsize(64), 21657520, 15)]),
190                 # prev:       20486256 (amd64/OS X)
191                 # 30/08/2012: 17305600--20391920 (varies a lot)
192                 # 19/10/2012: 26882576 (-fPIC turned on)
193                 # 19/10/2012: 18619912 (-fPIC turned off)
194                 # 24/12/2012: 21657520 (perhaps gc sampling time wibbles?)
195        only_ways(['normal']),
196        extra_hc_opts('-static')
197       ],
198      compile,
199      [''])
200
201 test('T3064',
202      [# expect_broken( 3064 ),
203       compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
204           [(wordsize(32), 18, 20),
205             # expected value: 14 (x86/Linux 28-06-2012):
206             # 2013-11-13:     18 (x86/Windows, 64bit machine)
207
208            (wordsize(64), 37, 20)]),
209             # (amd64/Linux):            18
210             # (amd64/Linux) 2012-02-07: 26
211             # (amd64/Linux) 2013-02-12: 23; increased range to 10%
212             # (amd64/Linux) 2013-04-03: 26
213             # (amd64/Linux) 2013-09-11: 30; result of AMP patch
214             # Increased range to 20%.  peak-usage varies from 22 to 26,
215             #  depending on whether the old .hi file exists
216             # (amd64/Linux) 2013-09-11: 37; better arity analysis (weird)
217
218       compiler_stats_num_field('bytes allocated',
219           [(wordsize(32), 146626504, 10),
220             # 2011-06-28: 56380288  (x86/Linux)
221             # 2012-10-30: 111189536 (x86/Windows) 
222             # 2013-11-13: 146626504 (x86/Windows, 64bit machine)
223            (wordsize(64), 329795912, 5)]),
224             # (amd64/Linux) (28/06/2011):  73259544
225             # (amd64/Linux) (07/02/2013): 224798696
226             # (amd64/Linux) (02/08/2013): 236404384, increase from roles
227             # (amd64/Linux) (11/09/2013): 290165632, increase from AMP warnings
228             # (amd64/Linux) (22/11/2013): 308300448, GND via Coercible and counters for constraints solving
229             # (amd64/Linux) (02/12/2013): 329795912, Coercible refactor
230
231       compiler_stats_num_field('max_bytes_used',
232           [(wordsize(32), 7218200 , 20),
233             # 2011-06-28: 2247016 (x86/Linux) (28/6/2011):
234             #(some date): 5511604
235             # 2013-11-13: 7218200 (x86/Windows, 64bit machine)
236       
237            (wordsize(64), 19821544, 20)]),
238             # (amd64/Linux, intree) (28/06/2011):  4032024
239             # (amd64/Linux, intree) (07/02/2013):  9819288
240             # (amd64/Linux)         (14/02/2013):  8687360
241             # (amd64/Linux)         (18/02/2013):  9397488
242             # (amd64/Linux)         (02/08/2013): 10742536, increase from roles
243             # (amd64/Linux)         (19/08/2013): 9211816,  decrease apparently from better eta reduction
244             # (amd64/Linux)         (11/09/2013): 12000480, increase from AMP warnings
245             #                                     933cdf15a2d85229d3df04b437da31fdfbf4961f
246             # (amd64/Linux)         (22/11/2013): 16266992, GND via Coercible and counters for constraints solving
247             # (amd64/Linux)         (12/12/2013): 19821544, better One shot analysis
248        only_ways(['normal'])
249       ],
250      compile,
251      [''])
252
253 test('T4007',
254      normal,
255      run_command,
256      ['$MAKE -s --no-print-directory T4007'])
257
258 test('T5030',
259      [compiler_stats_num_field('bytes allocated',
260           [(wordsize(32), 198573456, 10),
261            # previous:    196457520
262            # 2012-10-08:  259547660 (x86/Linux, new codegen)
263            # 2013-11-21:  198573456 (x86 Windows, 64 bit machine)
264            (wordsize(64), 397672152, 10)]),
265              # Previously 530000000 (+/- 10%)
266              # 17/1/13:   602993184  (x86_64/Linux)
267              #            (new demand analyser)
268              # 2013-06-08 538467496  (x86_64/Linux)
269              # ^ reason unknown
270              # 2013-08-02 454498592  (amd64/Linux)
271              # decrease from more aggressive coercion optimisations from roles
272              # 2013-11-12 397672152  (amd64/Linux)
273              # big decrease following better CSE and arity
274
275        only_ways(['normal'])
276       ],
277      compile,
278      ['-fcontext-stack=300'])
279
280 test('T5631',
281      [compiler_stats_num_field('bytes allocated',
282           [(wordsize(32), 392904228, 10),
283         # expected value: 392904228 (x86/Linux)
284            (wordsize(64), 735486328, 5)]),
285         # expected value: 774595008 (amd64/Linux):
286         # expected value: 735486328 (amd64/Linux) 2012/12/12:
287        only_ways(['normal'])
288       ],
289      compile,
290      [''])
291
292 test('parsing001',
293      [compiler_stats_num_field('bytes allocated',
294           [(wordsize(32), 274000576, 10),
295            (wordsize(64), 587079016, 5)]),
296         # expected value: 587079016 (amd64/Linux)
297        only_ways(['normal']),
298       ],
299      compile_fail, [''])
300
301
302 test('T783',
303      [ only_ways(['normal']),  # no optimisation for this one
304       # expected value: 175,569,928 (x86/Linux)
305       compiler_stats_num_field('bytes allocated',
306           [(wordsize(32), 333833658, 2),
307             # 2012-10-08: 226907420 (x86/Linux)
308             # 2013-02-10: 329202116 (x86/Windows)
309             # 2013-02-10: 338465200 (x86/OSX)
310            (wordsize(64), 654804144, 10)]),
311             # prev:       349263216 (amd64/Linux)
312             # 07/08/2012: 384479856 (amd64/Linux)
313             # 29/08/2012: 436927840 (amd64/Linux)
314             # 12/11/2012: 640324528 (amd64/Linux)
315             #   (OldCmm removed: not sure why this got worse, the
316             #    other perf tests remained about the same)
317             # 18/10/2013: 734038080 (amd64/Linux)
318             #   (fix for #8456)
319             # 24/10/2013: 654804144 (amd64/Linux)
320             #   (fix previous fix for #8456)
321       extra_hc_opts('-static')
322       ],
323       compile,[''])
324
325 test('T5321Fun',
326      [ only_ways(['normal']),  # no optimisation for this one
327        compiler_stats_num_field('bytes allocated',
328            [(wordsize(32), 344416344, 10),
329              # prev:       300000000
330              # 2012-10-08: 344416344 x86/Linux
331              #  (increase due to new codegen)
332             (wordsize(64), 694019152, 10)])
333              # prev:       585521080
334              # 29/08/2012: 713385808
335              #  (increase due to new codegen)
336              # 15/05/2013: 628341952
337              #  (reason for decrease unknown)
338              # 24/06/2013: 694019152
339              #  (reason for re-increase unknown)
340       ],
341       compile,[''])
342
343 test('T5321FD',
344      [ only_ways(['normal']),  # no optimisation for this one
345       compiler_stats_num_field('bytes allocated',
346           [(wordsize(32), 240302920, 10),
347             # prev:       213380256
348             # 2012-10-08: 240302920 (x86/Linux)
349             #  (increase due to new codegen)
350            (wordsize(64), 476497048, 10)])
351             # prev:       418306336
352             # 29/08/2012: 492905640
353             #  (increase due to new codegen)
354             # 15/05/2013: 406039584
355             #  (reason for decrease unknown)
356             # 08/06/2013: 476497048
357             #  (reason for increase unknown)
358       ],
359       compile,[''])
360
361 test('T5642',
362      [ only_ways(['normal']),
363        compiler_stats_num_field('bytes allocated',
364            [(wordsize(32), 650000000, 10),
365                      # sample from x86/Linux
366             (wordsize(64), 1300000000, 10)])
367       ],
368       compile,['-O'])
369
370 test('T5837',
371      [ only_ways(['normal']),
372       compiler_stats_num_field('bytes allocated',
373           [(wordsize(32), 45520936 , 10),
374              # 40000000 (x86/Linux)
375              # 2013-11-13: 45520936 (x86/Windows, 64bit machine)
376            (wordsize(64), 86795752, 10)])
377              # sample: 3926235424 (amd64/Linux, 15/2/2012)
378              # 2012-10-02 81879216
379              # 2012-09-20 87254264 amd64/Linux
380              # 2013-09-18 90587232 amd64/Linux
381              # 2013-11-21 86795752 amd64/Linux, GND via Coercible and counters
382              #                                  for constraints solving
383       ],
384       compile_fail,['-ftype-function-depth=50'])
385
386 test('T6048',
387      [ only_ways(['optasm']),
388       compiler_stats_num_field('bytes allocated',
389           [(wordsize(32), 48887164, 10),
390             # prev:       38000000 (x86/Linux)
391             # 2012-10-08: 48887164 (x86/Linux)
392            (wordsize(64), 97247032, 10)])
393              # 18/09/2012 97247032 amd64/Linux
394       ],
395       compile,[''])