Improve TcFlatten.flattenTyVar
[ghc.git] / testsuite / tests / perf / compiler / all.T
index a874866..765c48b 100644 (file)
@@ -1,3 +1,6 @@
+# Tests that call 'compiler_stats_num_field' are skipped when debugging is on.
+# See testsuite/driver/testlib.py.
+
 def no_lint(name, opts):
    opts.compiler_always_flags = \
        [opt for opt in opts.compiler_always_flags if opt != '-dcore-lint' and opt != '-dcmm-lint']
@@ -26,14 +29,16 @@ setTestOpts(no_lint)
 
 test('T1969',
      [compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
-          [(wordsize(32), 17, 15),
+          [(wordsize(32), 30, 15),
              # 2010-05-17 14 (x86/Windows)
              #            15 (x86/OS X)
              #            19 (x86/OS X)
              # 2013-02-10 13 (x86/Windows)
              # 2013-02-10 14 (x86/OSX)
              # 2013-11-13 17 (x86/Windows, 64bit machine)
-           (wordsize(64), 30, 20)]),
+             # 2015-07-11 21 (x86/Linux, 64bit machine) use +RTS -G1
+             # 2016-04-06 30 (x86/Linux, 64bit machine)
+           (wordsize(64), 55, 20)]),
              #            28 (amd64/Linux)
              #            34 (amd64/Linux)
              # 2012-09-20 23 (amd64/Linux)
@@ -43,6 +48,8 @@ test('T1969',
              # 2014-09-10 29 (amd64/Linux) post-AMP-cleanup
              # 2013-09-11 30, 10 (amd64/Linux)
              # 2013-09-11 30, 15 (adapt to Phab CI)
+             # 2015-06-03 41, (amd64/Linux) use +RTS -G1
+             # 2015-10-28 55, (amd64/Linux) emit Typeable at definition site
       compiler_stats_num_field('max_bytes_used',
           [(platform('i386-unknown-mingw32'), 5719436, 20),
                                  # 2010-05-17 5717704 (x86/Windows)
@@ -50,12 +57,14 @@ test('T1969',
                                  # 2013-02-10 5030080 (x86/Windows)
                                  # 2013-11-13 7295012 (x86/Windows, 64bit machine)
                                  # 2014-04-24 5719436 (x86/Windows, 64bit machine)
-           (wordsize(32), 5949188, 1),
+           (wordsize(32), 9093608, 1),
              #            6707308 (x86/OS X)
              # 2009-12-31 6149572 (x86/Linux)
              # 2014-01-22 6429864 (x86/Linux)
              # 2014-06-29 5949188 (x86/Linux)
-           (wordsize(64), 10000000, 15)]),
+             # 2015-07-11 6241108 (x86/Linux, 64bit machine) use +RTS -G1
+             # 2016-04-06 9093608 (x86/Linux, 64bit machine)
+           (wordsize(64), 15017528, 15)]),
              # 2014-09-10 10463640, 10  # post-AMP-update (somewhat stabelish)
                # looks like the peak is around ~10M, but we're
                # unlikely to GC exactly on the peak.
@@ -64,6 +73,8 @@ test('T1969',
                # See Note [residency] to get an accurate view.
              # 2014-09-14  9684256, 10 # try to lower it a bit more to match Phab's CI
              # 2014-11-03 10584344,    # ghcspeed reports higher numbers consistently
+             # 2015-07-11 11670120 (amd64/Linux)
+             # 2015-10-28 15017528 (amd64/Linux) emit typeable at definition site
       compiler_stats_num_field('bytes allocated',
           [(platform('i386-unknown-mingw32'), 301784492, 5),
                                  #            215582916 (x86/Windows)
@@ -71,14 +82,16 @@ test('T1969',
                                  # 2013-02-10 310633884 (x86/Windows)
                                  # 2013-11-13 317975916 (x86/Windows, 64bit machine)
                                  # 2014-04-04 301784492 (x86/Windows, 64bit machine)
-           (wordsize(32), 303300692, 1),
+           (wordsize(32), 344730660, 1),
              #            221667908 (x86/OS X)
              #            274932264 (x86/Linux)
              # 2012-10-08 303930948 (x86/Linux, new codegen)
              # 2013-02-10 322937684 (x86/OSX)
              # 2014-01-22 316103268 (x86/Linux)
              # 2014-06-29 303300692 (x86/Linux)
-           (wordsize(64), 630299456, 5)]),
+             # 2015-07-11 288699104 (x86/Linux, 64-bit machine) use +RTS -G1
+             # 2016-04-06 344730660 (x86/Linux, 64-bit machine)
+           (wordsize(64), 695430728, 5)]),
              # 17/11/2009 434845560 (amd64/Linux)
              # 08/12/2009 459776680 (amd64/Linux)
              # 17/05/2010 519377728 (amd64/Linux)
@@ -96,11 +109,16 @@ test('T1969',
              # 10/02/2014 660922376 (x86_64/Linux) call arity analysis
              # 17/07/2014 651626680 (x86_64/Linux) roundabout update
              # 10/09/2014 630299456 (x86_64/Linux) post-AMP-cleanup
+             # 03/06/2015 581460896 (x86_64/Linux) use +RTS -G1
+             # 28/10/2015 695430728 (x86_64/Linux) emit Typeable at definition site
       only_ways(['normal']),
 
-      extra_hc_opts('-dcore-lint -static')
+      extra_hc_opts('-dcore-lint -static'),
           # Leave -dcore-lint on for this one test, so that we have something
           # that will catch a regression in -dcore-lint performance.
+
+      # Use `+RTS -G1` for more stable residency measurements. Note [residency].
+      extra_hc_opts('+RTS -G1 -RTS')
       ],
      compile,
      [''])
@@ -120,7 +138,7 @@ else:
 test('T3294',
      [
       compiler_stats_num_field('max_bytes_used', # Note [residency]
-          [(wordsize(32), 26525384, 15),
+          [(wordsize(32), 28686588, 15),
              #            17725476 (x86/OS X)
              #            14593500 (Windows)
              # 2013-02-10 20651576 (x86/Windows)
@@ -128,8 +146,10 @@ test('T3294',
              # 2013-11-13 24009436 (x86/Windows, 64bit machine)
              # 2014-04-24 19882188 (x86/Windows, 64bit machine)
              # 2014-12-22 26525384 (x86/Windows) Increase due to silent superclasses?
+             # 2015-07-11 43196344 (x86/Linux, 64-bit machine) use +RTS -G1
+             # 2016-04-06 28686588 (x86/Linux, 64-bit machine)
 
-           (wordsize(64), 45000000, 20)]),
+           (wordsize(64), 50367248, 20)]),
              # prev:           25753192 (amd64/Linux)
              # 29/08/2012:     37724352 (amd64/Linux)
              #  (increase due to new codegen, see #7198)
@@ -143,6 +163,8 @@ test('T3294',
              #  (reason unknown, setting expected value somewhere in between)
              # 2015-01-22:     45000000  (amd64/Linux)
              #  varies between 40959592 and 52914488... increasing to +-20%
+             # 2015-10-28:     50367248  (amd64/Linux)
+             #  D757: emit Typeable instances at site of type definition
 
       compiler_stats_num_field('bytes allocated',
           [(wordsize(32), 1377050640, 5),
@@ -163,7 +185,10 @@ test('T3294',
             # 12/03/2014: 2705289664 (amd64/Linux) (more call arity improvements)
             # 2014-17-07: 2671595512 (amd64/Linux) (round-about update)
             # 2014-09-10: 2709595808 (amd64/Linux) post-AMP cleanup
-      conf_3294
+      conf_3294,
+
+      # Use `+RTS -G1` for more stable residency measurements. Note [residency].
+      extra_hc_opts('+RTS -G1 -RTS')
       ],
      compile,
      [''])
@@ -191,20 +216,23 @@ test('T4801',
 #            # 2014-10-13: 48 stricter seqDmdType
 
       compiler_stats_num_field('bytes allocated',
-          [(platform('x86_64-apple-darwin'), 464872776, 5),
-                           # expected value: 510938976 (amd64/OS X):
+          [(platform('x86_64-apple-darwin'), 465653312, 10),
+           # prev:       510938976 (amd64/OS X):
+           # 2015-12-11: 465653312 (amd64/OS X) Update, bump tolerance to +/-10%
 
-           (wordsize(32), 203962148, 10),
+           (wordsize(32), 239556572, 10),
            # prev:        185669232 (x86/OSX)
            # 2014-01-22:  211198056 (x86/Linux)
            # 2014-09-03:  185242032 (Windows laptop)
            # 2014-12-01:  203962148 (Windows laptop)
-           (wordsize(64), 382056344, 10)]),
+           # 2016-04-06:  239556572 (x86/Linux)
+           (wordsize(64), 434278248, 10)]),
             # prev:       360243576 (amd64/Linux)
             # 19/10/2012: 447190832 (amd64/Linux) (-fPIC turned on)
             # 19/10/2012: 392409984 (amd64/Linux) (-fPIC turned off)
             # 2014-04-08: 362939272 (amd64/Linux) cumulation of various smaller improvements over recent commits
             # 2014-10-08: 382056344 (amd64/Linux) stricter foldr2 488e95b
+            # 2015-10-28: 434278248 (amd64/Linux) emit Typeable at definition site
 
 ###################################
 # deactivated for now, as this metric became too volatile recently
@@ -231,20 +259,23 @@ test('T4801',
 #               # 10/09/2014: 19296544, 10 (post-AMP-cleanup)
 #               # 14/09/2014: 19585456, 15 (adapt to Phab CI env)
        only_ways(['normal']),
-       extra_hc_opts('-static')
-      ],
+       extra_hc_opts('-static'),
+
+       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
+       extra_hc_opts('+RTS -G1 -RTS')
+       ],
      compile,
      [''])
 
 test('T3064',
-     [# expect_broken( 3064 ),
-      compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
-          [(wordsize(32), 16, 20),
+     [compiler_stats_num_field('peak_megabytes_allocated',# Note [residency]
+          [(wordsize(32), 28, 20),
             # expected value: 14 (x86/Linux 28-06-2012):
             # 2013-11-13:     18 (x86/Windows, 64bit machine)
             # 2014-01-22:     23 (x86/Linux)
             # 2014-12-22:     23 (x86/Linux) death to silent superclasses
-           (wordsize(64), 32, 20)]),
+            # 2015-07-11      28 (x86/Linux, 64-bit machine) use +RTS -G1
+           (wordsize(64), 54, 20)]),
             # (amd64/Linux):            18
             # (amd64/Linux) 2012-02-07: 26
             # (amd64/Linux) 2013-02-12: 23; increased range to 10%
@@ -257,17 +288,19 @@ test('T3064',
             # (amd64/Linux) 2014-10-13: 38: Stricter seqDmdType
             # (amd64/Linux) 2014-12-22: 27: death to silent superclasses
             # (amd64/Linux) 2015-01-22: 32: Varies from 30 to 34, at least here.
+            # (amd64/Linux) 2015-06-03: 54: use +RTS -G1
 
       compiler_stats_num_field('bytes allocated',
-          [(wordsize(32), 122836340, 10),
+          [(wordsize(32), 153261024, 10),
             # 2011-06-28: 56380288  (x86/Linux)
             # 2012-10-30: 111189536 (x86/Windows)
             # 2013-11-13: 146626504 (x86/Windows, 64bit machine)
             # 2014-01-22: 162457940 (x86/Linux)
             # 2014-12-01: 162457940 (Windows)
             # 2014-12-22: 122836340 (Windows) Death to silent superclasses
+            # 2016-04-06: 153261024 (x86/Linux) probably wildcard refactor
 
-           (wordsize(64), 243670824, 5)]),
+           (wordsize(64), 287460128, 5)]),
             # (amd64/Linux) (28/06/2011):  73259544
             # (amd64/Linux) (07/02/2013): 224798696
             # (amd64/Linux) (02/08/2013): 236404384, increase from roles
@@ -284,6 +317,12 @@ test('T3064',
             # (Mac)         (18/12/2014): 350418600, improvements to flattener
             # (amd64/Linux) (22/12/2014): 243670824, Ha! Death to superclass constraints, makes
             #                                        much less code for Monad instances
+            # (amd64/Linux) (01/12/2015): 264952256, Regression due to Simon's wildcard refactor
+            #                                        Tracked as #11151.
+            # (amd64/Linux) (11/12/2015): 304344936, Regression due to TypeInType
+            #                                        Tracked as #11196
+            # (amd64/Linux) (15/4/2016): 287460128   Improvement due to using coercionKind instead
+            #                                        of zonkTcType (Trac #11882)
 
 ###################################
 # deactivated for now, as this metric became too volatile recently
@@ -310,7 +349,10 @@ test('T3064',
 #            # (amd64/Linux)         (19/09/2014): 18744992, unknown
 #            # (amd64/Linux)         2014-10-13:   13251728, Stricter seqDmdType
 
-       only_ways(['normal'])
+       only_ways(['normal']),
+
+       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
+       extra_hc_opts('+RTS -G1 -RTS')
       ],
      compile,
      [''])
@@ -322,14 +364,16 @@ test('T4007',
 
 test('T5030',
      [compiler_stats_num_field('bytes allocated',
-          [(wordsize(32), 227205560, 10),
+          [(wordsize(32), 345668088, 10),
            # previous:    196457520
            # 2012-10-08:  259547660 (x86/Linux, new codegen)
            # 2013-11-21:  198573456 (x86 Windows, 64 bit machine)
-           # 2014-12-10:  227205560 constraint solver got worse again; more agressive solving
+           # 2014-12-10:  227205560 constraint solver got worse again; more aggressive solving
            #                        of family-applications leads to less sharing, I think
+           # 2015-07-11:  201882912 reason unknown
+           # 2016-04-06:  345668088 likely TypeInType
 
-           (wordsize(64), 449042120, 10)]),
+           (wordsize(64), 653710960, 10)]),
              # Previously 530000000 (+/- 10%)
              # 17/1/13:   602993184  (x86_64/Linux)
              #            (new demand analyser)
@@ -343,26 +387,33 @@ test('T5030',
              # general round of updates
              # 2014-09-10 385152728  post-AMP-cleanup
              # 2014-12-08 340969128  constraint solver perf improvements (esp kick-out)
-             # 2014-12-10 449042120  constraint solver got worse again; more agressive solving
+             # 2014-12-10 449042120  constraint solver got worse again; more aggressive solving
              #                          of family-applications leads to less sharing, I think
+             # 2015-03-17 403932600  tweak to solver algorithm
+             # 2015-12-11 653710960  TypeInType (see #11196)
 
        only_ways(['normal'])
       ],
      compile,
-     ['-fcontext-stack=300'])
+     ['-freduction-depth=300'])
 
 test('T5631',
      [compiler_stats_num_field('bytes allocated',
-          [(wordsize(32), 390199244, 10),
+          [(wordsize(32), 570137436, 10),
         # expected value: 392904228 (x86/Linux)
         # 2014-04-04:     346389856 (x86 Windows, 64 bit machine)
         # 2014-12-01:     390199244 (Windows laptop)
-           (wordsize(64), 776121120, 5)]),
+        # 2016-04-06:     570137436 (amd64/Linux) many reasons
+           (wordsize(64), 1124068664, 5)]),
         # expected value: 774595008 (amd64/Linux):
         # expected value: 735486328 (amd64/Linux) 2012/12/12:
         # expected value: 690742040 (amd64/Linux) Call Arity improvements
         # 2014-09-09:     739704712 (amd64/Linux) AMP changes
         # 2014-11-04:     776121120 (amd64/Linux) new-flatten-skolems
+        # 2015-06-01:     812288344 (amd64/Linux) unknown cause
+        # 2015-12-11:     1128828928 (amd64/Linux) TypeInType (see #11196)
+        # 2015-12-21:     1198327544 (Mac) TypeApplications (will fix with #11196)
+        # 2015-03-18:     1124068664 (Mac) optimize Unify & zonking
        only_ways(['normal'])
       ],
      compile,
@@ -382,15 +433,16 @@ test('T783',
      [ only_ways(['normal']),  # no optimisation for this one
       # expected value: 175,569,928 (x86/Linux)
       compiler_stats_num_field('bytes allocated',
-          [(wordsize(32), 235002220, 5),
+          [(wordsize(32), 249332816, 5),
             # 2012-10-08: 226907420 (x86/Linux)
             # 2013-02-10: 329202116 (x86/Windows)
             # 2013-02-10: 338465200 (x86/OSX)
             # 2014-04-04: 319179104 (x86 Windows, 64 bit machine)
             # 2014-09-03: 223377364 (Windows) better specialisation, raft of core-to-core optimisations
             # 2014-12-22: 235002220 (Windows) not sure why
+            # 2016-04-06: 249332816 (x86/Linux, 64-bit machine)
 
-           (wordsize(64), 441932632, 10)]),
+           (wordsize(64), 488592288, 10)]),
             # prev:       349263216 (amd64/Linux)
             # 07/08/2012: 384479856 (amd64/Linux)
             # 29/08/2012: 436927840 (amd64/Linux)
@@ -403,8 +455,22 @@ test('T783',
             #   (fix previous fix for #8456)
             # 2014-07-17: 640031840 (amd64/Linux)
             #   (general round of updates)
-            # 2014-08-29: 441932632  (amd64/Linux)
+            # 2014-08-29: 441932632 (amd64/Linux)
             #   (better specialisation, raft of core-to-core optimisations)
+            # 2014-08-29: 719814352 (amd64/Linux)
+            #   (changed order of cmm block causes analyses to allocate much more,
+            #      but the changed order is slighly better in terms of runtime, and
+            #      this test seems to be an extreme outlier.)
+            # 2015-05-16: 548288760 (amd64/Linux)
+            #   (improved sequenceBlocks in nativeCodeGen, #10422)
+            # 2015-08-07: 470738808 (amd64/Linux)
+            #   (simplifying the switch plan code path for simple checks, #10677)
+            # 2015-08-28: 526230456 (amd64/Linux)
+            #    (D757: Emit Typeable instances at site of type definition)
+            # 2015-12-04: 1134085384 (amd64/Linux)
+            #    (D1535: Major overhaul of pattern match checker, #11162)
+            # 2016-02-03: 488592288 (amd64/Linux)
+            #    (D1795: Another overhaul of pattern match checker, #11374)
       extra_hc_opts('-static')
       ],
       compile,[''])
@@ -412,13 +478,14 @@ test('T783',
 test('T5321Fun',
      [ only_ways(['normal']),  # no optimisation for this one
        compiler_stats_num_field('bytes allocated',
-           [(wordsize(32), 206406188, 10),
+           [(wordsize(32), 279922360, 10),
              # prev:       300000000
              # 2012-10-08: 344416344 x86/Linux
              #  (increase due to new codegen)
              # 2014-09-03: 299656164     (specialisation and inlining)
              # 10/12/2014: 206406188     #  Improvements in constraint solver
-            (wordsize(64), 429921312, 10)])
+             # 2016-04-06: 279922360 x86/Linux
+            (wordsize(64), 565883176, 10)])
              # prev:       585521080
              # 29/08/2012: 713385808     #  (increase due to new codegen)
              # 15/05/2013: 628341952     #  (reason for decrease unknown)
@@ -428,19 +495,24 @@ test('T5321Fun',
              # 06/11/2014: 541287000     #  Simon's flat-skol changes to the constraint solver
              # 10/12/2014: 408110888     #  Improvements in constraint solver
              # 16/12/2014: 429921312     #  Flattener parameterized over roles
+             # 10/08/2015: 509921312
+             #  (undefined now takes an implicit parameter and GHC -O0 does
+             #  not recognize that the application is bottom)
+             # 11/12/2015: 565883176     #  TypeInType (see #11196)
       ],
       compile,[''])
 
 test('T5321FD',
      [ only_ways(['normal']),  # no optimisation for this one
       compiler_stats_num_field('bytes allocated',
-          [(wordsize(32), 211699816, 10),
+          [(wordsize(32), 250757460, 10),
             # prev:       213380256
             # 2012-10-08: 240302920 (x86/Linux)
             #  (increase due to new codegen)
             # 2014-07-31: 211699816 (Windows) (-11%)
             #  (due to better optCoercion, 5e7406d9, #9233)
-           (wordsize(64), 410895536, 10)])
+            # 2016-04-06: 250757460 (x86/Linux)
+           (wordsize(64), 532365376, 10)])
             # prev:       418306336
             # 29/08/2012: 492905640
             #  (increase due to new codegen)
@@ -454,19 +526,26 @@ test('T5321FD',
             #  (due to better optCoercion, 5e7406d9, #9233)
             # 2014-10-08  410895536
             #  (various changes; biggest improvements due to 949ad67 and FastString package ids)
+            # 2015-08-10: 470895536
+            #  (undefined now takes an implicit parameter and GHC -O0 does
+            #  not recognize that the application is bottom)
+            # 2015-10-28: 532365376
+            #  D757: emit Typeable instances at site of type definition
       ],
       compile,[''])
 
 test('T5642',
      [ only_ways(['normal']),
+       normal,
        compiler_stats_num_field('bytes allocated',
-           [(wordsize(32), 641085256, 10),
+           [(wordsize(32), 462677300, 10),
                      # sample from x86/Linux
             # prev:        650000000
-            # 2014-09-03:  753045568 
+            # 2014-09-03:  753045568
             # 2014-12-10:  641085256 Improvements in constraints solver
+            # 2016-04-06:  462677300
 
-            (wordsize(64), 1282916024, 10)])
+            (wordsize(64), 950004816, 10)])
             # prev:        1300000000
             # 2014-07-17:  1358833928 (general round of updates)
             # 2014-08-07:  1402242360 (caused by 1fc60ea)
@@ -477,20 +556,24 @@ test('T5642',
             #                          It's a bizarre program with LOTS of data types)
             # 2014-09-10:  1536924976 post-AMP-cleanup
             # 2014-12-10:  1282916024 Improvements in constraints solver
+            # 2015-10-28:  1412808976 Emit Typeable at definition site
+            # 2015-11-22:  1071915072 Use TypeLits in the metadata encoding
+            # 2016-02-08:  950004816  Pattern match checker re-rework
       ],
       compile,['-O'])
 
 test('T5837',
      [ only_ways(['normal']),
       compiler_stats_num_field('bytes allocated',
-          [(wordsize(32), 115905208, 10),
+          [(wordsize(32), 24199320, 10),
              # 40000000 (x86/Linux)
              # 2013-11-13:  45520936 (x86/Windows, 64bit machine)
              # 2014-09-03:  37096484 (Windows laptop, w/w for INLINABLE things
              # 2014-12-01: 135914136 (Windows laptop, regression see below)
-             # 2014-12-08  115905208  Constraint solver perf improvements (esp kick-out)
-           (wordsize(64), 231155640, 10)])
+             # 2014-12-08: 115905208  Constraint solver perf improvements (esp kick-out)
+             # 2016-04-06: 24199320  (x86/Linux, 64-bit machine) TypeInType
+
+           (wordsize(64), 48507272, 10)])
              # sample: 3926235424 (amd64/Linux, 15/2/2012)
              # 2012-10-02 81879216
              # 2012-09-20 87254264 amd64/Linux
@@ -504,20 +587,26 @@ test('T5837',
              # 2014-12-08 234790312 Constraint solver perf improvements (esp kick-out)
              # 2014-12-16 231155640 Mac  Flattener parameterized over roles;
              #                           some optimization
+             # 2015-03-17 53424304  Mac  Better depth checking; fails earlier
+             # 2015-06-09 38834096  Better "improvement"; I'm not sure whey it improves things
+             # 2015-12-11 43877520  amd64/Linux, TypeInType (see #11196)
+             # 2016-03-18 48507272  Mac, accept small regression in exchange
+             #                           for other optimisations
       ],
-      compile_fail,['-ftype-function-depth=50'])
+      compile_fail,['-freduction-depth=50'])
 
 test('T6048',
      [ only_ways(['optasm']),
       compiler_stats_num_field('bytes allocated',
-          [(wordsize(32), 49987836, 10),
+          [(wordsize(32), 55701280, 10),
             # prev:       38000000 (x86/Linux)
             # 2012-10-08: 48887164 (x86/Linux)
             # 2014-04-04: 62618072 (x86 Windows, 64 bit machine)
-            # 2014-09-03: 56315812 (x86 Windows, w/w for INLINEAVBLE)
+            # 2014-09-03: 56315812 (x86 Windows, w/w for INLINEABLE)
             # 2014-12-01: 49987836 (x86 Windows)
+            # 2016-04-06: 55701280 (x86/Linux, 64-bit machine)
 
-           (wordsize(64),  95946688, 12)])
+           (wordsize(64),  108225624, 12)])
              # 18/09/2012  97247032 amd64/Linux
              # 16/01/2014 108578664 amd64/Linux (unknown, likely foldl-via-foldr)
              # 18/01/2014  95960720 amd64/Linux Call Arity improvements
@@ -527,6 +616,7 @@ test('T6048',
              # 29/08/2014 108354472 amd64/Linux w/w for INLINABLE things
              # 14/09/2014  88186056 amd64/Linux BPP part1 change (more NoImplicitPreludes in base)
              # 08/01/2014  95946688 amd64/Linux Mostly 4c834fd. Occasional spikes to 103822120!
+             # 11/03/2016 108225624 amd64/Linux unknown reason sadly; likely gradual creep.
       ],
       compile,[''])
 
@@ -536,37 +626,58 @@ test('T9020',
           [(wordsize(32), 343005716, 10),
            # Original:    381360728
            # 2014-07-31:  343005716 (Windows) (general round of updates)
-           (wordsize(64), 680162056, 10)])
+           (wordsize(64), 698401736, 10)])
            # prev:        795469104
            # 2014-07-17:  728263536 (general round of updates)
            # 2014-09-10:  785871680 post-AMP-cleanup
            # 2014-11-03:  680162056 Further Applicative and Monad adjustments
+           # 2015-10-21:  786189008 Make stronglyConnCompFromEdgedVertices deterministic
+           # 2016-01-26:  698401736 improvement from using ExpTypes instead of ReturnTvs
+           # 2016-04-06:  852298336 Refactoring of CSE #11781
+           # 2016-04-06:  698401736 Use thenIO in Applicative IO
       ],
       compile,[''])
 
 test('T9675',
      [ only_ways(['optasm']),
-       compiler_stats_num_field('max_bytes_used',
-          [(wordsize(64), 22220552, 25),
+       compiler_stats_num_field('max_bytes_used', # Note [residency]
+          [(wordsize(64), 38776008, 15),
           # 2014-10-13    29596552
           # 2014-10-13    26570896   seq the DmdEnv in seqDmdType as well
           # 2014-10-13    18582472   different machines giving different results..
           # 2014-10-13    22220552   use the mean
-           (wordsize(32), 11220552, 25)
+          # 2015-06-21    28056344   switch to `+RTS -G1`, tighten bound to 15%
+          # 2015-10-28    23776640   emit Typeable at definition site
+          # 2015-12-11    30837312   TypeInType (see #11196)
+          # 2016-04-14    38776008   Final demand analyzer run
+           (wordsize(32), 18043224, 15)
+          # 2015-07-11    15341228   (x86/Linux, 64-bit machine) use +RTS -G1
+          # 2016-04-06    18043224   (x86/Linux, 64-bit machine)
           ]),
-       compiler_stats_num_field('peak_megabytes_allocated',
-          [(wordsize(64), 53, 15),
+       compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
+          [(wordsize(64), 144, 15),
           # 2014-10-13    66
           # 2014-10-13    58         seq the DmdEnv in seqDmdType as well
           # 2014-10-13    49         different machines giving different results...
           # 2014-10-13    53         use the mean
-            (wordsize(32), 25, 15)
+          # 2015-06-15    44         reduced for some reason
+          # 2015-06-21    105        switch to `+RTS -G1`
+          # 2015-12-04    88         new pattern checker (D1535)
+          # 2015-12-11    113        TypeInType (see #11196)
+          # 2016-04-14    144        Final demand analyzer run
+            (wordsize(32), 56, 15)
+          # 2015-07-11    56         (x86/Linux, 64-bit machine) use +RTS -G1
           ]),
        compiler_stats_num_field('bytes allocated',
-          [(wordsize(64), 544489040, 10)
+          [(wordsize(64), 608284152, 10)
           # 2014-10-13    544489040
-          ,(wordsize(32), 250000000, 10)
+          # 2015-10-28    608284152  emit Typeable at definition site
+          ,(wordsize(32), 279480696, 10)
+          # 2015-07-11    279480696  (x86/Linux, 64-bit machine) use +RTS -G1
           ]),
+
+       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
+       extra_hc_opts('+RTS -G1 -RTS')
       ],
      compile,
      [''])
@@ -574,11 +685,15 @@ test('T9675',
 test('T9872a',
      [ only_ways(['normal']),
        compiler_stats_num_field('bytes allocated',
-          [(wordsize(64), 2680733672, 5),
+          [(wordsize(64), 3352882080, 5),
           # 2014-12-10    5521332656    Initally created
           # 2014-12-16    5848657456    Flattener parameterized over roles
           # 2014-12-18    2680733672    Reduce type families even more eagerly
-           (wordsize(32), 1325592896, 5)
+          # 2015-12-11    3581500440    TypeInType (see #11196)
+          # 2016-04-07    3352882080    CSE improvements
+           (wordsize(32), 1740903516, 5)
+          # was           1325592896
+          # 2016-04-06    1740903516    x86/Linux
           ]),
       ],
      compile_fail,
@@ -587,11 +702,16 @@ test('T9872a',
 test('T9872b',
      [ only_ways(['normal']),
        compiler_stats_num_field('bytes allocated',
-          [(wordsize(64), 3480212048, 5),
+          [(wordsize(64), 4600233488, 5),
           # 2014-12-10    6483306280    Initally created
           # 2014-12-16    6892251912    Flattener parameterized over roles
           # 2014-12-18    3480212048    Reduce type families even more eagerly
-           (wordsize(32), 1700000000, 5)
+          # 2015-12-11    5199926080    TypeInType (see #11196)
+          # 2016-02-08    4918990352    Improved a bit by tyConRolesRepresentational
+          # 2016-04-06:   4600233488    Refactoring of CSE #11781
+           (wordsize(32), 2422750696, 5)
+          # was           1700000000
+          # 2016-04-06    2422750696    x86/Linux
           ]),
       ],
      compile_fail,
@@ -599,11 +719,16 @@ test('T9872b',
 test('T9872c',
      [ only_ways(['normal']),
        compiler_stats_num_field('bytes allocated',
-          [(wordsize(64), 2963554096, 5),
+          [(wordsize(64), 4306667256, 5),
           # 2014-12-10    5495850096    Initally created
           # 2014-12-16    5842024784    Flattener parameterized over roles
           # 2014-12-18    2963554096    Reduce type families even more eagerly
-           (wordsize(32), 1500000000, 5)
+          # 2015-12-11    4723613784    TypeInType (see #11196)
+          # 2016-02-08    4454071184    Improved a bit by tyConRolesRepresentational
+          # 2016-04-06:   4306667256    Refactoring of CSE #11781
+           (wordsize(32), 2257242896, 5)
+          # was           1500000000
+          # 2016-04-06    2257242896
           ]),
       ],
      compile_fail,
@@ -611,11 +736,18 @@ test('T9872c',
 test('T9872d',
      [ only_ways(['normal']),
        compiler_stats_num_field('bytes allocated',
-          [(wordsize(64), 687562440, 5),
+          [(wordsize(64), 506691240, 5),
           # 2014-12-18    796071864   Initally created
           # 2014-12-18    739189056   Reduce type families even more eagerly
           # 2015-01-07    687562440   TrieMap leaf compression
-           (wordsize(32), 328810212, 5)
+          # 2015-03-17    726679784   tweak to solver; probably flattens more
+          # 2016-02-08    534693648   Improved a bit by tyConRolesRepresentational
+          # 2016-03-18    506691240   optimize Unify & zonking
+           (wordsize(32), 264566040, 5)
+          # some date     328810212
+          # 2015-07-11    350369584
+          # 2015-12-11    566134504   TypeInType; see #11196
+          # 2016-04-06    264566040   x86/Linux, no idea, opened #11800
           ]),
       ],
      compile,
@@ -624,10 +756,55 @@ test('T9872d',
 test('T9961',
      [ only_ways(['normal']),
        compiler_stats_num_field('bytes allocated',
-          [(wordsize(64), 772510192, 5),
+          [(wordsize(64), 568526784, 5),
           # 2015-01-12    807117816   Initally created
-           (wordsize(32), 375647160, 5)
+          # 2015-spring   772510192   Got better
+          # 2015-05-22    663978160   Fix for #10370 improves it more
+          # 2015-10-28    708680480   x86_64/Linux   Emit Typeable at definition site
+          # 2015-12-17    745044392   x86_64/Darwin  Creep upwards
+          # 2016-03-20    519436672   x64_64/Linux   Don't use build desugaring for large lists (#11707)
+          # 2016-03-24    568526784   x64_64/Linux   Add eqInt* variants (#11688)
+           (wordsize(32), 275264188, 5)
+          # was           375647160
+          # 2016-04-06    275264188   x86/Linux
           ]),
       ],
      compile,
      ['-O'])
+
+test('T9233',
+    [ only_ways(['normal']),
+      compiler_stats_num_field('bytes allocated',
+        [(wordsize(64), 1066246248, 5),
+         # 2015-08-04    999826288     initial value
+         # 2016-04-14   1066246248     Final demand analyzer run
+         (wordsize(32),  515672240, 5)   # Put in your value here if you hit this
+         # 2016-04-06    515672240     (x86/Linux) initial value
+        ]),
+      extra_clean(['T9233a.hi', 'T9233a.o'])
+    ],
+    multimod_compile,
+    ['T9233', '-v0 -O2 -fno-spec-constr'])
+
+test('T10370',
+     [ only_ways(['optasm']),
+       compiler_stats_num_field('max_bytes_used', # Note [residency]
+          [(wordsize(64), 28256896, 15),
+          # 2015-10-22    19548720
+          # 2016-02-24    22823976   Changing Levity to RuntimeRep; not sure why this regresses though, even after some analysis
+          # 2016-04-14    28256896   final demand analyzer run
+           (wordsize(32), 11371496, 15),
+          # 2015-10-22    11371496
+          ]),
+       compiler_stats_num_field('peak_megabytes_allocated', # Note [residency]
+          [(wordsize(64), 101, 15),
+          # 2015-10-22     76
+          # 2016-04-14    101 final demand analyzer run
+           (wordsize(32),  39, 15),
+          # 2015-10-22     39
+          ]),
+       # Use `+RTS -G1` for more stable residency measurements. Note [residency].
+       extra_hc_opts('+RTS -G1 -RTS')
+     ],
+     compile,
+     [''])