2 years agoEfficient membership for home modules
Efficient membership for home modules

This changes the linear lookup in a list to an efficient
lookup in an IntMap. The linear lookup effectively made
the algorithm quadratic, which for a test case that I have
(5000 modules) introduced significant slowdown.

I ran 3 experiments to estimate the impact of this:

"No-op", profiled, just `:load`: P146, `186s`
"before", profiled, `:load` followed by 10x `:r`: P147, `315s`
"after", profiled, `:load` followed by 10x `:r`: P148, `250s`

Going by the math of `(250-186)/(315-186) = 50%` this is a 2x improvement
on `:r`.

Test Plan: ./validate

Reviewers: simonmar, austin, bgamari

Reviewed By: simonmar

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoTypos [ci skip]
Typos [ci skip]

2 years agoRevert "CoreTidy: Don't seq unfoldings"
Revert "CoreTidy: Don't seq unfoldings"

This reverts commit b3da6a6c3546562d5c5e83b8af5d3fd04c07e0c1 as it
reintroduces the original space leak.

2 years agoReset cc_pend_sc flag in dropDerivedCt
Reset cc_pend_sc flag in dropDerivedCt

I'd forgotten to reset this flag to True when dropping Derived
constraints, which led to Trac #13662.  Easily fixed.

2 years agoMake CallInfo into a data type with fields
Make CallInfo into a data type with fields

Simple refactor, no change in behaviour

2 years agoAdd regression test for Trac #13659
Add regression test for Trac #13659

2 years agoDon't warn about variable-free strict pattern bindings
Don't warn about variable-free strict pattern bindings

See Trac #13646 and the new
Note [Pattern bindings that bind no variables]

2 years agoUse mkSymCo in OptCoercion.wrapSym
Use mkSymCo in OptCoercion.wrapSym

Always use the smart constructor!   Richard and I came across
this omission when looking at something else.

2 years agotestsuite: Fix attribution of "Don't seq unfoldings" regression
testsuite: Fix attribution of "Don't seq unfoldings" regression

2 years agoTreat banged bindings as FunBinds
Treat banged bindings as FunBinds

This reworks the HsSyn representation to make banged variable patterns
(e.g. !x = e) be represented as FunBinds instead of PatBinds, adding a flag to
FunRhs to record the bang.

Fixes #13594.

Reviewers: austin, goldfire, alanz, simonpj

Reviewed By: simonpj

Subscribers: simonpj, rwbarton, thomie, mpickering

Differential Revision:

2 years agoDataflow: use IntSet for mkDepBlocks
Dataflow: use IntSet for mkDepBlocks

Using `IntSet` instead of `[Int]` is nicer since it gets rid of
appending to a list (in the backward case) and folding over it is

I also added a comment about how `mkDepBlocks` works since its
behavior can be a bit surprising at first sight (it took me some time
to see that it's doing the right thing ;)

Signed-off-by: Michal Terepeta <>
Test Plan: ./validate

Reviewers: austin, bgamari, simonmar

Reviewed By: bgamari

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoAdd a failing test for T13644
Add a failing test for T13644

The problem originates in TcPat.find_field_ty but I don't know how to
clearnly fix it.

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #13644

Differential Revision:

2 years agoMake XNegativeLiterals treat -0.0 as negative 0
Make XNegativeLiterals treat -0.0 as negative 0

Reviewers: austin, goldfire, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie, mpickering

GHC Trac Issues: #13211

Differential Revision:

2 years agoFix Raspberry Pi
Fix Raspberry Pi

This is two fold:

- We did not catch all ARM_ARCH_6 defines. Specifically not `6K` and
  `6KZ`, which is what llvm seems to use these days for
  `arm-none-linux-gnueabihf` (e.g. the triple that's used for raspbian
  as well). Without it, ghc assums we want to compile against some armv7
  system, which raspbian is not (it is armv6 for maximum compatibility
  across the pi family, compromising on using armv7 and up features).

- We stop forcing the -m and -arch flags on macOS. This is troublesome,
  as compiling for a 32bit system (e.g. raspberry pi, on a x86_64 macOS
  system results in the `-m64` flag being passed to to clang as well,
  which in turn figures out that you likely want 64bit, and rewrites
  your taret from `arm-none-linux-gnueabihf` to
  `aarch64-none-linux-gnueabihf`, which is definetly not what you want.

Reviewers: austin, hvr, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie, erikd

Differential Revision:

2 years agoOptimize casMutVar# for single-threaded RTS
David Feuer [Mon, 8 May 2017 21:44:37 +0000 (17:44 -0400)] 
Optimize casMutVar# for single-threaded RTS

The single-threaded RTS shouldn't actually need to use CAS to
implement `casMutVar#`; there are no other threads to coordinate

Reviewers: austin, bgamari, erikd, simonmar

Reviewed By: simonmar

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoOptCoercion: Ensure that TyConApps match in arity
Ben Gamari [Mon, 8 May 2017 21:40:50 +0000 (17:40 -0400)] 
OptCoercion: Ensure that TyConApps match in arity

Previously OptCoercion would potentially change the type of UnivCo
coercions of the shape,
co :: TyCon arg1 ... argN ~ TyCon arg1' ... argN'
where the arities of the left and right applications differ. In this
case we
would try to zip the two argument lists, meaning that one would get

One would think this could never happen since it implies we are
applying the
same TyCon to two different numbers of arguments. However, it does
arise in the
case of applications of the `Any` tycon, which arises from the
typechecker (in
`Data.Typeable.Internal`) where we end up with an `UnsafeCo`,
co :: Any (Any -> Any) Any ~ Any (Any -> Any)

Test Plan: Validate

Reviewers: simonpj, austin, goldfire

Reviewed By: simonpj

Subscribers: rwbarton, thomie

GHC Trac Issues: #13658

Differential Revision:

2 years agousers-guide: Fix a variety of warnings
Ben Gamari [Mon, 8 May 2017 21:35:05 +0000 (17:35 -0400)] 
users-guide: Fix a variety of warnings

Including #13665.

2 years ago[Docs] Prefer cost centre
[Docs] Prefer cost centre

There may be some subtlety I'm not seeing with the usage
of center vs centre. Otherwise this makes it more consistent
in the docs.
There's one instance in 8.0.2-notes.rst, but I'm not sure if
we want to modify it retroactively.

Test Plan: harbormaster?

Reviewers: bgamari, austin

Reviewed By: bgamari

Subscribers: rwbarton, thomie, simonmar

Differential Revision:

2 years agoBump Cabal submodule to the tag
Bump Cabal submodule to the tag

2 years agobase: Fix documentation for forkIOWithUnmask
base: Fix documentation for forkIOWithUnmask

forkIOUnmasked has been deprecated for several years now. Update reference to
it. See #4858 and #5546.

2 years agotestsuite: add new test for desugar warnings/errors with -fno-code
testsuite: add new test for desugar warnings/errors with -fno-code

Add a new (expect_broken) test T10600 that checks that the error:
Top-level bindings for unlifted types aren't allowed: is thrown when
compiling with -fno-code. This test currently fails because modules
compiled with -fno-code aren't desugared. There are several other errors
which can be thrown during desugaring that aren't tested for,
discoverable by grepping for "errDs".

Update .stderr files T8101 and T8101b. Presumably the compilation output
has changed slightly since they were written.

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #10600, #8101

Differential Revision:

2 years agoAdd regression test for #13651
Add regression test for #13651

Commit eb55ec2941239dee05afc6be818b129efe51660e ended up fixing #13651, so
let's add a regression test for it.

2 years agoAdd testsuite/timeout/TimeMe to .gitignore
Add testsuite/timeout/TimeMe to .gitignore

If you run `make test` on a non-Windows OS from a fresh build, the
testsuite will create an executable called `TimeMe` which `git` thinks is an
untracked file. Let's add it to `.gitignore` to avoid polluting the list of
untracked files.

Test Plan: Run `make test`, check if `TimeMe` is in the `git` untracked files

Reviewers: bgamari, austin

Reviewed By: bgamari

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoAdd regression tests for #12947, #13640
Add regression tests for #12947, #13640

Commit b4bdbe4957ae8b82c4cda5584203b44d3c4f004f (the fix for #12156)
wound up being the fix for #12947 and #13640 as well. This adds regression
tests for the latter two tickets to keep them fixed.

Test Plan: make test TEST="T12947 T13640"

Reviewers: bgamari, austin

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #12947, #13640

Differential Revision:

2 years agotweak to minimize diff against ocInit_ELF
tweak to minimize diff against ocInit_ELF

2 years agoTypos in comments [ci skip]
Typos in comments [ci skip]

2 years agoTcTypeable: Simplify
TcTypeable: Simplify

Simon pointed out that the zonk of the tyConKinds was redundant as tycon kinds
will never contain mutable variables. This allows us to remove tycon_kind.
Add a few commments clarifying the need to bring TyCon binders into scope before
typechecking bindings.

2 years agoCoreTidy: Don't seq unfoldings
CoreTidy: Don't seq unfoldings

Previously we would force uf_is_value and friends to ensure that we didn't
retain a reference to the pre-tidying template, resulting in a space leak.
Instead, we now just reinitialize these fields (despite the fact that they
should not have changed). This may result in a bit more computation, but most of
the time we won't ever evaluate them anyways, so the damage shouldn't be so bad.

See #13564.

2 years agohpc: Output a legend at the top of output files
hpc: Output a legend at the top of output files

Updates hpc submodule.

Reviewers: austin, bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #11799

Differential Revision:

2 years agoImplement sequential name lookup properly
Implement sequential name lookup properly

Previously we would run all the monadic actions and then
combine their results. This caused problems if later actions
raised errors but earlier lookups suceeded. We only want to run later
lookups if the earlier ones fail.

Fixes #13622

Reviewers: RyanGlScott, austin, bgamari, simonpj

Reviewed By: simonpj

Subscribers: simonpj, rwbarton, thomie

GHC Trac Issues: #13622

Differential Revision:

2 years agoFix markdown for new GitHub Flavored Markdown
Fix markdown for new GitHub Flavored Markdown

Delete whitespace between brackets.  Because Github Flavored Markdown
was changed [1].


Test Plan: build

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoAdd regression test for #11616
Add regression test for #11616

The code in #11616 has been working for a while (ever since 8.0.1),
so let's add a regression test for it to put the nail in the coffin.

Test Plan: make test TEST=T11616

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #11616

Differential Revision:

2 years agoFix comment for compact region
Fix comment for compact region

There were old module names:

 * Data.Compact -> GHC.Compact
 * Data.Compact.Internal -> GHC.Compact

This commit is for ghc-8.2 branch.

Test Plan: build

Reviewers: austin, bgamari, hvr, erikd, simonmar

Reviewed By: bgamari

Subscribers: rwbarton, thomie

Differential Revision:

2 years agouser-guide: fix links to compact region
user-guide: fix links to compact region

There were broken links in users_guide for compact region.

  * Data-Compact -> GHC-Compact
  * compact-@LIBRARY_compact_VERSION@ ->

This commit is for ghc-8.2 branch.

Test Plan: build

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoPass -ffrontend-opt arguments to frontend plugin in the correct order
Pass -ffrontend-opt arguments to frontend plugin in the correct order

Previously they were passed in the reverse order that they're specified
on the command line.

Add a haddock to frontendPluginOpts in DynFlags.hs.

Modify test frontend01 to cover the case of multiple -ffrontend-opt.

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #13632

Differential Revision:

2 years agoAdd an Eq instance for UniqSet
Add an Eq instance for UniqSet

I left that out by mistake, and it apparently breaks at least one
existing plugin.

Reviewers: christiaanb, austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoBump nofib submodule
Bump nofib submodule

2 years agorts: Fix MachO from D3527
rts: Fix MachO from D3527

We gave up on typedefing {Section,ObjectCode}FormatInfo structs but
MachO never got the memo.

2 years agoAdd test for #13320
Add test for #13320

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #13320

Differential Revision:

2 years agoComments only, about Typeable/TypeRep/KindRep
Comments only, about Typeable/TypeRep/KindRep

2 years agoRemove unused import
Remove unused import

2 years agoDeal with exceptions in dsWhenNoErrs
Deal with exceptions in dsWhenNoErrs

Gracious me.  Ever since this patch

  commit 374457809de343f409fbeea0a885877947a133a2
  Author: Jan Stolarek <>
  Date:   Fri Jul 11 13:54:45 2014 +0200

      Injective type families

TcRnMonad.askNoErrs has been wrong. It looked like this

   askNoErrs :: TcRn a -> TcRn (a, Bool)
   askNoErrs m
    = do { errs_var <- newTcRef emptyMessages
         ; res  <- setErrsVar errs_var m
         ; (warns, errs) <- readTcRef errs_var
         ; addMessages (warns, errs)
         ; return (res, isEmptyBag errs) }

The trouble comes if 'm' throws an exception in the TcRn monad.
Then 'errs_var is never read, so any errors are simply lost.

This mistake was then propgated into DsMonad.dsWhenNoErrs, where
it gave rise to Trac #13642.

Thank to Ryan for narrowing it down so sharply.

I did some refactoring, as usual.

2 years agoAbandon typedefing the {Section,ObjectCode}FormatInfo structs
Abandon typedefing the {Section,ObjectCode}FormatInfo structs

This is a follow-up to @angerman 's refactoring for ELF
that happened with e5e8646d3c6af82549b55fbee6764b087144a7ec
My previous commit a6675a93efe7cae2f206508047a39e73ce4e92a5
corrected a typedef redefinition issue with GCC v4.4
(which is pervasive with RHEL 6). Now the problem has resurfaced.

Instead of dancing after the different compiler's pipe, I decided
to eliminate the typedefs altogether and refer to the struct
namespace explicitly.

Added a note to describe why typedefs are not
applied on customisable structs.

Reviewers: austin, bgamari, erikd, simonmar

Subscribers: rwbarton, thomie, angerman

Differential Revision:

2 years agoTeach optCoecion about FunCo
Teach optCoecion about FunCo

I was seeing coercions like

   Nth 3 ((c2 -> c2) ; (c3 -> c4))

which made me realise that optCoercion was doing a bad job
of the (relatively new) FunCo.

In particular, opt_trans_rule needs a FunCo/FunCo case,
to go with the TyConAppCo/TyConAppCo case.  Easy.

No behavioural change, some coercions will get smaller

2 years agoImprove fixIO
Improve fixIO

Use `unsafeDupableInterleaveIO` to avoid `noDuplicate` calls. Switch
from `takeMVar` to `readMVar` as multiple entry with `takeMVar`
would lock things up.

Reviewers: austin, hvr, bgamari, simonmar

Reviewed By: simonmar

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoTest #13585 in typecheck/should_compile/T13585
Richard Eisenberg [Tue, 2 May 2017 03:16:20 +0000 (23:16 -0400)] 
2 years agoFix #13233 by checking for lev-poly primops
Richard Eisenberg [Sun, 23 Apr 2017 18:16:32 +0000 (14:16 -0400)] 
The implementation plan is all in Note [Detecting forced eta expansion]
in DsExpr.

2 years agoFix #13333 by fixing the covar's type in ctEvCoercion
Richard Eisenberg [Sun, 23 Apr 2017 14:24:30 +0000 (10:24 -0400)] 
The change is noted in Note [Given in ctEvCoercion]. This patch
also adds a bit more commentary to TcFlatten, documenting some
key invariants of the flattening algorithm. While in the area,
I also removed some stale commentary from TcCanonical.

2 years agoUse mkCastTy in subst_ty.
Use mkCastTy in subst_ty.

This allows mkCastTy to maintain invariants. Much like how
we use mkAppTy in subst_ty.

2 years agoShave the hair off mkCastTy.
Richard Eisenberg [Fri, 7 Apr 2017 15:38:37 +0000 (11:38 -0400)] 
Previously, mkCastTy went to great lengths to shove casts
around. But this doesn't seem to be necessary. However,
the reflexivity check currently in mkCastTy is not enough.
See the abortive Note [No reflexive casts in types]

2 years agoFix #13233 by checking for lev-poly primops
Richard Eisenberg [Tue, 2 May 2017 22:56:30 +0000 (18:56 -0400)] 
The implementation plan is all in Note [Detecting forced eta expansion]
in DsExpr.

Test Plan: ./validate, codeGen/should_fail/T13233

Reviewers: simonpj, austin, bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #13233

Differential Revision:

2 years agoTypos in manual and comments
Typos in manual and comments

2 years agoFix loss-of-SpecConstr bug
Fix loss-of-SpecConstr bug

This bug, reported in Trac #13623 has been present since

  commit b8b3e30a6eedf9f213b8a718573c4827cfa230ba
  Author: Edward Z. Yang <>
  Date:   Fri Jun 24 11:03:47 2016 -0700

      Axe RecFlag on TyCons.

SpecConstr tries not to specialise indefinitely, and had a
limit (see Note [Limit recursive specialisation]) that made
use of info about whether or not a data constructor was
"recursive".  This info vanished in the above commit, making
the limit fire much more often -- and indeed it fired in this
test case, in a situation where specialisation is /highly/

I refactored the test, to look instead at the number of
iterations of the loop of "and now specialise calls that
arise from the specialisation".  Actually less code, and
more robust.

I also added record field names to a couple of constructors,
and renamed RuleInfo to SpecInfo.

2 years agoFix a small Float-Out bug
Fix a small Float-Out bug

The float-out pass uses a heuristic based on strictness info.
But it was getting the strictness info mis-aligned; I'd forgotten
that strictness flags only apply to /value/ arguments.

This patch fixes it.  It has some surprising effects!

        Program           Size    Allocs   Runtime   Elapsed  TotalMem
        integer          -0.1%     +9.9%     +0.2%     +0.2%     +0.0%
           lcss          +0.0%     +0.0%    -11.9%    -11.9%     +0.0%
         queens          -0.2%    +29.0%      0.02      0.02     +0.0%
         simple          -0.1%    -22.6%    -21.7%    -21.7%     -3.6%
       treejoin          +0.0%     +0.0%    -12.3%    -12.6%     +0.0%
            Min          -0.2%    -22.6%    -21.7%    -21.7%    -10.0%
            Max          +3.3%    +29.0%    +19.2%    +19.2%    +50.0%
 Geometric Mean          +0.0%     +0.1%     -2.1%     -2.1%     +0.2%

The 'queens' and 'integer' allocation regressions are because, just
before let-floatting, we get
    \v -> foldr k z (case x of I# y -> build ..y..)

Becase of Note [Case MFEs] we don't float the build; so fusion
happens.  This increases allocation in queens because the build
isn't shared; but actaully runtime improves solidly.  Situation
is similar in integer, although I think runtime gets a bit worse.

The bug meant that, because of foldr's type arguments, the
mis-aligned strictness info meant that the entire (case x ...)
was floated, so fusion failed, but sharing happened.

This is all very artificial-benchmark-ish so I'm not losing sleep
over it.

I did see some runtime numbers increasd, but I think it's noise;
the differnce went away when I tried them one by one afterwards.

2 years agoJoin-point refactoring
Simon Peyton Jones [Thu, 27 Apr 2017 16:04:14 +0000 (17:04 +0100)] 
This commit has a raft of refactorings that improve the treatment
of join points.  I wasn't aiming so much as to gain performance as
to make the code simpler.

The two big things are these:

* Make mkDupableCont work for SimplBind as well.  This is simpler than
  I thought and quite neat.  (Luke had aready done StrictArg.)  That's
  a win in its own right. But also now /all/ continuations can be made

* Now that all continuations can be made dup-able, I could simplify
  mkDupableCont to return just one SimplCont, instead of two.
  That really is a worthwhile simlification!  Much easier to think

Plus a bunch of smaller things:

* Remove the join-arity that had been added to seIdSubst.
  It can be done more simply by putting it in DoneEx, which
  is the only constructor that actually needs it, and now we
  don't need the unsavoury isJoinIdInEnv_maybe.

* Re-order the handling of join points in Simplify, so that we don't need
  the horrible resultTypeOfDupableCont

* Add field names for StrictBind, StrictArg; and use them

* Define simplMonad.newJoinId, and use it

* Rename the seFloats field of SimplEnv to seLetFloats

Binary sizes seem to go up slightly, but allocations generally
improve, sometimes significantly.  I don't believe the runtime numbers
are reliable enough to draw any conclusions about

        Program           Size    Allocs   Runtime   Elapsed  TotalMem
          event          +1.1%    -12.0%     -0.2%     -0.2%     -8.7%
         fulsom          +1.9%    -11.8%    -10.0%    -10.0%     +5.3%
     last-piece          +2.3%     -1.2%     -1.2%     -1.2%     +0.0%
           mate          +0.9%     -1.4%     -0.6%     -0.7%     +0.0%
     multiplier          +1.5%     -8.3%      0.17      0.17     +0.0%
         parser          +2.0%     +1.0%      0.04      0.04     +0.0%
        parstof          +1.5%     +0.7%      0.01      0.01     +0.0%
          sched          +1.3%     -6.1%      0.03      0.03     +0.0%
         simple          +1.8%     +1.0%     +9.7%     +9.6%     +0.0%
            Min          +0.5%    -12.0%    -10.0%    -10.0%     -8.7%
            Max          +3.0%     +1.0%    +14.2%    +14.2%    +50.0%
 Geometric Mean          +1.4%     -0.4%     +0.3%     +0.4%     +0.5%

There's also a tests/perf/compiler improvement of 20% allocation in
T6048.  I think it's because we now generate smaller code.

2 years agoImprove SpecConstr when there are many opportunities
Improve SpecConstr when there are many opportunities

SpecConstr has -fspec-contr-count=N which limits the maximum
number of specialisations we make for any particular function.
But until now, if that limit was exceeded we discarded all the
candidates!  So adding a new specialisaiton opportunity (by
adding a new call site, or improving the optimiser) could result
in less specialisation and worse performance.

This patch instead picks the top N candidates, resulting in
less brittle behaviour.

See Note [Choosing patterns].

2 years agotestsuite: Bump allocations of T3064
testsuite: Bump allocations of T3064

This seems to have regressed due to,

    commit 5c602d2228d28530621cc6c94fbb736b13f474fb
    Author: Reid Barton <>
    Date:   Mon May 1 11:17:47 2017 -0400

        Avoid excessive space usage from unfoldings in CoreTidy

2 years agoBump array submodule
Bump array submodule

2 years ago[linker] Add ocInit/ocDeinit for ELF
[linker] Add ocInit/ocDeinit for ELF

This fills out the extended `info` structs, and will be subsequently
used in the arm and arm64 linker for elf.

Depends on: D3446, D3459

Reviewers: bgamari, austin, erikd, simonmar

Reviewed By: simonmar

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoAvoid excessive space usage from unfoldings in CoreTidy
Avoid excessive space usage from unfoldings in CoreTidy

Test Plan: validate

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: thomie

GHC Trac Issues: #13564

Differential Revision:

2 years agoPPC NCG: Lower MO_*_Fabs as PowerPC fabs instruction
Peter Trommler [Mon, 1 May 2017 15:17:25 +0000 (11:17 -0400)] 
In Phab:D3265 we introduced MO_F32_Fabs and MO_F64_Fabs.
This patch improves code generation by generating PowerPC fabs

Test Plan: run numeric/should_run/numrun015 or validate

Reviewers: austin, hvr, bgamari, simonmar, erikd

Reviewed By: erikd

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoMake LLVM output robust to -dead_strip on mach-o platforms
Moritz Angermann [Mon, 1 May 2017 15:13:36 +0000 (11:13 -0400)] 
This reverses commit 1686f30951292e94bf3076ce8b3eafb0bcbba91d (Mangle
.subsections_via_symbols away., D3287), and implements proper support
for `-dead_strip` via the injection of `.alt_entry` symbols for the
function definition pointing to the beginning of the prefix data.

This is the result of a lengthy discussion with rwbarton, and the
following llvm-dev mailing list thread:

The essential problem is that there is no reference from a function to
its info table.  This combined with `.subsections_via_symbols`, which
llvm emits unconditionally, leads the linker to believe that the prefix
data is unnecessary and stripping it away if presented with the
`-dead_strip` flag.

The NCG has for this purpose special $dsp (dead strip preventer) symbols
and adds a relocation to the end of each function body pointing to that
function's $dsp symbol. We cannot easily do the same thing via LLVM.
Instead we use the `.alt_entry` directive on the function symbol, which
causes the linker to treat it as a continuation of the previous symbol,
namely the $dsp symbol. As a result the function body will not be
separated from its info table.

Reviewers: erikd, austin, rwbarton, bgamari

Reviewed By: bgamari

Subscribers: michalt, thomie

Differential Revision:

2 years agoFix capitalization in message for #13609
Fix capitalization in message for #13609

I had meant to do this before merging but forgot.

2 years agotestsuite: Add test for #13609
testsuite: Add test for #13609

2 years agoIgnore ANN pragmas with no TH and no external interpreter.
Shea Levy [Mon, 1 May 2017 03:20:54 +0000 (23:20 -0400)] 
Reviewers: hvr, austin, bgamari, RyanGlScott

Reviewed By: bgamari

Subscribers: angerman, RyanGlScott, rwbarton, thomie

GHC Trac Issues: #13609

Differential Revision:

2 years agoDisable -Wcpp-undef for now
Ben Gamari [Mon, 1 May 2017 02:41:38 +0000 (22:41 -0400)] 
We at very least need to upstream a patch for the time submodule to compile on

2 years agoUpdate broken nm message
Alex Biehl [Sun, 30 Apr 2017 14:24:30 +0000 (16:24 +0200)] 
9373994acaf1b73fe0e7cf8e03594c63cec8d235 killed the `--with-*` arguments for `configure`.

2 years agotestsuite: Widen acceptance window of T13379
testsuite: Widen acceptance window of T13379

2 years agoRemove unused tidyOccNames and update Note
Joachim Breitner [Sun, 30 Apr 2017 07:29:49 +0000 (09:29 +0200)] 
addressing rwbarton’s concerns in

Differential Revision:

2 years agoPrefer #if defined to #ifdef
Prefer #if defined to #ifdef

Our new CPP linter enforces this.

2 years agoEnable new warning for fragile/incorrect CPP #if usage
Erik de Castro Lopo [Tue, 4 Apr 2017 19:53:46 +0000 (05:53 +1000)] 
The C code in the RTS now gets built with `-Wundef` and the Haskell code
(stages 1 and 2 only) with `-Wcpp-undef`. We now get warnings whereever
`#if` is used on undefined identifiers.

Test Plan: Validate on Linux and Windows

Reviewers: austin, angerman, simonmar, bgamari, Phyx

Reviewed By: bgamari

Subscribers: thomie, snowleopard

Differential Revision:

2 years agoImprove code generation for conditionals
Improve code generation for conditionals

This patch in in preparation for the fix to Trac #13397

The code generator has a special case for
  case tagToEnum (a>#b) of
    False -> e1
    True  -> e2

but it was not doing nearly so well on
  case a>#b of
    DEFAULT -> e1
    1#      -> e2

This patch arranges to behave essentially identically in
both cases.  In due course we can eliminate the special
case for tagToEnum#, once we've completed Trac #13397.

The changes are:

* Make CmmSink swizzle the order of a conditional where necessary;
  see Note [Improving conditionals] in CmmSink

* Hack the general case of StgCmmExpr.cgCase so that it use
  NoGcInAlts for conditionals.  This doesn't seem right, but it's
  the same choice as the tagToEnum version. Without it, code size
  increases a lot (more heap checks).

  There's a loose end here.

* Add comments in CmmOpt.cmmMachOpFoldM

2 years agoRe-engineer caseRules to add tagToEnum/dataToTag
Re-engineer caseRules to add tagToEnum/dataToTag

See Note [Scrutinee Constant Folding] in SimplUtils

* Add cases for tagToEnum and dataToTag. This is the main new
  bit.  It allows the simplifier to remove the pervasive uses
  of     case tagToEnum (a > b) of
            False -> e1
            True  -> e2
  and replace it by the simpler
         case a > b of
            DEFAULT -> e1
            1#      -> e2
  See Note [caseRules for tagToEnum]
  and Note [caseRules for dataToTag] in PrelRules.

* This required some changes to the API of caseRules, and hence
  to code in SimplUtils.  See Note [Scrutinee Constant Folding]
  in SimplUtils.

* Avoid duplication of work in the (unusual) case of
     case BIG + 3# of b
       DEFAULT -> e1
       6#      -> e2

  Previously we got
     case BIG of
       DEFAULT -> let b = BIG + 3# in e1
       3#      -> let b = 6#       in e2

  Now we get
     case BIG of b#
       DEFAULT -> let b = b' + 3# in e1
       3#      -> let b = 6#      in e2

* Avoid duplicated code in caseRules

A knock-on refactoring:

* Move Note [Word/Int underflow/overflow] to Literal, as
  documentation to accompany mkMachIntWrap etc; and get
  rid of PrelRuls.intResult' in favour of mkMachIntWrap

2 years agoMove dataConTagZ to DataCon
Simon Peyton Jones [Tue, 7 Mar 2017 13:28:34 +0000 (13:28 +0000)] 
Just a simple refactoring to remove duplication

2 years agonativeGen: Use SSE2 SQRT instruction
nativeGen: Use SSE2 SQRT instruction

Reviewers: austin, dfeuer

Reviewers: austin, dfeuer

GHC Trac Issues: #13629

Differential Revision:

2 years agoCSE: Fix cut and paste error
CSE: Fix cut and paste error

extendCSRecEnv took the map to be extended from cs_map instead of
cs_rec_map.  Oops!

Test Plan: Validate

Reviewers: simonpj, austin

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoUse memcpy in cloneArray
Ben Gamari [Fri, 28 Apr 2017 17:24:47 +0000 (13:24 -0400)] 
While looking at #13615 I noticed that there was this strange open-coded
memcpy in the definition of the cloneArray macro. I don't see why this
should be preferable to memcpy.

Test Plan: Validate, particularly focusing on array operations

Reviewers: simonmar, tibbe, austin, alexbiehl

Reviewed By: tibbe, alexbiehl

Subscribers: alexbiehl, rwbarton, thomie

Differential Revision:

2 years agoMake the tyvars in TH-reified data family instances uniform
Make the tyvars in TH-reified data family instances uniform

It turns out we were using two different sets of type variables when
reifying data family instances in Template Haskell. We were using the
tyvars quantifying over the instance itself for the LHS, but using the
tyvars quantifying over the data family instance constructor for the
RHS. This commit uses the instance tyvars for both the LHS and the RHS,
fixing #13618.

Test Plan: make test TEST=T13618

Reviewers: goldfire, austin, bgamari

Reviewed By: goldfire, bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #13618

Differential Revision:

2 years agoAdd regression test for #12104
Add regression test for #12104

Commit 2f9f1f86849ebc18af409c9b3fd809c9cd464021
(#13487) fixes #12104 as well. This adds a regression test for the
program reported in #12104 to keep it fixed.

Test Plan: make test TEST=T12104

Reviewers: bgamari, austin

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #12104

Differential Revision:

2 years agoget-win32-tarballs: Grab perl tarball from, not GitHub
get-win32-tarballs: Grab perl tarball from, not GitHub

Reviewers: austin, dfeuer

Reviewed By: dfeuer

Subscribers: Phyx, rwbarton, thomie

Differential Revision:

2 years agoBe a bit more eager to inline in a strict context
Be a bit more eager to inline in a strict context

If we see f (g x), and f is strict, we want to be a bit more eager to
inline g, because it may well expose an eval (on x perhaps) that can
be eliminated or shared.

I saw this in nofib boyer2, function RewriteFuns.onewayunify1.  It
showed up as a consequence of the preceding patch that makes the
simplifier do less work (Trac #13379).  We had

   f d (g x)

where f was a class-op. Previously we simplified both d and
(g x) with a RuleArgCtxt (making g a bit more eager to inline).
But now we simplify only d that way, then fire the rule, and
only then simplify (g x).  Firing the rule produces a strict
funciion, so we want to make a strict function encourage
inlining a bit.

2 years agoCure exponential behaviour in the simplifier
Simon Peyton Jones [Wed, 26 Apr 2017 16:31:36 +0000 (17:31 +0100)] 
This patch nails a Bad Bug exposed in Trac #13379. Roughly,
a deeply-nested application like
   f (f (f ....) ) )
could make the simplifier go exponential -- without producing
an exponential-sized result!

The reason was that we
  - simplified a (big) function argument
  - then decided to inline the function
  - then preInilneUnconditionally the argument
  - and then re-simplified the big argument

And if the "big argument" itself had a similar structure
things could get very bad.

Once I'd understood, it was easy to fix:

* See Note Note [Avoiding exponential behaviour] for an overview

* The key change is that Simplify.simplLam now as a case for
  (isSimplified dup). This is what removes the perf bug.

* But I also made simplCast more parsimonious about simplifying,
  avoiding doing so when the coercion is Refl

* And similarly I now try to avoid simplifying arguments
  where possible before applying rules.
  See Note [Trying rewrite rules]

The latter two points tackle common cases, and in those cases make the
simplifier take fewer iterations.

2 years agoEta expansion and join points
Simon Peyton Jones [Wed, 26 Apr 2017 15:57:15 +0000 (16:57 +0100)] 
CoreArity.etaExpand tried to deal with eta-expanding expressions
with join points.  For example
    let j x = e in \y. b

But it is hard to eta-expand this in the "no-crap" way described in
Note [No crap in eta-expanded code], becuase it would mean pushing
the "apply to y" into the join RHS, and changing its type. And the
join might be recursive, and it might have an unfolding.

Moreover in elaborate cases like this I don't think we need the
no-crap thing.  So for now I'm simplifying the code by generating
   \z. (let j x = e in \y. b) z

Let's see if that gives rise to any problems.
See Note [Eta expansion for join points]

2 years agoComments only
Comments only

2 years agoComments only
Simon Peyton Jones [Tue, 25 Apr 2017 12:15:44 +0000 (13:15 +0100)] 
2 years agoA bit more tcTrace
Simon Peyton Jones [Tue, 25 Apr 2017 12:15:04 +0000 (13:15 +0100)] 
2 years agoComments and tiny refactoring
Simon Peyton Jones [Fri, 21 Apr 2017 12:12:15 +0000 (13:12 +0100)] 
2 years agoBump process to 1.6
Bump process to 1.6

Also bumps Cabal submodule due to version bound bump.

2 years agoUpdate Cabal submodule, with necessary wibbles.
Edward Z. Yang [Wed, 26 Apr 2017 19:26:56 +0000 (15:26 -0400)] 
Test Plan: validate

Reviewers: bgamari, austin

Reviewed By: bgamari

Subscribers: rwbarton, thomie

Differential Revision:

2 years agoUpdate hsc2hs submodule to 0.68.2
Update hsc2hs submodule to 0.68.2

2 years agoAdd instances for Data.Ord.Down
Add instances for Data.Ord.Down

Namely `Num`, `Functor`, `Applicative`, `Monad`, `Semigroup` and
`Monoid` for `Data.Ord.Down` (#13097).

Reviewers: austin, hvr, bgamari, RyanGlScott

Reviewed By: bgamari, RyanGlScott

Subscribers: RyanGlScott, rwbarton, thomie

GHC Trac Issues: #13097

Differential Revision:

2 years agoDocument mkWeak#
Ben Gamari [Tue, 25 Apr 2017 22:39:58 +0000 (18:39 -0400)] 
Reviewers: simonmar, austin

Reviewed By: simonmar

Subscribers: RyanGlScott, rwbarton, thomie

GHC Trac Issues: #10640, #13611

Differential Revision:

2 years agoOnly pretty-print binders in closed type families with -fprint-explicit-foralls
Ryan Scott [Tue, 25 Apr 2017 22:38:34 +0000 (18:38 -0400)] 
Previously, we were unconditionally pretty-printing all type variable
binders when pretty-printing closed type families (e.g., in the output
of `:info` in GHCi). This threw me for a loop, so let's guard this behind
the `-fprint-explicit-foralls` flag.

Test Plan: make test TEST=T13420

Reviewers: goldfire, austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie

GHC Trac Issues: #13420

Differential Revision:

2 years agoAdd backup url and sync support for Win32 tarball script
Tamar Christina [Tue, 25 Apr 2017 22:38:14 +0000 (18:38 -0400)] 
This imports @bgamari's sync script into the mirror script
and adds a backup url for packages.

The idea is that the URLs won't need updating when updating
the tarballs from now on.

It will first try,
failing that it'll try

Test Plan: try new command `mk/ sync`

Reviewers: austin, bgamari

Reviewed By: bgamari

Subscribers: rwbarton, thomie, bgamari

Differential Revision:

2 years agoPPC NCG: Implement callish prim ops
PPC NCG: Implement callish prim ops

Provide PowerPC optimised implementations of callish prim ops.

The generic implementation of quotient remainder prim ops uses
a division and a remainder operation. There is no remainder on
PowerPC and so we need to implement remainder "by hand" which
results in a duplication of the divide operation when using the
generic code.

Avoid this duplication by implementing the prim op in the native
code generator.

Use PowerPC's instructions for long multiplication.

Addition and subtraction
Use PowerPC add/subtract with carry/overflow instructions

MO_Clz and MO_Ctz
Use PowerPC's CNTLZ instruction and implement count trailing
zeros using count leading zeros

Implement an algorithm given by Henry Warren in "Hacker's Delight"
using PowerPC divide instruction. TODO: Use long division instructions
when available (POWER7 and later).

Test Plan: validate on AIX and 32-bit Linux

Reviewers: simonmar, erikd, hvr, austin, bgamari

Reviewed By: erikd, hvr, bgamari

Subscribers: trofi, kgardas, thomie

Differential Revision:

2 years agoconfigure: Kill off FP_ARG_WITH_*
Ben Gamari [Tue, 25 Apr 2017 22:32:24 +0000 (18:32 -0400)] 
This replaces the --with-* configure flags with the usual autoconf
environment variables, as suggested by #13583.

Test Plan: Configure on various platforms

Reviewers: hvr, trofi, thomie, austin

Reviewed By: trofi

Subscribers: rwbarton, erikd

GHC Trac Issues: #13583

Differential Revision:

2 years agoRevert "Remove special casing of Windows in generic files"
Ben Gamari [Tue, 25 Apr 2017 13:28:40 +0000 (09:28 -0400)] 
This commit didn't consider the fact that binary distributions on Windows must
have relative toolchain paths. This caused #13560.

This reverts commit 48385cb2fc295eb8af9188cbe140142c1807d5a7 (except for a
helpful comment).

2 years agoDon't describe tuple sections as "Python-style"
Chris Martin [Sat, 22 Apr 2017 22:26:22 +0000 (18:26 -0400)] 
(cherry picked from commit 960589e89da3dbf60e88042d7e064ad4a98fb2ff)

2 years agoDon't setProgramDynFlags on every :load
Simon Marlow [Thu, 30 Mar 2017 09:31:08 +0000 (10:31 +0100)] 
setProgramDynFlags invalidates the whole module graph, forcing
everything to be re-summarised (including preprocessing) on every

Looks like this was a bad regression in 8.0, but we didn't notice
because there was no test for it.  Now there is!

Test Plan:
* validate
* new unit test

Reviewers: bgamari, triple, austin, niteria, erikd, jme

Subscribers: rwbarton, thomie

Differential Revision:

2 years agocore-spec: Simplify the handling of LetRec
Joachim Breitner [Tue, 18 Apr 2017 20:33:38 +0000 (16:33 -0400)] 
We do not need to keep an enrivonment around to implement letrec, as
long as we only do call-by-name. Instead, evaluate letrec by
substituting for all the variables with their RHS wrapped in the letrec

Since nothing adds to the enrivonment any more, there is no need for a
S_Var rule.

Differential Revision: