[7/8] Add pass_parallelize_loops_oacc_kernels to pass_oacc_kernels

Hi!

On Tue, 25 Nov 2014 12:42:28 +0100, Tom de Vries <Tom_deVries@mentor.com> wrote:
> On 15-11-14 18:23, Tom de Vries wrote:
> > On 15-11-14 13:14, Tom de Vries wrote:
> >> I'm submitting a patch series with initial support for the oacc kernels
> >> directive.
> >>
> >> The patch series uses pass_parallelize_loops to implement parallelization of
> >> loops in the oacc kernels region.
> >>
> >> The patch series consists of these 8 patches:
> >> ...
> >>      1  Expand oacc kernels after pass_build_ealias
> >>      2  Add pass_oacc_kernels
> >>      3  Add pass_ch_oacc_kernels to pass_oacc_kernels
> >>      4  Add pass_tree_loop_{init,done} to pass_oacc_kernels
> >>      5  Add pass_loop_im to pass_oacc_kernels
> >>      6  Add pass_ccp to pass_oacc_kernels
> >>      7  Add pass_parloops_oacc_kernels to pass_oacc_kernels
> >>      8  Do simple omp lowering for no address taken var
> >> ...
> >
> > This patch adds:
> > - a specialized version of pass_parallelize_loops called
> >      pass_parloops_oacc_kernels to pass group pass_oacc_kernels, and
> > - relevant test-cases.
> >
> > The pass only handles loops that are in a kernels region, and skips over bits of
> > pass_parallelize_loops that are already done for oacc kernels.
> >
> > The pass reintroduces the use of omp_expand_local, I haven't managed to make it
> > work yet using the external pass pass_expand_omp_ssa.
> >
> > An obvious limitation of the patch is the fact that we copy over the clauses
> > from the kernels directive to the generated parallel directive. We'll need to do
> > something more intelligent here, f.i. setting vector_length based on the
> > parallelization factor.
> >
> > Another limitation is that the pass still needs -ftree-parallelize-loops to
> > trigger.
> >
> 
> Updated for using pass_copyprop instead of pass_ccp in pass_oacc_kernels.
> 
> Bootstrapped and reg-tested as before.
> 
> OK for trunk?

Committed to gomp-4_0-branch in r222285:

commit 74e09b9dbbe43321fb20b0174f926893bf2111bc
Author: tschwinge <tschwinge@138bc75d-0d04-0410-961f-82ee72b054a4>
Date:   Tue Apr 21 20:06:16 2015 +0000

    Add pass_parallelize_loops_oacc_kernels to pass_oacc_kernels

    	gcc/
    	* passes.def: Add pass_parallelize_loops_oacc_kernels in pass group
    	pass_oacc_kernels.
    	* tree-parloops.c (create_parallel_loop, gen_parallel_loop): Add
    	function parameters region_entry and bool oacc_kernels_p.  Handle
    	oacc_kernels_p.
    	Call create_parallel_loop with additional args.
    	(parallelize_loops): Add function parameter oacc_kernels_p.  Calculate
    	dominance info.  Skip loops that are not in a kernels region. Call
    	gen_parallel_loop with additional args.
    	(pass_parallelize_loops::execute): Call parallelize_loops with false
    	argument.
    	(pass_data_parallelize_loops_oacc_kernels): New pass_data.
    	(class pass_parallelize_loops_oacc_kernels): New pass.
    	(pass_parallelize_loops_oacc_kernels::execute)
    	(make_pass_parallelize_loops_oacc_kernels): New function.
    	* tree-pass.h (make_pass_parallelize_loops_oacc_kernels): Declare.

    	gcc/testsuite/
    	* c-c++-common/goacc/kernels-loop-2.c: New test.
    	* c-c++-common/goacc/kernels-loop.c: New test.
    	* c-c++-common/goacc/kernels-loop-n.c: New test.
    	* c-c++-common/goacc/kernels-loop-mod-not-zero.c: New test.

    	libgomp/
    	* testsuite/libgomp.oacc-c-c++-common/kernels-loop-2.c: New test.
    	* testsuite/libgomp.oacc-c-c++-common/kernels-loop.c: New test.
    	* testsuite/libgomp.oacc-c-c++-common/kernels-loop-n.c: New test.
    	* testsuite/libgomp.oacc-c-c++-common/kernels-loop-mod-not-zero.c:
    	New test.

    git-svn-id: svn+ssh://gcc.gnu.org/svn/gcc/branches/gomp-4_0-branch@222285 138bc75d-0d04-0410-961f-82ee72b054a4
---
 gcc/ChangeLog.gomp                                 |   17 ++
 gcc/passes.def                                     |    1 +
 gcc/testsuite/ChangeLog.gomp                       |    5 +
 gcc/testsuite/c-c++-common/goacc/kernels-loop-2.c  |   62 +++++
 .../c-c++-common/goacc/kernels-loop-mod-not-zero.c |   53 ++++
 gcc/testsuite/c-c++-common/goacc/kernels-loop-n.c  |   48 ++++
 gcc/testsuite/c-c++-common/goacc/kernels-loop.c    |   53 ++++
 gcc/tree-parloops.c                                |  282 ++++++++++++++++----
 gcc/tree-pass.h                                    |    2 +
 libgomp/ChangeLog.gomp                             |    9 +
 .../libgomp.oacc-c-c++-common/kernels-loop-2.c     |   47 ++++
 .../kernels-loop-mod-not-zero.c                    |   41 +++
 .../libgomp.oacc-c-c++-common/kernels-loop-n.c     |   47 ++++
 .../libgomp.oacc-c-c++-common/kernels-loop.c       |   41 +++
 14 files changed, 650 insertions(+), 58 deletions(-)

Grüße,
 Thomas

[7/8] Add pass_parallelize_loops_oacc_kernels to pass_oacc_kernels

Commit Message

Patch