!-------------------------------------- LICENCE BEGIN ------------------------------------
!Environment Canada - Atmospheric Science and Technology License/Disclaimer, 
!                     version 3; Last Modified: May 7, 2008.
!This is free but copyrighted software; you can use/redistribute/modify it under the terms 
!of the Environment Canada - Atmospheric Science and Technology License/Disclaimer 
!version 3 or (at your option) any later version that should be found at: 
!http://collaboration.cmc.ec.gc.ca/science/rpn.comm/license.html 
!
!This software is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; 
!without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. 
!See the above mentioned License/Disclaimer for more details.
!You should have received a copy of the License/Disclaimer along with this software; 
!if not, you can write to: EC-RPN COMM Group, 2121 TransCanada, suite 500, Dorval (Quebec), 
!CANADA, H9P 1J3; or send e-mail to service.rpn@ec.gc.ca
!-------------------------------------- LICENCE END --------------------------------------
***s/r hzd_solfft_lam_ad - ADJ of hzd_solfft_lam 
*
#include "model_macros_f.h"
*

       subroutine hzd_solfft_lam_ad (F_sol, F_Rhs_8, F_pri_8 , 13,2
     %                        F_a_8, F_c_8, F_deltai_8,
     %             minx1, maxx1, minx2, maxx2, nx1, nx2, nx3, F_pwr,
     %             minx,maxx,miny,maxy,gnk,Gni,nil,njl,nkl,
     %             F_opsxp0_8, F_opsyp0_8,F_cdiff,F_npex,F_npey)
*
      implicit none
*
      integer  minx1, maxx1, minx2, maxx2 , nx1, nx2, nx3, F_pwr,
     $         minx , maxx , miny , maxy  , gnk, Gni,
     $         njl  , nkl  , nil  , F_npex, F_npey
      real*8  F_opsxp0_8(*), F_opsyp0_8(*),F_pri_8,
     $            F_a_8(1:F_pwr,1:F_pwr,minx2:maxx2,nx3),
     $            F_c_8(1:F_pwr,1:F_pwr,minx2:maxx2,nx3),
     $       F_deltai_8(1:F_pwr,1:F_pwr,minx2:maxx2,nx3),
     $       F_Rhs_8(minx:maxx,miny:maxy,gnk)
      real   F_cdiff, F_sol(minx:maxx,miny:maxy,gnk)
*
*author
*     M.Tanguay
*
*revision
* v3_03 - Tanguay M.        - initial MPI version
* v3_11 - Tanguay M.        - AIXport+Opti+OpenMP for TLM-ADJ
* v3_30 - Tanguay M.        - Restore Rhs_8 
*
*object
*
*arguments
*  Name        I/O                 Description
*----------------------------------------------------------------
*  F_sol       I/O      r.h.s. and result of horizontal diffusion
*  F_Rhs_8     I/O      work vector
*
*----------------------------------------------------------------
*
#include "ptopo.cdk"
#include "glb_ld.cdk"
#include "glb_pil.cdk"
*
      real*8   fdg1_8(miny :maxy ,minx1:maxx1,Gni+F_npex  )
      real*8   fwft_8(miny :maxy ,minx1:maxx1,Gni+2+F_npex)
      real*8   fdg2_8(minx1:maxx1,minx2:maxx2,nx3+F_npey  )
      real*8   dn3_8(minx1:maxx1,minx2:maxx2,F_pwr,nx3   )
      real*8   sol_8(minx1:maxx1,minx2:maxx2,F_pwr,nx3   )
      real*8   ZERO_8
      parameter( ZERO_8 = 0.0 )      
      integer dim,o1,o2,i,j,k,m,l_pil_w,l_pil_e
      integer kkii,kilon,ki0,kin,pi0,pin
*     __________________________________________________________________
*
*  The I vector lies on the Y processor so, l_pil_w and l_pil_e will
*  represent the pilot region along I
      l_pil_w=0
      l_pil_e=0
      if (l_south) l_pil_w= Lam_pil_w
      if (l_north) l_pil_e= Lam_pil_e
      kilon = ( maxx2-l_pil_e-minx2+l_pil_w+1 + Ptopo_npeOpenMP)/Ptopo_npeOpenMP
*
!$omp parallel
*
*     Zero adjoint variables
*     ----------------------
!$omp do 
      do k= 1,Gni+F_npex
      do j= minx1,maxx1
      do i= miny ,maxy
      fdg1_8(i,j,k) = ZERO_8
      end do
      end do
      end do
!$omp end do 
*
!$omp do 
      do k= 1,Gni+2+F_npex
      do j= minx1,maxx1
      do i= miny ,maxy
      fwft_8(i,j,k) = ZERO_8
      end do
      end do
      end do
!$omp end do 
*
!$omp do 
      do k= 1,nx3+F_npey
      do j= minx2,maxx2
      do i= minx1,maxx1
      fdg2_8(i,j,k) = ZERO_8
      end do
      end do
      end do
!$omp end do 
*
!$omp do 
      do m= 1,nx3
      do k= 1,F_pwr
      do j= minx2,maxx2
      do i= minx1,maxx1
      dn3_8(i,j,k,m) = ZERO_8
      sol_8(i,j,k,m) = ZERO_8
      end do
      end do
      end do
      end do
!$omp end do 
*
*
* ADJ of
* resolution du systeme blok-tridiagonal
*
* ADJ of
* retour
*
*     ADJ of    
*     inverse projection ( r = x * w )
*
!$omp do 
      do k = gnk,1,-1
      do j = njl-pil_n,1+pil_s,-1
      do i = nil-pil_e,1+pil_w,-1
         F_Rhs_8(i,j,k) = dble(F_sol(i,j,k)) + F_Rhs_8(i,j,k)
         F_sol  (i,j,k) = ZERO_8
      enddo
      enddo
      enddo
!$omp enddo 
*
!$omp end parallel
*
*     ADJ of
*     inverse projection ( r = x * w )
      call rpn_comm_transpose( F_Rhs_8,Minx, Maxx, Gni, (Maxy-Miny+1),
     %                              Minx1, Maxx1, gnk, fwft_8, +1, 2 )
*
c     call rpn_comm_transpose48( F_sol,Minx, Maxx, Gni,1,(Maxy-Miny+1),
c    %                           (Maxy-Miny+1),Minx1, Maxx1, gnk, fwft_8,
c    %                             +1, 1.d0,0.d0 )
*
!$omp parallel
*
!$omp do 
      do k=Nkl,1,-1
      call qcfft8 ( fwft_8(1+pil_s,k,1+Lam_pil_w),
     %                    (Maxy-Miny+1) * (maxx1-minx1+1), 1,
     %                    (Maxy-Miny+1-pil_s-pil_n) , -1 )
      enddo
!$omp enddo 
*
!$omp single 
      call rpn_comm_transpose
     $     ( fwft_8 , Miny, Maxy, nx3, (Maxx1-Minx1+1),
     $               minx2, maxx2,Gni, fdg2_8,+ 2, 2 )
!$omp end single 
*
!$omp do 
      do j = nx3-Lam_pil_n,1+Lam_pil_s,-1
      do i = nx2-l_pil_e,1+l_pil_w,-1
      do k = nx1,1,-1
         sol_8 (k,i,F_pwr,j)= fdg2_8(k,i,j) + sol_8(k,i,F_pwr,j)
         fdg2_8(k,i,j)      = ZERO_8
      enddo
      enddo
      enddo
!$omp enddo 
*
*
!$omp do
      do kkii = Ptopo_npeOpenMP,1,-1
         ki0 = minx2+l_pil_w + kilon*(kkii-1)
         kin = min(ki0+kilon-1, maxx2-l_pil_e)
         pi0 = 1    +l_pil_w + kilon*(kkii-1)
         pin = min(pi0+kilon-1,   nx2-l_pil_e)
*
      do j = 1+Lam_pil_s, nx3-1-Lam_pil_n
*
         do o1= F_pwr,1,-1
c        do i = nx2-l_pil_e,1+l_pil_w,-1
         do i = pin,pi0,-1
         do k = nx1,1,-1
            dn3_8(k,i,o1,j)=  sol_8(k,i,o1,j) + dn3_8(k,i,o1,j)
            sol_8(k,i,o1,j)= -sol_8(k,i,o1,j)
         enddo
         enddo
         enddo
*
         do o1= F_pwr,1,-1
         do o2= F_pwr,1,-1
c        do i = maxx2-l_pil_e,minx2+l_pil_w,-1
         do i = kin,ki0,-1
         do k = maxx1,minx1,-1
              sol_8(k,i,o2,j+1)=F_c_8(o1,o2,i,j)*sol_8(k,i,o1,j) + sol_8(k,i,o2,j+1)
         enddo
         enddo
         enddo
         enddo
      enddo
      enddo
!$omp enddo 
*
!$omp do 
      do o1= F_pwr,1,-1
      do i = nx2-l_pil_e,1+l_pil_w,-1
      do k = nx1,1,-1
         dn3_8(k,i,o1,nx3-Lam_pil_n) = sol_8(k,i,o1,nx3-Lam_pil_n) + dn3_8(k,i,o1,nx3-Lam_pil_n)
         sol_8(k,i,o1,nx3-Lam_pil_n) = ZERO_8
      enddo
      enddo
      enddo
!$omp enddo 
*
!$omp do 
      do j = 1, nx3
      do o1= F_pwr,1,-1
      do i = nx2,1,-1
         do k = nx1,1,-1
C           sol_8(k,i,o1,j)=0.0
            sol_8(k,i,o1,j)=ZERO_8
         enddo
      enddo
      enddo
      enddo
!$omp enddo 
*
* ADJ of
* scale le cote droit pour retour
*
!$omp do 
      do j = nx3-Lam_pil_n,1+Lam_pil_s,-1
         do o2=F_pwr,1,-1
         do o1=F_pwr,1,-1
         do i= maxx2-l_pil_e,minx2+l_pil_w,-1
         do k= maxx1,minx1,-1
            sol_8(k,i,o2,j)= F_deltai_8(o1,o2,i,j)*dn3_8(k,i,o1,j) + sol_8(k,i,o2,j)
         enddo
         enddo
         enddo
         enddo
      enddo
!$omp enddo 
*
!$omp do 
      do j = nx3,1,-1
         do o1= F_pwr,1,-1
         do i = maxx2,minx2,-1
         do k = maxx1,minx1,-1
            dn3_8(k,i,o1,j) = ZERO_8
         enddo
         enddo
         enddo
      enddo
!$omp enddo 
*
* ADJ of
* aller
*
*
!$omp do 
      do kkii = Ptopo_npeOpenMP,1,-1
         ki0 = minx2+l_pil_w + kilon*(kkii-1)
         kin = min(ki0+kilon-1, maxx2-l_pil_e)
         pi0 = 1    +l_pil_w + kilon*(kkii-1)
         pin = min(pi0+kilon-1,   nx2-l_pil_e)
*
      do j = nx3-Lam_pil_n,2+Lam_pil_s,-1
         do o1= F_pwr,1,-1
c        do i = nx2-l_pil_e,1+l_pil_w,-1
         do i = pin,pi0,-1
         do k= nx1,1,-1
            dn3_8(k,i,o1,j)=  sol_8(k,i,o1,j) + dn3_8(k,i,o1,j)
            sol_8(k,i,o1,j)= -sol_8(k,i,o1,j)
         enddo
         enddo
         enddo
         do o1= F_pwr,1,-1
         do o2= F_pwr,1,-1
c        do i = maxx2-l_pil_e,minx2+l_pil_w,-1
         do i = kin,ki0,-1
         do k = nx1,1,-1
            sol_8(k,i,o2,j-1) = F_a_8(o1,o2,i,j)*sol_8(k,i,o1,j)
     %                          + sol_8(k,i,o2,j-1)
         enddo
         enddo
         enddo
         enddo
      enddo
      enddo
!$omp enddo 
*
!$omp do 
      do o1= F_pwr,1,-1
      do i = nx2-l_pil_e,1+l_pil_w,-1
      do k= nx1,1,-1
         dn3_8(k,i,o1,1+Lam_pil_s) = sol_8(k,i,o1,1+Lam_pil_s) + dn3_8(k,i,o1,1+Lam_pil_s)
         sol_8(k,i,o1,1+Lam_pil_s) = ZERO_8
      enddo
      enddo
      enddo
!$omp enddo 
*
* ADJ of
* cote droit
*
!$omp do 
      do j = nx3-Lam_pil_n,1+Lam_pil_s,-1
      do i = nx2-l_pil_e,1+l_pil_w,-1
      do k = nx1,1,-1
         fdg2_8(k,i,j)   = F_opsyp0_8(nx3+j)*dn3_8(k,i,1,j) + fdg2_8(k,i,j)
         dn3_8 (k,i,1,j) = ZERO_8
      enddo
      enddo
      enddo
!$omp enddo 
*
!$omp do 
      do j = 1, nx3
      do o1= 1, F_pwr
      do i = minx2,maxx2
      do k = minx1,maxx1
         sol_8(k,i,o1,j) = ZERO_8
         dn3_8(k,i,o1,j) = ZERO_8
      enddo
      enddo
      enddo
      enddo
!$omp enddo 
*
*     ADJ of 
*     projection ( wfft = x transposed * g )
*
!$omp single
      call rpn_comm_transpose
     $     (fwft_8,Miny,Maxy,nx3, (Maxx1-Minx1+1),
     $                  minx2, maxx2, Gni, fdg2_8, -2, 2)
!$omp end single
*
!$omp do 
      do i = Gni-1-Lam_pil_e,0+Lam_pil_w,-1
         do k = Nkl,1,-1
            do j = (Maxy-Miny+1)-pil_n,1+pil_s,-1
               fwft_8(j,k,i+1) = F_pri_8 * fwft_8(j,k,i+1)
            enddo
         enddo
      enddo
!$omp enddo 
*
!$omp do 
      do k=Nkl,1,-1
      call qcfft8(fwft_8(1+pil_s,k,1+Lam_pil_w),
     %            (Maxy-Miny+1)*(maxx1-minx1+1),1,
     %            (Maxy-Miny+1-pil_s-pil_n), +1 )
      enddo
!$omp enddo 
*
!$omp do 
      do i = Gni-Lam_pil_e,1+Lam_pil_w,-1
         do k=nkl,1,-1
         do j=njl-pil_n,1+pil_s,-1
            fdg1_8(j,k,i) = fwft_8(j,k,i) + fdg1_8(j,k,i)
            fwft_8(j,k,i) = ZERO_8
         enddo
         enddo
      enddo
!$omp enddo 
*
!$omp do 
      do i= 1,Gni
      do k= minx1, 0
      do j= miny,maxy
         fwft_8(j,k,i) = ZERO_8
      enddo
      enddo
      enddo
!$omp enddo 
*
!$omp do 
      do i= 1,Gni
      do k= Nkl+1, maxx1
      do j= miny,maxy
         fwft_8(j,k,i) = ZERO_8
      enddo
      enddo
      enddo
!$omp enddo 
*
!$omp do 
      do i= 1,Gni
         do k = 1, nkl
         do j= miny,pil_s
            fwft_8(j,k,i) = ZERO_8
         enddo
         enddo
         do k = 1, nkl
         do j= njl+1-pil_n,maxy
            fwft_8(j,k,i) = ZERO_8
         enddo
         enddo
      enddo
!$omp enddo 
*
!$omp do 
      do i = Gni-Lam_pil_e,1+Lam_pil_w,-1
         do k = nkl,1,-1
         do j = njl-pil_n,1+pil_s,-1
            fdg1_8(j,k,i) = F_opsxp0_8(Gni+i)*fdg1_8(j,k,i)
         enddo
         enddo
      enddo
!$omp enddo 
*
!$omp end parallel 
*
      call rpn_comm_transpose( F_Rhs_8, Minx, Maxx, Gni, (Maxy-Miny+1),
     %                                Minx1, Maxx1, gnk, fdg1_8, -1, 2 )
*
!$omp parallel do
      do k = gnk,1,-1
      do j = njl-pil_n,1+pil_s,-1
      do i = nil-pil_e,1+pil_w,-1
         F_sol  (i,j,k) = sngl(((-1)**F_pwr)*dble(F_cdiff)*F_Rhs_8(i,j,k)) + F_sol(i,j,k)
         F_Rhs_8(i,j,k) = ZERO_8
      enddo
      enddo
      enddo
!$omp end parallel do
*
      return
      end