See ChangeLog: Tue Dec 8 13:15:16 CET 1998 Werner Koch
[libgcrypt.git] / mpi / powerpc32 / mpih-mul1.S
1 /* PowerPC-32 mul_1 -- Multiply a limb vector with a limb and store
2  *                     the result in a second limb vector.
3  *
4  * Copyright (C) 1993, 1994, 1995, 1998 Free Software Foundation, Inc.
5  *
6  * This file is part of GnuPG.
7  *
8  * GnuPG is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License as published by
10  * the Free Software Foundation; either version 2 of the License, or
11  * (at your option) any later version.
12  *
13  * GnuPG is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16  * GNU General Public License for more details.
17  *
18  * You should have received a copy of the GNU General Public License
19  * along with this program; if not, write to the Free Software
20  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA
21  */
22
23 #include "sysdep.h"
24 #include "asm-syntax.h"
25
26
27 #ifndef USE_PPC_PATCHES
28
29 /*******************
30  * mpi_limb_t
31  * mpihelp_mul_1( mpi_ptr_t res_ptr,    (r3)
32  *                mpi_ptr_t s1_ptr,     (r4)
33  *                mpi_size_t s1_size,   (r5)
34  *                mpi_limb_t s2_limb)   (r6)
35  *
36  * This is a fairly straightforward implementation.  The timing of the PC601
37  * is hard to understand, so I will wait to optimize this until I have some
38  * hardware to play with.
39  *
40  * The code trivially generalizes to 64 bit limbs for the PC620.
41  */
42
43         .toc
44         .csect .mpihelp_mul_1[PR]
45         .align 2
46         .globl mpihelp_mul_1
47         .globl .mpihelp_mul_1
48         .csect mpihelp_mul_1[DS]
49 mpihelp_mul_1:
50         .long .mpihelp_mul_1[PR], TOC[tc0], 0
51         .csect .mpihelp_mul_1[PR]
52 .mpihelp_mul_1:
53         mtctr   5
54
55         lwz     0,0(4)
56         mullw   7,0,6
57         mulhwu  10,0,6
58         addi    3,3,-4          # adjust res_ptr
59         addic   5,5,0           # clear cy with dummy insn
60         bdz     Lend
61
62 Loop:   lwzu    0,4(4)
63         stwu    7,4(3)
64         mullw   8,0,6
65         adde    7,8,10
66         mulhwu  10,0,6
67         bdnz    Loop
68
69 Lend:   stw     7,4(3)
70         addze   3,10
71         blr
72
73 #else
74 /* Multiply a limb vector by a limb, for PowerPC.
75    Copyright (C) 1993, 1994, 1995, 1997 Free Software Foundation, Inc.
76    This file is part of the GNU C Library.
77
78    The GNU C Library is free software; you can redistribute it and/or
79    modify it under the terms of the GNU Library General Public License as
80    published by the Free Software Foundation; either version 2 of the
81    License, or (at your option) any later version.
82
83    The GNU C Library is distributed in the hope that it will be useful,
84    but WITHOUT ANY WARRANTY; without even the implied warranty of
85    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
86    Library General Public License for more details.
87
88    You should have received a copy of the GNU Library General Public
89    License along with the GNU C Library; see the file COPYING.LIB.  If not,
90    write to the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
91    Boston, MA 02111-1307, USA.  */
92
93
94 /* mp_limb_t mpn_mul_1 (mp_ptr res_ptr, mp_srcptr s1_ptr,
95                         mp_size_t s1_size, mp_limb_t s2_limb)
96    Calculate s1*s2 and put result in res_ptr; return carry.  */
97
98 ENTRY(mpihelp_mul_1)
99        mtctr   %r5
100
101        lwz     %r0,0(%r4)
102        mullw   %r7,%r0,%r6
103        mulhwu  %r10,%r0,%r6
104        addi    %r3,%r3,-4              # adjust res_ptr
105        addic   %r5,%r5,0               # clear cy with dummy insn
106        bdz     1f
107
108 0:     lwzu    %r0,4(%r4)
109        stwu    %r7,4(%r3)
110        mullw   %r8,%r0,%r6
111        adde    %r7,%r8,%r10
112        mulhwu  %r10,%r0,%r6
113        bdnz    0b
114
115 1:     stw     %r7,4(%r3)
116        addze   %r3,%r10
117        blr
118 END(mpihelp_mul_1)
119 #endif