Switched to GPLv3.
[gnupg.git] / mpi / powerpc32 / mpih-mul1.S
1 /* PowerPC-32 mul_1 -- Multiply a limb vector with a limb and store
2  *                     the result in a second limb vector.
3  *
4  *      Copyright (C) 1992, 1993, 1994, 1995, 1997
5  *                    1998 Free Software Foundation, Inc.
6  *
7  * This file is part of GnuPG.
8  *
9  * GnuPG is free software; you can redistribute it and/or modify
10  * it under the terms of the GNU General Public License as published by
11  * the Free Software Foundation; either version 3 of the License, or
12  * (at your option) any later version.
13  *
14  * GnuPG is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  * GNU General Public License for more details.
18  *
19  * You should have received a copy of the GNU General Public License
20  * along with this program; if not, see <http://www.gnu.org/licenses/>.
21  */
22
23 #include "sysdep.h"
24 #include "asm-syntax.h"
25
26
27 #ifndef USE_PPC_PATCHES
28
29 /*******************
30  * mpi_limb_t
31  * mpihelp_mul_1( mpi_ptr_t res_ptr,    (r3)
32  *                mpi_ptr_t s1_ptr,     (r4)
33  *                mpi_size_t s1_size,   (r5)
34  *                mpi_limb_t s2_limb)   (r6)
35  *
36  * This is a fairly straightforward implementation.  The timing of the PC601
37  * is hard to understand, so I will wait to optimize this until I have some
38  * hardware to play with.
39  *
40  * The code trivially generalizes to 64 bit limbs for the PC620.
41  */
42
43         .toc
44         .csect .mpihelp_mul_1[PR]
45         .align 2
46         .globl mpihelp_mul_1
47         .globl .mpihelp_mul_1
48         .csect mpihelp_mul_1[DS]
49 mpihelp_mul_1:
50         .long .mpihelp_mul_1[PR], TOC[tc0], 0
51         .csect .mpihelp_mul_1[PR]
52 .mpihelp_mul_1:
53         mtctr   5
54
55         lwz     0,0(4)
56         mullw   7,0,6
57         mulhwu  10,0,6
58         addi    3,3,-4          # adjust res_ptr
59         addic   5,5,0           # clear cy with dummy insn
60         bdz     Lend
61
62 Loop:   lwzu    0,4(4)
63         stwu    7,4(3)
64         mullw   8,0,6
65         adde    7,8,10
66         mulhwu  10,0,6
67         bdnz    Loop
68
69 Lend:   stw     7,4(3)
70         addze   3,10
71         blr
72
73 #else
74
75 /* mp_limb_t mpn_mul_1 (mp_ptr res_ptr, mp_srcptr s1_ptr,
76                         mp_size_t s1_size, mp_limb_t s2_limb)
77    Calculate s1*s2 and put result in res_ptr; return carry.  */
78
79 ENTRY(mpihelp_mul_1)
80        mtctr   %r5
81
82        lwz     %r0,0(%r4)
83        mullw   %r7,%r0,%r6
84        mulhwu  %r10,%r0,%r6
85        addi    %r3,%r3,-4              # adjust res_ptr
86        addic   %r5,%r5,0               # clear cy with dummy insn
87        bdz     1f
88
89 0:     lwzu    %r0,4(%r4)
90        stwu    %r7,4(%r3)
91        mullw   %r8,%r0,%r6
92        adde    %r7,%r8,%r10
93        mulhwu  %r10,%r0,%r6
94        bdnz    0b
95
96 1:     stw     %r7,4(%r3)
97        addze   %r3,%r10
98        blr
99 END(mpihelp_mul_1)
100 #endif