a30e80b83ee595ad919ecf0c1501f6522215a785
[libgcrypt.git] / mpi / hppa / mpih-add1.S
1 /* hppa add_n -- Add two limb vectors of the same length > 0 and store
2  *               sum in a third limb vector.
3  *
4  *      Copyright (C) 1992, 1994 Free Software Foundation, Inc.
5  *      Copyright (c) 1997 by Werner Koch (dd9jn)
6  *
7  * This file is part of G10.
8  *
9  * G10 is free software; you can redistribute it and/or modify
10  * it under the terms of the GNU General Public License as published by
11  * the Free Software Foundation; either version 2 of the License, or
12  * (at your option) any later version.
13  *
14  * G10 is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  * GNU General Public License for more details.
18  *
19  * You should have received a copy of the GNU General Public License
20  * along with this program; if not, write to the Free Software
21  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA
22  *
23  * Note: This code is heavily based on the GNU MP Library.
24  *       Actually it's the same code with only minor changes in the
25  *       way the data is stored; this is to support the abstraction
26  *       of an optional secure memory allocation which may be used
27  *       to avoid revealing of sensitive data due to paging etc.
28  *       The GNU MP Library itself is published under the LGPL;
29  *       however I decided to publish this code under the plain GPL.
30  */
31
32
33
34 /*******************
35  *  mpi_limb_t
36  *  mpihelp_add_n( mpi_ptr_t res_ptr,   (gr26)
37  *                 mpi_ptr_t s1_ptr,    (gr25)
38  *                 mpi_ptr_t s2_ptr,    (gr24)
39  *                 mpi_size_t size)     (gr23)
40  *
41  * One might want to unroll this as for other processors, but it turns
42  * out that the data cache contention after a store makes such
43  * unrolling useless.  We can't come under 5 cycles/limb anyway.
44  */
45
46         .code
47         .export         __mpihelp_add_n
48 __mpihelp_add_n
49         .proc
50         .callinfo       frame=0,no_calls
51         .entry
52
53         ldws,ma         4(0,%r25),%r20
54         ldws,ma         4(0,%r24),%r19
55
56         addib,=         -1,%r23,L$end   ; check for (SIZE == 1)
57          add            %r20,%r19,%r28  ; add first limbs ignoring cy
58
59 L$loop  ldws,ma         4(0,%r25),%r20
60         ldws,ma         4(0,%r24),%r19
61         stws,ma         %r28,4(0,%r26)
62         addib,<>        -1,%r23,L$loop
63          addc           %r20,%r19,%r28
64
65 L$end   stws            %r28,0(0,%r26)
66         bv              0(%r2)
67          addc           %r0,%r0,%r28
68
69         .exit
70         .procend