Add Intel SSSE3 based vector permutation AES implementation
[libgcrypt.git] / cipher / rijndael-internal.h
1 /* Rijndael (AES) for GnuPG
2  * Copyright (C) 2000, 2001, 2002, 2003, 2007,
3  *               2008, 2011, 2012 Free Software Foundation, Inc.
4  *
5  * This file is part of Libgcrypt.
6  *
7  * Libgcrypt is free software; you can redistribute it and/or modify
8  * it under the terms of the GNU Lesser General Public License as
9  * published by the Free Software Foundation; either version 2.1 of
10  * the License, or (at your option) any later version.
11  *
12  * Libgcrypt is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with this program; if not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #ifndef G10_RIJNDAEL_INTERNAL_H
22 #define G10_RIJNDAEL_INTERNAL_H
23
24 #include "types.h"  /* for byte and u32 typedefs */
25
26
27 #define MAXKC                   (256/32)
28 #define MAXROUNDS               14
29 #define BLOCKSIZE               (128/8)
30
31
32 /* Helper macro to force alignment to 16 bytes.  */
33 #ifdef HAVE_GCC_ATTRIBUTE_ALIGNED
34 # define ATTR_ALIGNED_16  __attribute__ ((aligned (16)))
35 #else
36 # define ATTR_ALIGNED_16
37 #endif
38
39
40 /* USE_AMD64_ASM indicates whether to use AMD64 assembly code. */
41 #undef USE_AMD64_ASM
42 #if defined(__x86_64__) && defined(HAVE_COMPATIBLE_GCC_AMD64_PLATFORM_AS)
43 # define USE_AMD64_ASM 1
44 #endif
45
46 /* USE_SSSE3 indicates whether to use SSSE3 code. */
47 #if defined(__x86_64__) && defined(HAVE_COMPATIBLE_GCC_AMD64_PLATFORM_AS) && \
48     defined(HAVE_GCC_INLINE_ASM_SSSE3)
49 #  define USE_SSSE3 1
50 #endif
51
52 /* USE_ARM_ASM indicates whether to use ARM assembly code. */
53 #undef USE_ARM_ASM
54 #if defined(__ARMEL__)
55 # ifdef HAVE_COMPATIBLE_GCC_ARM_PLATFORM_AS
56 #  define USE_ARM_ASM 1
57 # endif
58 #endif
59
60 /* USE_PADLOCK indicates whether to compile the padlock specific
61    code.  */
62 #undef USE_PADLOCK
63 #ifdef ENABLE_PADLOCK_SUPPORT
64 # ifdef HAVE_GCC_ATTRIBUTE_ALIGNED
65 #  if (defined (__i386__) && SIZEOF_UNSIGNED_LONG == 4) || defined(__x86_64__)
66 #   define USE_PADLOCK 1
67 #  endif
68 # endif
69 #endif /*ENABLE_PADLOCK_SUPPORT*/
70
71 /* USE_AESNI inidicates whether to compile with Intel AES-NI code.  We
72    need the vector-size attribute which seems to be available since
73    gcc 3.  However, to be on the safe side we require at least gcc 4.  */
74 #undef USE_AESNI
75 #ifdef ENABLE_AESNI_SUPPORT
76 # if ((defined (__i386__) && SIZEOF_UNSIGNED_LONG == 4) || defined(__x86_64__))
77 #  if __GNUC__ >= 4
78 #   define USE_AESNI 1
79 #  endif
80 # endif
81 #endif /* ENABLE_AESNI_SUPPORT */
82
83 struct RIJNDAEL_context_s;
84
85 typedef unsigned int (*rijndael_cryptfn_t)(const struct RIJNDAEL_context_s *ctx,
86                                            unsigned char *bx,
87                                            const unsigned char *ax);
88 typedef void (*rijndael_prefetchfn_t)(void);
89
90 /* Our context object.  */
91 typedef struct RIJNDAEL_context_s
92 {
93   /* The first fields are the keyschedule arrays.  This is so that
94      they are aligned on a 16 byte boundary if using gcc.  This
95      alignment is required for the AES-NI code and a good idea in any
96      case.  The alignment is guaranteed due to the way cipher.c
97      allocates the space for the context.  The PROPERLY_ALIGNED_TYPE
98      hack is used to force a minimal alignment if not using gcc of if
99      the alignment requirement is higher that 16 bytes.  */
100   union
101   {
102     PROPERLY_ALIGNED_TYPE dummy;
103     byte keyschedule[MAXROUNDS+1][4][4];
104     u32 keyschedule32[MAXROUNDS+1][4];
105 #ifdef USE_PADLOCK
106     /* The key as passed to the padlock engine.  It is only used if
107        the padlock engine is used (USE_PADLOCK, below).  */
108     unsigned char padlock_key[16] __attribute__ ((aligned (16)));
109 #endif /*USE_PADLOCK*/
110   } u1;
111   union
112   {
113     PROPERLY_ALIGNED_TYPE dummy;
114     byte keyschedule[MAXROUNDS+1][4][4];
115     u32 keyschedule32[MAXROUNDS+1][4];
116   } u2;
117   int rounds;                         /* Key-length-dependent number of rounds.  */
118   unsigned int decryption_prepared:1; /* The decryption key schedule is available.  */
119 #ifdef USE_PADLOCK
120   unsigned int use_padlock:1;         /* Padlock shall be used.  */
121 #endif /*USE_PADLOCK*/
122 #ifdef USE_AESNI
123   unsigned int use_aesni:1;           /* AES-NI shall be used.  */
124 #endif /*USE_AESNI*/
125 #ifdef USE_SSSE3
126   unsigned int use_ssse3:1;           /* SSSE3 shall be used.  */
127 #endif /*USE_SSSE3*/
128   rijndael_cryptfn_t encrypt_fn;
129   rijndael_cryptfn_t decrypt_fn;
130   rijndael_prefetchfn_t prefetch_enc_fn;
131   rijndael_prefetchfn_t prefetch_dec_fn;
132 } RIJNDAEL_context ATTR_ALIGNED_16;
133
134 /* Macros defining alias for the keyschedules.  */
135 #define keyschenc   u1.keyschedule
136 #define keyschenc32 u1.keyschedule32
137 #define keyschdec   u2.keyschedule
138 #define keyschdec32 u2.keyschedule32
139 #define padlockkey  u1.padlock_key
140
141 #endif /* G10_RIJNDAEL_INTERNAL_H */