|
49 | 49 | ifeq ($(ARCH),POWER)
|
50 | 50 | FLOP+=-maltivec -DPOWER
|
51 | 51 | VECSRC=vec_fma_hp.o vec_fma_sp.o vec_fma_dp.o vec_nonfma_hp.o vec_nonfma_sp.o vec_nonfma_dp.o
|
52 |
| - VEC=-maltivec -O0 -DPOWER |
53 |
| - VEC_FMA=-maltivec -O0 -DPOWER |
54 |
| - VEC_ALL=$(VEC) -O0 -DPOWER |
| 52 | + VEC=-maltivec -DPOWER |
| 53 | + VEC_FMA=-maltivec -DPOWER |
| 54 | + VEC_ALL=$(VEC) -DPOWER |
55 | 55 | endif
|
56 | 56 | ifeq ($(ARCH),ARM)
|
57 | 57 | FLOP+=-march=armv8.2-a+fp16 -DARM
|
@@ -109,58 +109,58 @@ weak_symbols.o: weak_symbols.c vec.h
|
109 | 109 | -$(CC) -c $(CFLAGS) weak_symbols.c
|
110 | 110 |
|
111 | 111 | vec.o: vec.c vec.h
|
112 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) -D$(ARCH) $(VEC_META) vec.c |
| 112 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) -D$(ARCH) $(VEC_META) vec.c |
113 | 113 |
|
114 | 114 | vec_scalar_verify.o: vec_scalar_verify.c vec_scalar_verify.h cat_arch.h
|
115 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_ALL) vec_scalar_verify.c |
| 115 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_ALL) vec_scalar_verify.c |
116 | 116 |
|
117 | 117 | vec_fma_hp.o: vec_fma_hp.c vec_scalar_verify.h
|
118 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_FMA) vec_fma_hp.c |
| 118 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_FMA) vec_fma_hp.c |
119 | 119 |
|
120 | 120 | vec_fma_hp: vec_fma_hp.c vec_scalar_verify.h
|
121 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128_FMA) vec_fma_hp.c -o vec_fma_hp-128B.o |
122 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256_FMA) vec_fma_hp.c -o vec_fma_hp-256B.o |
123 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512_FMA) vec_fma_hp.c -o vec_fma_hp-512B.o |
| 121 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128_FMA) vec_fma_hp.c -o vec_fma_hp-128B.o |
| 122 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256_FMA) vec_fma_hp.c -o vec_fma_hp-256B.o |
| 123 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512_FMA) vec_fma_hp.c -o vec_fma_hp-512B.o |
124 | 124 |
|
125 | 125 | vec_fma_sp.o: vec_fma_sp.c vec_scalar_verify.h
|
126 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_FMA) vec_fma_sp.c |
| 126 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_FMA) vec_fma_sp.c |
127 | 127 |
|
128 | 128 | vec_fma_sp: vec_fma_sp.c vec_scalar_verify.h
|
129 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128_FMA) vec_fma_sp.c -o vec_fma_sp-128B.o |
130 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256_FMA) vec_fma_sp.c -o vec_fma_sp-256B.o |
131 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512_FMA) vec_fma_sp.c -o vec_fma_sp-512B.o |
| 129 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128_FMA) vec_fma_sp.c -o vec_fma_sp-128B.o |
| 130 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256_FMA) vec_fma_sp.c -o vec_fma_sp-256B.o |
| 131 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512_FMA) vec_fma_sp.c -o vec_fma_sp-512B.o |
132 | 132 |
|
133 | 133 | vec_fma_dp.o: vec_fma_dp.c vec_scalar_verify.h
|
134 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_FMA) vec_fma_dp.c |
| 134 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_FMA) vec_fma_dp.c |
135 | 135 |
|
136 | 136 | vec_fma_dp: vec_fma_dp.c vec_scalar_verify.h
|
137 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128_FMA) vec_fma_dp.c -o vec_fma_dp-128B.o |
138 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256_FMA) vec_fma_dp.c -o vec_fma_dp-256B.o |
139 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512_FMA) vec_fma_dp.c -o vec_fma_dp-512B.o |
| 137 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128_FMA) vec_fma_dp.c -o vec_fma_dp-128B.o |
| 138 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256_FMA) vec_fma_dp.c -o vec_fma_dp-256B.o |
| 139 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512_FMA) vec_fma_dp.c -o vec_fma_dp-512B.o |
140 | 140 |
|
141 | 141 | vec_nonfma_hp.o: vec_nonfma_hp.c vec_scalar_verify.h
|
142 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC) vec_nonfma_hp.c |
| 142 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC) vec_nonfma_hp.c |
143 | 143 |
|
144 | 144 | vec_nonfma_hp: vec_nonfma_hp.c vec_scalar_verify.h
|
145 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128) vec_nonfma_hp.c -o vec_nonfma_hp-128B.o |
146 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256) vec_nonfma_hp.c -o vec_nonfma_hp-256B.o |
147 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512) vec_nonfma_hp.c -o vec_nonfma_hp-512B.o |
| 145 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128) vec_nonfma_hp.c -o vec_nonfma_hp-128B.o |
| 146 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256) vec_nonfma_hp.c -o vec_nonfma_hp-256B.o |
| 147 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512) vec_nonfma_hp.c -o vec_nonfma_hp-512B.o |
148 | 148 |
|
149 | 149 | vec_nonfma_sp.o: vec_nonfma_sp.c vec_scalar_verify.h
|
150 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC) vec_nonfma_sp.c |
| 150 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC) vec_nonfma_sp.c |
151 | 151 |
|
152 | 152 | vec_nonfma_sp: vec_nonfma_sp.c vec_scalar_verify.h
|
153 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128) vec_nonfma_sp.c -o vec_nonfma_sp-128B.o |
154 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256) vec_nonfma_sp.c -o vec_nonfma_sp-256B.o |
155 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512) vec_nonfma_sp.c -o vec_nonfma_sp-512B.o |
| 153 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128) vec_nonfma_sp.c -o vec_nonfma_sp-128B.o |
| 154 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256) vec_nonfma_sp.c -o vec_nonfma_sp-256B.o |
| 155 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512) vec_nonfma_sp.c -o vec_nonfma_sp-512B.o |
156 | 156 |
|
157 | 157 | vec_nonfma_dp.o: vec_nonfma_dp.c vec_scalar_verify.h
|
158 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC) vec_nonfma_dp.c |
| 158 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC) vec_nonfma_dp.c |
159 | 159 |
|
160 | 160 | vec_nonfma_dp: vec_nonfma_dp.c vec_scalar_verify.h
|
161 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128) vec_nonfma_dp.c -o vec_nonfma_dp-128B.o |
162 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256) vec_nonfma_dp.c -o vec_nonfma_dp-256B.o |
163 |
| - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512) vec_nonfma_dp.c -o vec_nonfma_dp-512B.o |
| 161 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128) vec_nonfma_dp.c -o vec_nonfma_dp-128B.o |
| 162 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256) vec_nonfma_dp.c -o vec_nonfma_dp-256B.o |
| 163 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512) vec_nonfma_dp.c -o vec_nonfma_dp-512B.o |
164 | 164 |
|
165 | 165 | cat_collect:
|
166 | 166 | $(CC) $(CFLAGS) -fopenmp $(INCFLAGS) main.c $(wildcard *.o) -o cat_collect $(LDFLAGS)
|
|
0 commit comments