1
1
#include " kernel_operator.h"
2
2
3
- #include < cmath>
4
-
5
3
using namespace AscendC ;
6
4
7
5
#define BUFFER_NUM 2
@@ -183,7 +181,7 @@ extern "C" __global__ __aicore__ void ascendc_dup_by_rows_fp32(
183
181
copy_to_ub (output_ne_gm, output_ne_ub, 32 );
184
182
copy_to_ub (output_nb_gm, output_nb_ub, 32 );
185
183
186
- DupByRows<float_t , float_t > op;
184
+ DupByRows<float , float > op;
187
185
op.init (src_gm, dst_gm, input_ne_ub, input_nb_ub);
188
186
op.dup ();
189
187
}
@@ -206,7 +204,7 @@ extern "C" __global__ __aicore__ void ascendc_dup_by_rows_fp32_to_fp16(
206
204
copy_to_ub (output_ne_gm, output_ne_ub, 32 );
207
205
copy_to_ub (output_nb_gm, output_nb_ub, 32 );
208
206
209
- DupByRows<float_t , half> op;
207
+ DupByRows<float , half> op;
210
208
op.init (src_gm, dst_gm, input_ne_ub, input_nb_ub);
211
209
op.dup_with_cast ();
212
210
}
@@ -230,7 +228,7 @@ extern "C" __global__ __aicore__ void ascendc_dup_by_rows_fp16_to_fp32(
230
228
copy_to_ub (output_ne_gm, output_ne_ub, 32 );
231
229
copy_to_ub (output_nb_gm, output_nb_ub, 32 );
232
230
233
- DupByRows<half, float_t > op;
231
+ DupByRows<half, float > op;
234
232
op.init (src_gm, dst_gm, input_ne_ub, input_nb_ub);
235
233
op.dup_with_cast ();
236
234
}
0 commit comments