#resnet-50.inf.int8.pt.mb1024
--reset --allow-enum-tags-only=0 --cfg=u8 --dir=FWD_I --alg=max --tag=ABcd32a32b mb1024ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.inf.int8.pt.mb1024*1"
--reset --allow-enum-tags-only=0 --cfg=s8 --dir=FWD_I --alg=avg_p --tag=ABcd32a32b mb1024ic2048_ih7oh1kh7sh1dh0ph0_iw7ow1kw7sw1dw0pw0n"resnet-50.inf.int8.pt.mb1024*1"
#resnet-50.inf.int8.tf.mb1024
--reset --allow-enum-tags-only=0 --cfg=u8 --dir=FWD_I --alg=max --tag=ABcd32a32b mb1024ic64_ih112oh56kh3sh2dh0ph0_iw112ow56kw3sw2dw0pw0n"resnet-50.inf.int8.tf.mb1024*1"
#resnet-50.inf.int8.ov.mb64
--reset --allow-enum-tags-only=0 --cfg=u8 --dir=FWD_I --alg=max --tag=ABcd32a32b mb64ic64_ih112oh56kh3sh2dh0ph0_iw112ow56kw3sw2dw0pw0n"resnet-50.inf.int8.ov.mb64*1"
#resnet-50.tr.bf16.pt.mb256
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb256ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=avg_p --tag=acdb mb256ic2048_ih7oh1kh7sh1dh0ph0_iw7ow1kw7sw1dw0pw0n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=avg_p --tag=acdb mb256ic2048_ih7oh1kh7sh1dh0ph0_iw7ow1kw7sw1dw0pw0n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb256ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.bf16.pt.mb256*1"
#resnet-50.tr.fp32.pt.mb16
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb16ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb16ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.fp32.pt.mb16*1"
#resnet-50.tr.bf16.pt.mb256
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=ABcd32a16b mb256ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=avg_p --tag=ABcd32a16b mb256ic2048_ih7oh1kh7sh1dh0ph0_iw7ow1kw7sw1dw0pw0n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=avg_p --tag=abcd mb256ic2048_ih7oh1kh7sh1dh0ph0_iw7ow1kw7sw1dw0pw0n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=ABcd32a16b mb256ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.bf16.pt.mb256*1"
#resnet-50.tr.fp32.pt.mb128
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=ABcd16a16b mb128ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=avg_p --tag=ABcd32a16b mb128ic2048_ih7oh1kh7sh1dh0ph0_iw7ow1kw7sw1dw0pw0n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=avg_p --tag=abcd mb128ic2048_ih7oh1kh7sh1dh0ph0_iw7ow1kw7sw1dw0pw0n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=ABcd32a16b mb128ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.fp32.pt.mb128*1"
#resnet-50.tr.fp32.pt.mb16
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=ABcd16a16b mb16ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=ABcd16a16b mb16ic64_ih112oh56kh3sh2dh0ph1_iw112ow56kw3sw2dw0pw1n"resnet-50.tr.fp32.pt.mb16*1"
#cosmictagger.tr.fp32.tf.mb14
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb14ic8_ih640oh320kh2sh2dh0ph0_iw1024ow512kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb14ic16_ih320oh160kh2sh2dh0ph0_iw512ow256kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb14ic24_ih160oh80kh2sh2dh0ph0_iw256ow128kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb14ic32_ih80oh40kh2sh2dh0ph0_iw128ow64kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb14ic40_ih40oh20kh2sh2dh0ph0_iw64ow32kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb14ic48_ih20oh10kh2sh2dh0ph0_iw32ow16kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb14ic48_ih20oh10kh2sh2dh0ph0_iw32ow16kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb14ic48_ih20oh10kh2sh2dh0ph0_iw32ow16kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb14ic40_ih40oh20kh2sh2dh0ph0_iw64ow32kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb14ic40_ih40oh20kh2sh2dh0ph0_iw64ow32kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb14ic32_ih80oh40kh2sh2dh0ph0_iw128ow64kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb14ic32_ih80oh40kh2sh2dh0ph0_iw128ow64kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb14ic24_ih160oh80kh2sh2dh0ph0_iw256ow128kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb14ic24_ih160oh80kh2sh2dh0ph0_iw256ow128kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb14ic16_ih320oh160kh2sh2dh0ph0_iw512ow256kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb14ic16_ih320oh160kh2sh2dh0ph0_iw512ow256kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb14ic8_ih640oh320kh2sh2dh0ph0_iw1024ow512kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb14ic8_ih640oh320kh2sh2dh0ph0_iw1024ow512kw2sw2dw0pw0n"cosmictagger.tr.fp32.tf.mb14*3"
#3dgan.tr.fp32.tf.mb256
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=avg_np --tag=ABcde16a16b mb256ic8_id23od11kd2sd2dd0pd0_ih23oh11kh2sh2dh0ph0_iw23ow11kw2sw2dw0pw0n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=avg_np --tag=acdeb mb256ic8_id23od11kd2sd2dd0pd0_ih23oh11kh2sh2dh0ph0_iw23ow11kw2sw2dw0pw0n"3dgan.tr.fp32.tf.mb256*4"
#cosmictagger.tr.bf16.pt.mb4
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb4ic8_ih640oh320kh2sh2dh0ph0_iw1024ow512kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb4ic16_ih320oh160kh2sh2dh0ph0_iw512ow256kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb4ic24_ih160oh80kh2sh2dh0ph0_iw256ow128kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb4ic32_ih80oh40kh2sh2dh0ph0_iw128ow64kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb4ic40_ih40oh20kh2sh2dh0ph0_iw64ow32kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb4ic48_ih20oh10kh2sh2dh0ph0_iw32ow16kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb4ic48_ih20oh10kh2sh2dh0ph0_iw32ow16kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb4ic40_ih40oh20kh2sh2dh0ph0_iw64ow32kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb4ic32_ih80oh40kh2sh2dh0ph0_iw128ow64kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb4ic24_ih160oh80kh2sh2dh0ph0_iw256ow128kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb4ic16_ih320oh160kh2sh2dh0ph0_iw512ow256kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb4ic8_ih640oh320kh2sh2dh0ph0_iw1024ow512kw2sw2dw0pw0n"cosmictagger.tr.bf16.pt.mb4*3"
#cosmictagger.tr.fp32.pt.mb4
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb4ic8_ih640oh320kh2sh2dh0ph0_iw1024ow512kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb4ic16_ih320oh160kh2sh2dh0ph0_iw512ow256kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb4ic24_ih160oh80kh2sh2dh0ph0_iw256ow128kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb4ic32_ih80oh40kh2sh2dh0ph0_iw128ow64kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb4ic40_ih40oh20kh2sh2dh0ph0_iw64ow32kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb4ic48_ih20oh10kh2sh2dh0ph0_iw32ow16kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb4ic48_ih20oh10kh2sh2dh0ph0_iw32ow16kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb4ic40_ih40oh20kh2sh2dh0ph0_iw64ow32kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb4ic32_ih80oh40kh2sh2dh0ph0_iw128ow64kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb4ic24_ih160oh80kh2sh2dh0ph0_iw256ow128kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb4ic16_ih320oh160kh2sh2dh0ph0_iw512ow256kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb4ic8_ih640oh320kh2sh2dh0ph0_iw1024ow512kw2sw2dw0pw0n"cosmictagger.tr.fp32.pt.mb4*3"
#pointnet.tr.bf16.pt.mb16
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb16ic1024_ih1oh1kh1sh1dh0ph0_iw15000ow1kw15000sw15000dw0pw0n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb16ic1024_ih1oh1kh1sh1dh0ph0_iw15000ow1kw15000sw15000dw0pw0n"pointnet.tr.bf16.pt.mb16*2"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb16ic1024_ih1oh1kh1sh1dh0ph0_iw15000ow1kw15000sw15000dw0pw0n"pointnet.tr.bf16.pt.mb16*2"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb16ic1024_ih1oh1kh1sh1dh0ph0_iw15000ow1kw15000sw15000dw0pw0n"pointnet.tr.bf16.pt.mb16*1"
#pointnet.tr.fp32.pt.mb16
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb16ic1024_ih1oh1kh1sh1dh0ph0_iw15000ow1kw15000sw15000dw0pw0n"pointnet.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb16ic1024_ih1oh1kh1sh1dh0ph0_iw15000ow1kw15000sw15000dw0pw0n"pointnet.tr.fp32.pt.mb16*3"
#mma.tr.bf16.tf.mb32
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=ABcd32a16b mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=ABcd32a16b mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
#mma.tr.fp32.tf.mb32
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=ABcd16a16b mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=ABcd16a16b mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
#mma.tr.bf16.tf.mb32
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_I --alg=max --tag=acdb mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_I --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_I --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_I --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=FWD_D --alg=max --tag=acdb mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=bf16 --dir=BWD_D --alg=max --tag=acdb mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.bf16.tf.mb32*1"
#mma.tr.fp32.tf.mb32
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_I --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih118oh29kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb32ic256_ih473oh118kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb32ic128_ih2014oh503kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=FWD_D --alg=max --tag=acdb mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --cfg=f32 --dir=BWD_D --alg=max --tag=acdb mb32ic64_ih8177oh2044kh4sh4dh0ph0_iw1ow1kw1sw1dw0pw0n"mma.tr.fp32.tf.mb32*1"
