#dlrm.tr.bf16.pt.mb32k
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x512n"dlrm.tr.bf16.pt.mb32k*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x256n"dlrm.tr.bf16.pt.mb32k*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x128n"dlrm.tr.bf16.pt.mb32k*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x1024n"dlrm.tr.bf16.pt.mb32k*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x256n"dlrm.tr.bf16.pt.mb32k*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x512n"dlrm.tr.bf16.pt.mb32k*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x1024n"dlrm.tr.bf16.pt.mb32k*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x128n"dlrm.tr.bf16.pt.mb32k*1"
#resnet-50.tr.fp32.pt.mb16
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x64x112x112n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x64x56x56n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x256x56x56n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x128x56x56n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x128x28x28n"resnet-50.tr.fp32.pt.mb16*7"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x512x28x28n"resnet-50.tr.fp32.pt.mb16*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x256x28x28n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x256x14x14n"resnet-50.tr.fp32.pt.mb16*11"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x1024x14x14n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x512x14x14n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x512x7x7n"resnet-50.tr.fp32.pt.mb16*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x2048x7x7n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x2048x7x7n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x512x7x7n"resnet-50.tr.fp32.pt.mb16*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x512x14x14n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x1024x14x14n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x256x14x14n"resnet-50.tr.fp32.pt.mb16*11"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x256x28x28n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x512x28x28n"resnet-50.tr.fp32.pt.mb16*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x128x28x28n"resnet-50.tr.fp32.pt.mb16*7"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x128x56x56n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x256x56x56n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x64x56x56n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 16x64x112x112n"resnet-50.tr.fp32.pt.mb16*1"
#resnet-50.tr.bf16.pt.mb256
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x64x112x112n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x64x56x56n"resnet-50.tr.bf16.pt.mb256*6"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x256x56x56n"resnet-50.tr.bf16.pt.mb256*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x128x56x56n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x128x28x28n"resnet-50.tr.bf16.pt.mb256*7"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x512x28x28n"resnet-50.tr.bf16.pt.mb256*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x256x28x28n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x256x14x14n"resnet-50.tr.bf16.pt.mb256*11"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x1024x14x14n"resnet-50.tr.bf16.pt.mb256*6"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x512x14x14n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x512x7x7n"resnet-50.tr.bf16.pt.mb256*5"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x2048x7x7n"resnet-50.tr.bf16.pt.mb256*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x512x7x7n"resnet-50.tr.bf16.pt.mb256*5"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x2048x7x7n"resnet-50.tr.bf16.pt.mb256*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x512x14x14n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x1024x14x14n"resnet-50.tr.bf16.pt.mb256*6"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x256x14x14n"resnet-50.tr.bf16.pt.mb256*11"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x256x28x28n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x512x28x28n"resnet-50.tr.bf16.pt.mb256*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x128x28x28n"resnet-50.tr.bf16.pt.mb256*7"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x128x56x56n"resnet-50.tr.bf16.pt.mb256*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x256x56x56n"resnet-50.tr.bf16.pt.mb256*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 256x64x56x56n"resnet-50.tr.bf16.pt.mb256*6"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 256x64x112x112n"resnet-50.tr.bf16.pt.mb256*1"
#resnet-50.tr.fp32.pt.mb128
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 128x64x112x112n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x64x56x56n"resnet-50.tr.fp32.pt.mb128*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x56x56n"resnet-50.tr.fp32.pt.mb128*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x56x56n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x28x28n"resnet-50.tr.fp32.pt.mb128*7"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x28x28n"resnet-50.tr.fp32.pt.mb128*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x28x28n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x14x14n"resnet-50.tr.fp32.pt.mb128*11"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x1024x14x14n"resnet-50.tr.fp32.pt.mb128*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x14x14n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x7x7n"resnet-50.tr.fp32.pt.mb128*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x2048x7x7n"resnet-50.tr.fp32.pt.mb128*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x2048x7x7n"resnet-50.tr.fp32.pt.mb128*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x7x7n"resnet-50.tr.fp32.pt.mb128*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x14x14n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x1024x14x14n"resnet-50.tr.fp32.pt.mb128*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x14x14n"resnet-50.tr.fp32.pt.mb128*11"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x28x28n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x28x28n"resnet-50.tr.fp32.pt.mb128*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x28x28n"resnet-50.tr.fp32.pt.mb128*7"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x56x56n"resnet-50.tr.fp32.pt.mb128*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x56x56n"resnet-50.tr.fp32.pt.mb128*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x64x56x56n"resnet-50.tr.fp32.pt.mb128*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 128x64x112x112n"resnet-50.tr.fp32.pt.mb128*1"
#resnet-50.tr.fp32.pt.mb16
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x64x112x112n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x64x56x56n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x256x56x56n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x128x56x56n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x128x28x28n"resnet-50.tr.fp32.pt.mb16*7"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x512x28x28n"resnet-50.tr.fp32.pt.mb16*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x256x28x28n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x256x14x14n"resnet-50.tr.fp32.pt.mb16*11"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x1024x14x14n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x512x14x14n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x512x7x7n"resnet-50.tr.fp32.pt.mb16*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x2048x7x7n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x2048x7x7n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x512x7x7n"resnet-50.tr.fp32.pt.mb16*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x512x14x14n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x1024x14x14n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x256x14x14n"resnet-50.tr.fp32.pt.mb16*11"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x256x28x28n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x512x28x28n"resnet-50.tr.fp32.pt.mb16*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x128x28x28n"resnet-50.tr.fp32.pt.mb16*7"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x128x56x56n"resnet-50.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x256x56x56n"resnet-50.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 16x64x56x56n"resnet-50.tr.fp32.pt.mb16*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 16x64x112x112n"resnet-50.tr.fp32.pt.mb16*1"
#cosmictagger.tr.fp32.tf.mb14
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x640x1024x8n"cosmictagger.tr.fp32.tf.mb14*36"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x320x512x16n"cosmictagger.tr.fp32.tf.mb14*36"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x160x256x24n"cosmictagger.tr.fp32.tf.mb14*36"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x80x128x32n"cosmictagger.tr.fp32.tf.mb14*36"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x40x64x40n"cosmictagger.tr.fp32.tf.mb14*36"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x20x32x48n"cosmictagger.tr.fp32.tf.mb14*36"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x10x16x56n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x10x16x256n"cosmictagger.tr.fp32.tf.mb14*12"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x10x16x168n"cosmictagger.tr.fp32.tf.mb14*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x640x1024x8n"cosmictagger.tr.fp32.tf.mb14*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x320x512x16n"cosmictagger.tr.fp32.tf.mb14*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x160x256x24n"cosmictagger.tr.fp32.tf.mb14*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x80x128x32n"cosmictagger.tr.fp32.tf.mb14*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x40x64x40n"cosmictagger.tr.fp32.tf.mb14*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x20x32x48n"cosmictagger.tr.fp32.tf.mb14*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x10x16x168n"cosmictagger.tr.fp32.tf.mb14*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x10x16x256n"cosmictagger.tr.fp32.tf.mb14*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.2 --beta=0 --tag=abcd 14x10x16x56n"cosmictagger.tr.fp32.tf.mb14*3"
#uno_convergence.tr.bf16.tf.mb128
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 128x1000n"uno_convergence.tr.bf16.tf.mb128*11"
#uno_convergence.tr.fp32.tf.mb128
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 128x1000n"uno_convergence.tr.fp32.tf.mb128*11"
#uno_convergence.tr.bf16.tf.mb128
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 128x1000n"uno_convergence.tr.bf16.tf.mb128*11"
#unet-3d.tr.bf16.tf.mb2
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=abcde 2x32x128x128x128n"unet-3d.tr.bf16.tf.mb2*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x32x128x128x128n"unet-3d.tr.bf16.tf.mb2*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x64x64x64x64n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x128x32x32x32n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x256x16x16x16n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x320x8x8x8n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x320x4x4x4n"unet-3d.tr.bf16.tf.mb2*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x32x128x128x128n"unet-3d.tr.bf16.tf.mb2*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x64x64x64x64n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x128x32x32x32n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x256x16x16x16n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x320x8x8x8n"unet-3d.tr.bf16.tf.mb2*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=aBcde16b 2x320x4x4x4n"unet-3d.tr.bf16.tf.mb2*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=abcde 2x32x128x128x128n"unet-3d.tr.bf16.tf.mb2*1"
#3dgan.tr.fp32.tf.mb256
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcde16a16b 32x1x25x25x25n"3dgan.tr.fp32.tf.mb256*8"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x32x25x25x25n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde32a16b 256x8x25x25x25n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x8x25x25x25n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x8x23x23x23n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x8x23x23x23n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x8x25x25x25n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde32a16b 256x8x25x25x25n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x32x25x25x25n"3dgan.tr.fp32.tf.mb256*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x64x7x7x8n"3dgan.tr.fp32.tf.mb256*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde32a16b 256x6x13x14x9n"3dgan.tr.fp32.tf.mb256*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x6x26x26x26n"3dgan.tr.fp32.tf.mb256*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcde16a16b 256x1x25x25x25n"3dgan.tr.fp32.tf.mb256*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x6x26x26x26n"3dgan.tr.fp32.tf.mb256*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde32a16b 256x6x13x14x9n"3dgan.tr.fp32.tf.mb256*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.3 --beta=0 --tag=ABcde16a16b 256x64x7x7x8n"3dgan.tr.fp32.tf.mb256*2"
#cosmictagger.tr.bf16.pt.mb4
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x8x640x1024n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x16x320x512n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x24x160x256n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x32x80x128n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x40x40x64n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x48x20x32n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x56x10x16n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x256x10x16n"cosmictagger.tr.bf16.pt.mb4*6"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x168x10x16n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x8x640x1024n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x16x320x512n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x24x160x256n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x32x80x128n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x40x40x64n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x48x20x32n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x168x10x16n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x256x10x16n"cosmictagger.tr.bf16.pt.mb4*6"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x56x10x16n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x1x5x5n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 8n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x8x3x3n"cosmictagger.tr.bf16.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x8x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 16n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x16x3x3n"cosmictagger.tr.bf16.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x16x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 24n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x24x3x3n"cosmictagger.tr.bf16.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x24x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 32n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x32x3x3n"cosmictagger.tr.bf16.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x32x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 40n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x40x3x3n"cosmictagger.tr.bf16.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x40x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 48n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x48x3x3n"cosmictagger.tr.bf16.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 56x48x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 56n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x168x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 256n"cosmictagger.tr.bf16.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x256x5x5n"cosmictagger.tr.bf16.pt.mb4*5"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 168x256x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 168n"cosmictagger.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x56x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x48x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x40x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x32x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x24x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x16x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 3x8x1x1n"cosmictagger.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 3n"cosmictagger.tr.bf16.pt.mb4*1"
#cosmictagger.tr.fp32.pt.mb4
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x8x640x1024n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x16x320x512n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x24x160x256n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x32x80x128n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x40x40x64n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x48x20x32n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x56x10x16n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x256x10x16n"cosmictagger.tr.fp32.pt.mb4*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x168x10x16n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x8x640x1024n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x16x320x512n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x24x160x256n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x32x80x128n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x40x40x64n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x48x20x32n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x168x10x16n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x256x10x16n"cosmictagger.tr.fp32.pt.mb4*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0.01 --beta=0 --tag=acdb 4x56x10x16n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x1x5x5n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 8n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x8x3x3n"cosmictagger.tr.fp32.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x8x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 16n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x16x3x3n"cosmictagger.tr.fp32.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x16x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 24n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x24x3x3n"cosmictagger.tr.fp32.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x24x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 32n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x32x3x3n"cosmictagger.tr.fp32.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x32x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 40n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x40x3x3n"cosmictagger.tr.fp32.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x40x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 48n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x48x3x3n"cosmictagger.tr.fp32.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 56x48x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 56n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x168x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 256n"cosmictagger.tr.fp32.pt.mb4*18"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x256x5x5n"cosmictagger.tr.fp32.pt.mb4*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 168x256x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 168n"cosmictagger.tr.fp32.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x56x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x48x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x40x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x32x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x24x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x16x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 3x8x1x1n"cosmictagger.tr.fp32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 3n"cosmictagger.tr.fp32.pt.mb4*1"
#pointnet-atlas.tr.bf16.pt.mb4
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 64x7x1x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 64n"pointnet-atlas.tr.bf16.pt.mb4*6"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 64x64x1x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 128x64x1x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 128n"pointnet-atlas.tr.bf16.pt.mb4*24"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 128x128x1x1n"pointnet-atlas.tr.bf16.pt.mb4*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x128x1x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 256n"pointnet-atlas.tr.bf16.pt.mb4*15"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x256x1x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 512x256x1x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 512n"pointnet-atlas.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 1024x512x1x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 1024n"pointnet-atlas.tr.bf16.pt.mb4*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 256x1280x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 256x256x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 256x384x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x256x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x128x1n"pointnet-atlas.tr.bf16.pt.mb4*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 3x128x1n"pointnet-atlas.tr.bf16.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 3n"pointnet-atlas.tr.bf16.pt.mb4*1"
#pointnet.tr.bf16.pt.mb16
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 64x7x1n"pointnet.tr.bf16.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 64n"pointnet.tr.bf16.pt.mb16*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x64x1n"pointnet.tr.bf16.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 128n"pointnet.tr.bf16.pt.mb16*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 1024x128x1n"pointnet.tr.bf16.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 1024n"pointnet.tr.bf16.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 512x1024n"pointnet.tr.bf16.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 512n"pointnet.tr.bf16.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 256x512n"pointnet.tr.bf16.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 256n"pointnet.tr.bf16.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 49x256n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 49n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 64x64x1n"pointnet.tr.bf16.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 4096x256n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 4096n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 512x1088x1n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 256x512x1n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x256x1n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 5x128x1n"pointnet.tr.bf16.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 5n"pointnet.tr.bf16.pt.mb16*1"
#pointnet.tr.fp32.pt.mb16
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 64x7x1n"pointnet.tr.fp32.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 64n"pointnet.tr.fp32.pt.mb16*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x64x1n"pointnet.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 128n"pointnet.tr.fp32.pt.mb16*4"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 1024x128x1n"pointnet.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 1024n"pointnet.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 512x1024n"pointnet.tr.fp32.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 512n"pointnet.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 256x512n"pointnet.tr.fp32.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 256n"pointnet.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 49x256n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 49n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 64x64x1n"pointnet.tr.fp32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 4096x256n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 4096n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 512x1088x1n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 256x512x1n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x256x1n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 5x128x1n"pointnet.tr.fp32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 5n"pointnet.tr.fp32.pt.mb16*1"
#wide_and_deep.tr.fp32.tf.mb262144
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=a 262144n"wide_and_deep.tr.fp32.tf.mb262144*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 262144x1024n"wide_and_deep.tr.fp32.tf.mb262144*5"
#wide-and-deep.tr.fp32.tf.mb32768
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x1024n"wide-and-deep.tr.fp32.tf.mb32768*5"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x1024n"wide-and-deep.tr.fp32.tf.mb32768*5"
#ffn.tr.bf16.tf.mb16
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcde16a16b 16x32x17x33x33n"ffn.tr.bf16.tf.mb16*9"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcde16a16b 16x32x17x33x33n"ffn.tr.bf16.tf.mb16*18"
#ffn.tr.fp32.tf.mb16
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcde16a16b 16x32x17x33x33n"ffn.tr.fp32.tf.mb16*9"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcde16a16b 16x32x17x33x33n"ffn.tr.fp32.tf.mb16*18"
#ffn.tr.bf16.tf.mb16
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcde 16x17x33x33x32n"ffn.tr.bf16.tf.mb16*9"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcde 16x17x33x33x32n"ffn.tr.bf16.tf.mb16*18"
#ffn.tr.fp32.tf.mb16
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcde 16x17x33x33x32n"ffn.tr.fp32.tf.mb16*9"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcde 16x17x33x33x32n"ffn.tr.fp32.tf.mb16*18"
#mma.tr.bf16.tf.mb32
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x2014x1x128n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x473x1x256n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x118x1x256n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.bf16.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32x128n"mma.tr.bf16.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.bf16.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x256x118x1n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x256x473x1n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x128x2014x1n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 32x64x8177x1n"mma.tr.bf16.tf.mb32*1"
#mma.tr.fp32.tf.mb32
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x2014x1x128n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x473x1x256n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x118x1x256n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.fp32.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32x128n"mma.tr.fp32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.fp32.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x256x118x1n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x256x473x1n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x128x2014x1n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 32x64x8177x1n"mma.tr.fp32.tf.mb32*1"
#mma.tr.bf16.tf.mb32
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x2014x1x128n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x473x1x256n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x118x1x256n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.bf16.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32x128n"mma.tr.bf16.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.bf16.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x118x1x256n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x473x1x256n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x2014x1x128n"mma.tr.bf16.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x8177x1x64n"mma.tr.bf16.tf.mb32*1"
#mma.tr.fp32.tf.mb32
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x2014x1x128n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x473x1x256n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x118x1x256n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.fp32.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32x128n"mma.tr.fp32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.fp32.tf.mb32*2"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x118x1x256n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x473x1x256n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x2014x1x128n"mma.tr.fp32.tf.mb32*1"
--reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x8177x1x64n"mma.tr.fp32.tf.mb32*1"
