#all supported algs
--reset
--inplace=true,false
--dir=FWD_D
--dt=f32
--tag=abx,axb

--alpha=0 --beta=0
--alg=abs,exp,gelu_erf,hardswish,log,mish,round,soft_relu,sqrt,square,tanh,logistic,logsigmoid
64x512x28x28

--alpha= --beta=
--alg=clip_v2
64x512x28x28

--alpha=0.2 --beta=0.5
--alg=hardsigmoid
64x512x28x28

--alpha= --beta=0
--alg=elu
64x512x28x28

#eltwise binary fusion -TODO - add per_tensor POLICY case
--alpha=0 --beta=0
--alg=abs,exp,gelu_erf,hardswish
--attr-post-ops=add:f32,div:f32,sub:f32,mul:f32,min:f32
64x512x28x28

#all supported algs bwd
--reset
--inplace=true,false
--dir=BWD_D
--dt=f32
--tag=abx,axb
--alpha=0 --beta=0
--alg=abs,gelu_erf,hardswish,mish,relu_dst,soft_relu,sqrt,sqrt_dst,tanh,tanh_dst,logistic,logistic_dst,logsigmoid
64x512x28x28

--alpha= --beta=
--alg=clip_v2,clip_v2_dst
64x512x28x28

--alpha= --beta=0
--alg=elu,elu_dst
64x512x28x28

#gelu shapes from bert_squad -TODO - add gelu_tanh???
--reset
--inplace=true,false
--dir=FWD_D
--dt=f32
--tag=abx
--alpha= --beta=
--alg=gelu_erf
8x384x4096

#relu input shapes - TODO add different alpha cases.. 
--reset
--inplace=true,false
--dir=FWD_D,BWD_D
--dt=f32
--tag=abx
--alpha=0 --beta=
--alg=relu
64x2048x7x7

# all supported algs - post ops
--reset
--inplace=true,false
--dir=FWD_D
--dt=f32
--tag=abx,axb

--alpha=0 --beta=0
--alg=abs,elu,exp,gelu_erf,hardswish,log,relu,round,sqrt,square,tanh
--attr-post-ops=add:f32,mul:f32,sub:f32,div:f32
64x512x28x28

--reset
--inplace=true,false
--dir=FWD_D
--dt=f32
--tag=abx,axb

--alpha=0 --beta=0
--alg=abs,elu,exp,gelu_erf,hardswish,relu,round,square,tanh
--attr-post-ops=max:f32,min:f32
64x512x28x28

#TODO --alg=sigmoid ???
#16x1

#POW op fails with core dump.
#--dt=f32 --tag=abx --dir=FWD_I --alpha= --beta=-1,0,0.5,1,1.5,2 --alg=pow 64x512x28x28

#alg only supported ones are added. TODO- extend to others
#--alg=clip_v2,exp_dst,hardswish,logistic_dst,logsigmoid,mish,round,sqrt_dst,
#--alg=soft_relu,tanh_dst,bounded_relu,elu_dst,relu_dst,swish
#clip_v2_dst,linear
