mirror of
https://github.com/open-goal/jak-project.git
synced 2024-10-20 21:27:52 -04:00
3afd99a8e3
* temp * some decomp * tfrag dma setup * fix negative label bug * tfrag dma setup * tfrag, with pipeline tricks * kinda works * cleanup before trying some color stuff * time of day works * clean up * temp before render changes * a few more fixes * fix up tests * clean up * fix * fix alignment * one more cleanup
2199 lines
117 KiB
Plaintext
2199 lines
117 KiB
Plaintext
lq.xyzw vf01, 7(vi00) | nop
|
|
lq.xyzw vf25, 3(vi00) | nop
|
|
lq.xyzw vf26, 4(vi00) | nop
|
|
lq.xyzw vf27, 5(vi00) | nop
|
|
lq.xyzw vf28, 6(vi00) | nop
|
|
mr32.xyzw vf01, vf01 | nop
|
|
move.y vf25, vf26 | nop
|
|
move.zw vf25, vf27 | nop
|
|
sq.xyzw vf25, 3(vi00) | nop
|
|
2048.0 | nop :i
|
|
255.0 | maxi.x vf17, vf00, I :i
|
|
-65537.0 | maxi.y vf17, vf00, I :i
|
|
mr32.xyzw vf02, vf01 | minii.z vf17, vf00, I
|
|
lq.xyzw vf22, 2(vi00) | minii.z vf18, vf00, I
|
|
0.003921569 | minii.z vf19, vf00, I :i
|
|
sq.xyzw vf28, 4(vi00) | minii.w vf29, vf00, I :e
|
|
mr32.xyzw vf03, vf02 | nop
|
|
iaddi vi07, vi00, 0x1 | nop
|
|
b L1 | nop
|
|
isw.w vi07, 1(vi00) | nop
|
|
iaddi vi07, vi00, 0x0 | nop
|
|
L1:
|
|
lq.xyzw vf25, 139(vi00) | nop
|
|
lq.xyzw vf26, 3(vi00) | nop
|
|
lq.xyz vf01, 132(vi00) | nop
|
|
lq.xyz vf02, 133(vi00) | nop
|
|
lq.xyz vf03, 134(vi00) | addy.xy vf19, vf00, vf25
|
|
lq.xyzw vf04, 135(vi00) | mulx.xyzw vf26, vf26, vf25
|
|
lq.xyzw vf05, 136(vi00) | nop
|
|
lq.xyzw vf06, 137(vi00) | nop
|
|
lq.xyzw vf07, 138(vi00) | nop
|
|
b L2 | nop
|
|
sq.xyzw vf26, 5(vi00) | nop
|
|
iaddi vi07, vi00, 0x1 | nop
|
|
b L2 | nop
|
|
isw.w vi07, 1(vi00) | nop
|
|
iaddi vi07, vi00, 0x0 | nop
|
|
L2:
|
|
lq.xyzw vf28, 139(vi00) | minix.xyzw vf15, vf00, vf00
|
|
xtop vi15 | nop
|
|
iaddiu vi12, vi15, 0x8c | nop
|
|
ibeq vi00, vi15, L3 | nop
|
|
ilwr.w vi03, vi12 | maxz.xy vf18, vf00, vf28
|
|
nop | maxw.xy vf18, vf00, vf28
|
|
L3:
|
|
ilw.w vi10, 133(vi00) | nop
|
|
iaddiu vi15, vi15, 0x173 | nop
|
|
ilw.y vi02, 2(vi12) | nop
|
|
lq.xyzw vf14, 0(vi00) | nop
|
|
ibeq vi00, vi10, L4 | nop
|
|
iadd vi03, vi03, vi12 | nop
|
|
mr32.xyzw vf27, vf14 | nop
|
|
ilw.w vi11, 134(vi00) | nop
|
|
iaddiu vi13, vi00, 0x42 | nop
|
|
mr32.y vf14, vf27 | nop
|
|
L4:
|
|
ilwr.w vi09, vi03 | nop
|
|
lqi.xyzw vf27, vi03 | nop
|
|
ilw.x vi04, 1(vi12) | nop
|
|
iaddiu vi05, vi00, 0x7f | addw.xyz vf15, vf15, vf00
|
|
iand vi09, vi09, vi05 | nop
|
|
ilw.y vi06, 1(vi12) | miniz.w vf19, vf00, vf27
|
|
ibeq vi00, vi02, L6 | miniy.w vf18, vf00, vf27
|
|
ilwr.z vi01, vi12 | minix.w vf17, vf00, vf27
|
|
ibne vi00, vi09, L5 | nop
|
|
sq.yzw vf14, 0(vi15) | nop
|
|
iaddiu vi02, vi02, 0x4000 | nop
|
|
iaddiu vi02, vi02, 0x4000 | nop
|
|
iswr.x vi02, vi15 | nop
|
|
b L9 | nop
|
|
nop | nop
|
|
L5:
|
|
iswr.x vi02, vi15 | nop
|
|
L6:
|
|
lq.xyzw vf13, 1(vi00) | nop
|
|
L7:
|
|
ilwr.w vi02, vi03 | nop
|
|
lqi.xyzw vf08, vi03 | nop
|
|
lqi.xyzw vf09, vi03 | nop
|
|
lqi.xyzw vf10, vi03 | nop
|
|
lqi.xyzw vf11, vi03 | nop
|
|
lqi.xyzw vf12, vi03 | nop
|
|
iadd vi02, vi02, vi15 | nop
|
|
mtir vi08, vf09.w | nop
|
|
sqi.xyzw vf13, vi02 | nop
|
|
sqi.xyzw vf08, vi02 | nop
|
|
sqi.xyzw vf09, vi02 | nop
|
|
mfir.x vf14, vi08 | nop
|
|
sqi.xyzw vf10, vi02 | nop
|
|
sqi.xyzw vf11, vi02 | nop
|
|
ibeq vi00, vi10, L8 | nop
|
|
sqi.xyzw vf12, vi02 | nop
|
|
mtir vi14, vf12.z | nop
|
|
isw.x vi10, -1(vi02) | nop
|
|
ibeq vi14, vi13, L8 | nop
|
|
isw.y vi11, -1(vi02) | nop
|
|
ilw.x vi13, -4(vi02) | nop
|
|
isubiu vi14, vi00, 0x1d | nop
|
|
iand vi13, vi13, vi14 | nop
|
|
iaddi vi13, vi13, 0xc | nop
|
|
isw.x vi13, -4(vi02) | nop
|
|
iaddiu vi13, vi00, 0x42 | nop
|
|
isw.z vi13, -1(vi02) | nop
|
|
L8:
|
|
ibgtz vi08, L7 | nop
|
|
sq.xyzw vf14, 0(vi02) | nop
|
|
L9:
|
|
lq.xyzw vf28, 3(vi00) | nop
|
|
ilw.y vi08, 3(vi12) | nop
|
|
lq.xyzw vf16, 5(vi00) | nop
|
|
lq.xyzw vf20, 4(vi00) | nop
|
|
ilw.z vi09, 3(vi12) | mul.xyzw vf27, vf28, vf15
|
|
ior vi11, vi08, vi00 | mul.xyzw vf28, vf28, vf00
|
|
ibeq vi00, vi08, L11 | mul.xyzw vf15, vf16, vf15
|
|
iaddi vi13, vi12, 0x3 | mul.xyzw vf16, vf16, vf00
|
|
L10:
|
|
lq.xyzw vf08, 0(vi08) | addax.xyzw vf20, vf00
|
|
lq.xyzw vf10, 1(vi08) | madda.xyzw ACC, vf27, vf25
|
|
lq.xyzw vf12, 2(vi08) | maddz.xyzw vf26, vf28, vf25
|
|
lq.xyzw vf25, 3(vi08) | nop
|
|
sq.xyzw vf09, 0(vi11) | mula.xyzw ACC, vf15, vf08
|
|
sq.xyzw vf11, 1(vi11) | maddz.xyzw vf09, vf16, vf08
|
|
sq.xyzw vf13, 2(vi11) | mula.xyzw ACC, vf15, vf10
|
|
sq.xyzw vf26, 3(vi11) | maddz.xyzw vf11, vf16, vf10
|
|
ibeq vi00, vi08, L11 | mula.xyzw ACC, vf15, vf12
|
|
ilwr.w vi10, vi13 | maddz.xyzw vf13, vf16, vf12
|
|
lq.xyzw vf08, 0(vi09) | addax.xyzw vf20, vf00
|
|
lq.xyzw vf10, 1(vi09) | madda.xyzw ACC, vf27, vf25
|
|
lq.xyzw vf12, 2(vi09) | maddz.xyzw vf26, vf28, vf25
|
|
lq.xyzw vf25, 3(vi09) | nop
|
|
sq.xyzw vf09, 0(vi08) | mula.xyzw ACC, vf15, vf08
|
|
sq.xyzw vf11, 1(vi08) | maddz.xyzw vf09, vf16, vf08
|
|
sq.xyzw vf13, 2(vi08) | mula.xyzw ACC, vf15, vf10
|
|
sq.xyzw vf26, 3(vi08) | maddz.xyzw vf11, vf16, vf10
|
|
ibeq vi00, vi09, L11 | mula.xyzw ACC, vf15, vf12
|
|
ilw.x vi11, 1(vi13) | maddz.xyzw vf13, vf16, vf12
|
|
lq.xyzw vf08, 0(vi10) | addax.xyzw vf20, vf00
|
|
lq.xyzw vf10, 1(vi10) | madda.xyzw ACC, vf27, vf25
|
|
lq.xyzw vf12, 2(vi10) | maddz.xyzw vf26, vf28, vf25
|
|
lq.xyzw vf25, 3(vi10) | nop
|
|
sq.xyzw vf09, 0(vi09) | mula.xyzw ACC, vf15, vf08
|
|
sq.xyzw vf11, 1(vi09) | maddz.xyzw vf09, vf16, vf08
|
|
sq.xyzw vf13, 2(vi09) | mula.xyzw ACC, vf15, vf10
|
|
sq.xyzw vf26, 3(vi09) | maddz.xyzw vf11, vf16, vf10
|
|
ibeq vi00, vi10, L11 | mula.xyzw ACC, vf15, vf12
|
|
ilw.y vi08, 1(vi13) | maddz.xyzw vf13, vf16, vf12
|
|
lq.xyzw vf08, 0(vi11) | addax.xyzw vf20, vf00
|
|
lq.xyzw vf10, 1(vi11) | madda.xyzw ACC, vf27, vf25
|
|
lq.xyzw vf12, 2(vi11) | maddz.xyzw vf26, vf28, vf25
|
|
lq.xyzw vf25, 3(vi11) | nop
|
|
sq.xyzw vf09, 0(vi10) | mula.xyzw ACC, vf15, vf08
|
|
sq.xyzw vf11, 1(vi10) | maddz.xyzw vf09, vf16, vf08
|
|
sq.xyzw vf13, 2(vi10) | mula.xyzw ACC, vf15, vf10
|
|
sq.xyzw vf26, 3(vi10) | maddz.xyzw vf11, vf16, vf10
|
|
iaddi vi13, vi13, 0x1 | nop
|
|
ibne vi00, vi11, L10 | mula.xyzw ACC, vf15, vf12
|
|
ilwr.z vi09, vi13 | maddz.xyzw vf13, vf16, vf12
|
|
L11:
|
|
ilw.x vi02, 3(vi12) | nop
|
|
ibeq vi00, vi04, L23 | nop
|
|
iadd vi01, vi01, vi12 | nop
|
|
ilwr.x vi08, vi01 | nop
|
|
lqi.xyzw vf08, vi01 | nop
|
|
lqi.xyzw vf11, vi01 | nop
|
|
lqi.xyzw vf14, vi01 | nop
|
|
lq.xyz vf29, 4(vi08) | nop
|
|
lq.xyz vf30, 5(vi08) | add.zw vf08, vf08, vf17
|
|
lq.xyzw vf31, 6(vi08) | add.xyzw vf11, vf11, vf18
|
|
iaddi vi04, vi04, -0x1 | add.xyzw vf14, vf14, vf19
|
|
iadd vi02, vi02, vi12 | nop
|
|
lqi.xyzw vf24, vi02 | mulaz.xyzw ACC, vf29, vf08
|
|
mtir vi10, vf11.x | maddaz.xyzw ACC, vf30, vf11
|
|
mtir vi13, vf11.y | maddz.xyz vf11, vf31, vf14
|
|
lq.xyzw vf25, 0(vi08) | nop
|
|
lq.xyzw vf26, 1(vi08) | itof0.xyzw vf24, vf24
|
|
lq.xyzw vf27, 2(vi08) | nop
|
|
erleng.xyz P, vf11 | nop
|
|
lq.xyzw vf28, 3(vi08) | mulaw.xyzw ACC, vf25, vf08
|
|
ior vi15, vi07, vi00 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
lqi.xyzw vf09, vi01 | nop
|
|
ilwr.y vi03, vi12 | nop
|
|
ilw.z vi07, 1(vi12) | nop
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | nop
|
|
mtir vi08, vf09.x | nop
|
|
ibeq vi00, vi15, L12 | nop
|
|
iadd vi03, vi03, vi12 | nop
|
|
nop | miniw.w vf08, vf08, vf01
|
|
L12:
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
iadd vi04, vi04, vi03 | add.xyzw vf12, vf12, vf18
|
|
lq.xyz vf29, 4(vi08) | add.xyzw vf15, vf15, vf19
|
|
lq.xyz vf30, 5(vi08) | nop
|
|
iadd vi06, vi06, vi04 | nop
|
|
lq.xyzw vf31, 6(vi08) | nop
|
|
lq.xyzw vf25, 0(vi08) | nop
|
|
lq.xyzw vf26, 1(vi08) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | nop
|
|
lq.xyzw vf27, 2(vi08) | nop
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
iadd vi07, vi07, vi06 | mulaz.xyzw ACC, vf29, vf09
|
|
lq.xyzw vf28, 3(vi08) | maddaz.xyzw ACC, vf30, vf12
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
nop | nop
|
|
1024.0 | miniw.w vf08, vf08, vf03 :i
|
|
ibne vi00, vi15, L79 | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
erleng.xyz P, vf12 | nop
|
|
nop | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
ibne vi04, vi03, L14 | madday.xyzw ACC, vf02, vf11
|
|
nop | maddz.xyzw vf11, vf03, vf11
|
|
ibne vi06, vi03, L28 | nop
|
|
nop | nop
|
|
b L64 | nop
|
|
nop | nop
|
|
L13:
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
L14:
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi08, vf10.x | itof0.xyzw vf23, vf23
|
|
ilw.y vi09, -9(vi01) | maxx.xyzw vf11, vf11, vf00
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
lq.xyz vf29, 4(vi08) | add.xyzw vf16, vf16, vf19
|
|
lq.xyz vf30, 5(vi08) | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L15 | madday.xyzw ACC, vf05, vf11
|
|
lq.xyzw vf31, 6(vi08) | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L15:
|
|
lq.xyzw vf25, 0(vi08) | maddw.xyzw vf11, vf07, vf00
|
|
lq.xyzw vf26, 1(vi08) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf27, 2(vi08) | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
ibne vi00, vi09, L16 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L16:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
lq.xyzw vf28, 3(vi08) | mulw.xyzw vf12, vf12, vf20
|
|
erleng.xyz P, vf13 | ftoi0.xyzw vf11, vf11
|
|
ibne vi04, vi03, L17 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
ibne vi06, vi03, L33 | nop
|
|
ilw.y vi09, -6(vi01) | nop
|
|
ibne vi07, vi03, L69 | nop
|
|
nop | nop
|
|
b L140 | nop
|
|
nop | nop
|
|
L17:
|
|
lqi.xyzw vf08, vi01 | mulax.xyzw ACC, vf01, vf12
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi08, vf08.x | itof0.xyzw vf23, vf23
|
|
ilw.y vi09, -9(vi01) | maxx.xyzw vf12, vf12, vf00
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
lq.xyz vf29, 4(vi08) | add.xyzw vf14, vf14, vf19
|
|
lq.xyz vf30, 5(vi08) | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L18 | madday.xyzw ACC, vf05, vf12
|
|
lq.xyzw vf31, 6(vi08) | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L18:
|
|
lq.xyzw vf25, 0(vi08) | maddw.xyzw vf12, vf07, vf00
|
|
lq.xyzw vf26, 1(vi08) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf27, 2(vi08) | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
ibne vi00, vi09, L19 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L19:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
lq.xyzw vf28, 3(vi08) | mulw.xyzw vf13, vf13, vf20
|
|
erleng.xyz P, vf11 | ftoi0.xyzw vf12, vf12
|
|
ibne vi04, vi03, L20 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
ibne vi06, vi03, L38 | nop
|
|
ilw.y vi09, -6(vi01) | nop
|
|
ibne vi07, vi03, L74 | nop
|
|
nop | nop
|
|
b L150 | nop
|
|
nop | nop
|
|
L20:
|
|
lqi.xyzw vf09, vi01 | mulax.xyzw ACC, vf01, vf13
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi08, vf09.x | itof0.xyzw vf23, vf23
|
|
ilw.y vi09, -9(vi01) | maxx.xyzw vf13, vf13, vf00
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
lq.xyz vf29, 4(vi08) | add.xyzw vf15, vf15, vf19
|
|
lq.xyz vf30, 5(vi08) | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L21 | madday.xyzw ACC, vf05, vf13
|
|
lq.xyzw vf31, 6(vi08) | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L21:
|
|
lq.xyzw vf25, 0(vi08) | maddw.xyzw vf13, vf07, vf00
|
|
lq.xyzw vf26, 1(vi08) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf27, 2(vi08) | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
ibne vi00, vi09, L22 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L22:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
lq.xyzw vf28, 3(vi08) | mulw.xyzw vf11, vf11, vf20
|
|
erleng.xyz P, vf12 | ftoi0.xyzw vf13, vf13
|
|
ibne vi04, vi03, L13 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
ibne vi06, vi03, L27 | nop
|
|
ilw.y vi09, -6(vi01) | nop
|
|
ibne vi07, vi03, L63 | nop
|
|
nop | nop
|
|
b L160 | nop
|
|
nop | nop
|
|
L23:
|
|
ibeq vi00, vi06, L58 | nop
|
|
iadd vi02, vi02, vi12 | nop
|
|
lqi.xyzw vf08, vi01 | nop
|
|
lqi.xyzw vf24, vi02 | nop
|
|
lqi.xyzw vf11, vi01 | nop
|
|
lqi.xyzw vf14, vi01 | nop
|
|
mtir vi10, vf08.x | nop
|
|
mtir vi13, vf08.y | itof0.xyzw vf24, vf24
|
|
iaddi vi06, vi06, -0x1 | add.zw vf08, vf08, vf17
|
|
nop | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
iand vi13, vi13, vi05 | nop
|
|
lq.xyzw vf20, 0(vi10) | nop
|
|
lq.xyzw vf25, 0(vi13) | nop
|
|
lq.xyzw vf23, 1(vi10) | nop
|
|
lq.xyzw vf26, 1(vi13) | nop
|
|
lq.xyzw vf20, 2(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi13) | maddy.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi10) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi13) | maddy.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi13) | maddy.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi10) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi13) | maddy.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi13) | maddy.xyz vf29, vf29, vf24
|
|
mtir vi10, vf11.x | mulax.xyzw ACC, vf23, vf24
|
|
mtir vi13, vf11.y | maddy.xyz vf30, vf30, vf24
|
|
nop | mulax.xyzw ACC, vf20, vf24
|
|
nop | maddy.xyzw vf31, vf31, vf24
|
|
nop | mulaz.xyzw ACC, vf29, vf08
|
|
nop | maddaz.xyzw ACC, vf30, vf11
|
|
nop | maddz.xyz vf11, vf31, vf14
|
|
nop | nop
|
|
nop | nop
|
|
nop | mulaw.xyzw ACC, vf25, vf08
|
|
iaddiu vi08, vi00, 0x243 | nop
|
|
erleng.xyz P, vf11 | nop
|
|
ior vi15, vi07, vi00 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
lqi.xyzw vf09, vi01 | nop
|
|
ilwr.y vi03, vi12 | nop
|
|
ilw.z vi07, 1(vi12) | nop
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | nop
|
|
mtir vi11, vf09.x | nop
|
|
ibeq vi00, vi15, L24 | nop
|
|
mtir vi14, vf09.y | nop
|
|
iaddiu vi08, vi00, 0x539 | miniw.w vf08, vf08, vf01
|
|
L24:
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
iadd vi03, vi03, vi12 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
iadd vi06, vi06, vi03 | nop
|
|
iadd vi07, vi07, vi06 | nop
|
|
iand vi14, vi14, vi05 | nop
|
|
ibne vi05, vi11, L25 | nop
|
|
nop | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | nop
|
|
b L26 | nop
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L25:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
lq.xyzw vf25, 0(vi14) | nop
|
|
lq.xyzw vf23, 1(vi11) | nop
|
|
lq.xyzw vf26, 1(vi14) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 2(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi14) | maddw.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi11) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi14) | maddw.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi14) | maddw.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi11) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi14) | maddw.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi14) | maddw.xyz vf29, vf29, vf24
|
|
lqi.xyzw vf23, vi02 | mulaz.xyzw ACC, vf23, vf24
|
|
mtir vi11, vf12.x | maddw.xyz vf30, vf30, vf24
|
|
mtir vi14, vf12.y | mulaz.xyzw ACC, vf20, vf24
|
|
iaddiu vi08, vi00, 0x1a1 | maddw.xyzw vf31, vf31, vf24
|
|
ibeq vi00, vi15, L26 | nop
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
iaddiu vi08, vi00, 0x48e | nop
|
|
L26:
|
|
nop | mulaz.xyzw ACC, vf29, vf09
|
|
nop | maddaz.xyzw ACC, vf30, vf12
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
nop | nop
|
|
1024.0 | miniw.w vf08, vf08, vf03 :i
|
|
ibne vi00, vi15, L90 | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
erleng.xyz P, vf12 | nop
|
|
ibeq vi06, vi03, L62 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
jr vi08 | madday.xyzw ACC, vf02, vf11
|
|
nop | maddz.xyzw vf11, vf03, vf11
|
|
L27:
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
L28:
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi12, vf10.x | itof0.xyzw vf23, vf23
|
|
mtir vi15, vf10.y | maxx.xyzw vf11, vf11, vf00
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
iand vi12, vi12, vi05 | add.xyzw vf16, vf16, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L29 | madday.xyzw ACC, vf05, vf11
|
|
iand vi15, vi15, vi05 | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L29:
|
|
ibne vi05, vi12, L30 | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
b L31 | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
L30:
|
|
lq.xyzw vf20, 0(vi12) | mul.xyzw vf15, vf15, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf25, 0(vi15) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi12) | mul.xyzw vf11, vf11, vf23
|
|
lq.xyzw vf26, 1(vi15) | add.xyzw vf09, vf09, vf22
|
|
lq.xyzw vf20, 2(vi12) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi15) | maddy.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi12) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi15) | maddy.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi12) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi15) | maddy.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi12) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi15) | maddy.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi12) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi15) | maddy.xyz vf29, vf29, vf24
|
|
mtir vi12, vf13.x | mulax.xyzw ACC, vf23, vf24
|
|
mtir vi15, vf13.y | maddy.xyz vf30, vf30, vf24
|
|
b L46 | mulax.xyzw ACC, vf20, vf24
|
|
lqi.xyzw vf23, vi03 | maddy.xyzw vf31, vf31, vf24
|
|
L31:
|
|
ibgez vi09, L32 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L32:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf12, vf12, vf20
|
|
erleng.xyz P, vf13 | ftoi0.xyzw vf11, vf11
|
|
ibne vi06, vi03, L33 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
ibne vi07, vi03, L69 | nop
|
|
nop | nop
|
|
b L140 | nop
|
|
nop | nop
|
|
L33:
|
|
lqi.xyzw vf08, vi01 | mulax.xyzw ACC, vf01, vf12
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi10, vf08.x | itof0.xyzw vf23, vf23
|
|
mtir vi13, vf08.y | maxx.xyzw vf12, vf12, vf00
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L34 | madday.xyzw ACC, vf05, vf12
|
|
iand vi13, vi13, vi05 | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L34:
|
|
ibne vi05, vi10, L35 | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
b L36 | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
L35:
|
|
lq.xyzw vf20, 0(vi10) | mul.xyzw vf16, vf16, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf25, 0(vi13) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi10) | mul.xyzw vf12, vf12, vf23
|
|
lq.xyzw vf26, 1(vi13) | add.xyzw vf10, vf10, vf22
|
|
lq.xyzw vf20, 2(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi13) | maddy.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi10) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi13) | maddy.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi13) | maddy.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi10) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi13) | maddy.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi13) | maddy.xyz vf29, vf29, vf24
|
|
mtir vi10, vf11.x | mulax.xyzw ACC, vf23, vf24
|
|
mtir vi13, vf11.y | maddy.xyz vf30, vf30, vf24
|
|
b L51 | mulax.xyzw ACC, vf20, vf24
|
|
lqi.xyzw vf23, vi03 | maddy.xyzw vf31, vf31, vf24
|
|
L36:
|
|
ibgez vi09, L37 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L37:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf13, vf13, vf20
|
|
erleng.xyz P, vf11 | ftoi0.xyzw vf12, vf12
|
|
ibne vi06, vi03, L38 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
ibne vi07, vi03, L74 | nop
|
|
nop | nop
|
|
b L150 | nop
|
|
nop | nop
|
|
L38:
|
|
lqi.xyzw vf09, vi01 | mulax.xyzw ACC, vf01, vf13
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi11, vf09.x | itof0.xyzw vf23, vf23
|
|
mtir vi14, vf09.y | maxx.xyzw vf13, vf13, vf00
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L39 | madday.xyzw ACC, vf05, vf13
|
|
iand vi14, vi14, vi05 | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L39:
|
|
ibne vi05, vi11, L40 | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
b L41 | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L40:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf25, 0(vi14) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi11) | mul.xyzw vf13, vf13, vf23
|
|
lq.xyzw vf26, 1(vi14) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 2(vi11) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi14) | maddy.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi11) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi14) | maddy.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi11) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi14) | maddy.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi11) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi14) | maddy.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi11) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi14) | maddy.xyz vf29, vf29, vf24
|
|
mtir vi11, vf12.x | mulax.xyzw ACC, vf23, vf24
|
|
mtir vi14, vf12.y | maddy.xyz vf30, vf30, vf24
|
|
b L56 | mulax.xyzw ACC, vf20, vf24
|
|
lqi.xyzw vf23, vi03 | maddy.xyzw vf31, vf31, vf24
|
|
L41:
|
|
ibgez vi09, L42 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L42:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
erleng.xyz P, vf12 | ftoi0.xyzw vf13, vf13
|
|
ibne vi06, vi03, L27 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
ibne vi07, vi03, L63 | nop
|
|
nop | nop
|
|
b L160 | nop
|
|
nop | nop
|
|
L43:
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi12, vf10.x | itof0.xyzw vf23, vf23
|
|
mtir vi15, vf10.y | maxx.xyzw vf11, vf11, vf00
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
iand vi12, vi12, vi05 | add.xyzw vf16, vf16, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L44 | madday.xyzw ACC, vf05, vf11
|
|
iand vi15, vi15, vi05 | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L44:
|
|
ibne vi05, vi12, L45 | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
b L46 | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
L45:
|
|
lq.xyzw vf20, 0(vi12) | mul.xyzw vf15, vf15, Q
|
|
lq.xyzw vf25, 0(vi15) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi12) | mul.xyzw vf11, vf11, vf23
|
|
lq.xyzw vf26, 1(vi15) | add.xyzw vf09, vf09, vf22
|
|
lq.xyzw vf20, 2(vi12) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi15) | maddw.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi12) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi15) | maddw.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi12) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi15) | maddw.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi12) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi15) | maddw.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi12) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi15) | maddw.xyz vf29, vf29, vf24
|
|
lqi.xyzw vf23, vi02 | mulaz.xyzw ACC, vf23, vf24
|
|
mtir vi12, vf13.x | maddw.xyz vf30, vf30, vf24
|
|
mtir vi15, vf13.y | mulaz.xyzw ACC, vf20, vf24
|
|
b L31 | maddw.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L46:
|
|
ibgez vi09, L47 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L47:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf12, vf12, vf20
|
|
erleng.xyz P, vf13 | ftoi0.xyzw vf11, vf11
|
|
ibne vi06, vi03, L48 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
ibne vi07, vi03, L69 | nop
|
|
nop | nop
|
|
b L140 | nop
|
|
nop | nop
|
|
L48:
|
|
lqi.xyzw vf08, vi01 | mulax.xyzw ACC, vf01, vf12
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi10, vf08.x | itof0.xyzw vf23, vf23
|
|
mtir vi13, vf08.y | maxx.xyzw vf12, vf12, vf00
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L49 | madday.xyzw ACC, vf05, vf12
|
|
iand vi13, vi13, vi05 | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L49:
|
|
ibne vi05, vi10, L50 | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
b L51 | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
L50:
|
|
lq.xyzw vf20, 0(vi10) | mul.xyzw vf16, vf16, Q
|
|
lq.xyzw vf25, 0(vi13) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi10) | mul.xyzw vf12, vf12, vf23
|
|
lq.xyzw vf26, 1(vi13) | add.xyzw vf10, vf10, vf22
|
|
lq.xyzw vf20, 2(vi10) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi13) | maddw.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi10) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi13) | maddw.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi10) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi13) | maddw.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi10) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi13) | maddw.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi10) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi13) | maddw.xyz vf29, vf29, vf24
|
|
lqi.xyzw vf23, vi02 | mulaz.xyzw ACC, vf23, vf24
|
|
mtir vi10, vf11.x | maddw.xyz vf30, vf30, vf24
|
|
mtir vi13, vf11.y | mulaz.xyzw ACC, vf20, vf24
|
|
b L36 | maddw.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L51:
|
|
ibgez vi09, L52 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L52:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf13, vf13, vf20
|
|
erleng.xyz P, vf11 | ftoi0.xyzw vf12, vf12
|
|
ibne vi06, vi03, L53 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
ibne vi07, vi03, L74 | nop
|
|
nop | nop
|
|
b L150 | nop
|
|
nop | nop
|
|
L53:
|
|
lqi.xyzw vf09, vi01 | mulax.xyzw ACC, vf01, vf13
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi11, vf09.x | itof0.xyzw vf23, vf23
|
|
mtir vi14, vf09.y | maxx.xyzw vf13, vf13, vf00
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L54 | madday.xyzw ACC, vf05, vf13
|
|
iand vi14, vi14, vi05 | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L54:
|
|
ibne vi05, vi11, L55 | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
b L56 | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L55:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
lq.xyzw vf25, 0(vi14) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi11) | mul.xyzw vf13, vf13, vf23
|
|
lq.xyzw vf26, 1(vi14) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 2(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi14) | maddw.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi11) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi14) | maddw.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi14) | maddw.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi11) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi14) | maddw.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi14) | maddw.xyz vf29, vf29, vf24
|
|
lqi.xyzw vf23, vi02 | mulaz.xyzw ACC, vf23, vf24
|
|
mtir vi11, vf12.x | maddw.xyz vf30, vf30, vf24
|
|
mtir vi14, vf12.y | mulaz.xyzw ACC, vf20, vf24
|
|
b L41 | maddw.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L56:
|
|
ibgez vi09, L57 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L57:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
erleng.xyz P, vf12 | ftoi0.xyzw vf13, vf13
|
|
ibne vi06, vi03, L43 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
ibne vi07, vi03, L69 | nop
|
|
nop | nop
|
|
b L160 | nop
|
|
nop | nop
|
|
L58:
|
|
lqi.xyzw vf08, vi01 | nop
|
|
lqi.xyzw vf24, vi02 | nop
|
|
lqi.xyzw vf11, vi01 | nop
|
|
lqi.xyzw vf14, vi01 | nop
|
|
mtir vi10, vf08.x | nop
|
|
mtir vi13, vf08.y | itof0.xyzw vf24, vf24
|
|
nop | add.zw vf08, vf08, vf17
|
|
nop | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
ilw.w vi08, -1(vi02) | mulw.xyzw vf24, vf24, vf29
|
|
iand vi13, vi13, vi05 | nop
|
|
lq.xyzw vf20, 0(vi10) | nop
|
|
lq.xyzw vf31, 0(vi13) | nop
|
|
lq.xyzw vf25, 0(vi08) | nop
|
|
lq.xyzw vf23, 1(vi10) | nop
|
|
lq.xyzw vf20, 1(vi13) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi10) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi13) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi10) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi13) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi10) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi13) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi10) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi13) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi10) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi13) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi10, vf11.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi13, vf11.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
nop | itof0.xyzw vf24, vf23
|
|
nop | mulaz.xyzw ACC, vf29, vf08
|
|
nop | maddaz.xyzw ACC, vf30, vf11
|
|
nop | maddz.xyz vf11, vf31, vf14
|
|
nop | nop
|
|
nop | nop
|
|
nop | mulaw.xyzw ACC, vf25, vf08
|
|
nop | nop
|
|
erleng.xyz P, vf11 | nop
|
|
ior vi15, vi07, vi00 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
lqi.xyzw vf09, vi01 | nop
|
|
ilwr.y vi03, vi12 | nop
|
|
ilw.z vi07, 1(vi12) | nop
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | nop
|
|
mtir vi11, vf09.x | nop
|
|
ibeq vi00, vi15, L59 | nop
|
|
mtir vi14, vf09.y | nop
|
|
nop | miniw.w vf08, vf08, vf01
|
|
L59:
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
iadd vi03, vi03, vi12 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
ilw.w vi08, -1(vi02) | nop
|
|
iadd vi07, vi07, vi03 | nop
|
|
iand vi14, vi14, vi05 | nop
|
|
ibne vi05, vi11, L60 | nop
|
|
iaddi vi07, vi07, -0x1 | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | nop
|
|
b L61 | nop
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L60:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf31, 0(vi14) | nop
|
|
lq.xyzw vf25, 0(vi08) | nop
|
|
lq.xyzw vf23, 1(vi11) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 1(vi14) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi11) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi14) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi11) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi14) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi11) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi14) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi11) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi14) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi11) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi14) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi11, vf12.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi14, vf12.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L61:
|
|
nop | mulaz.xyzw ACC, vf29, vf09
|
|
nop | maddaz.xyzw ACC, vf30, vf12
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
nop | nop
|
|
1024.0 | miniw.w vf08, vf08, vf03 :i
|
|
ibne vi00, vi15, L122 | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
erleng.xyz P, vf12 | nop
|
|
nop | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
L62:
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
b L64 | madday.xyzw ACC, vf02, vf11
|
|
nop | maddz.xyzw vf11, vf03, vf11
|
|
L63:
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
L64:
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi12, vf10.x | itof0.xyzw vf23, vf23
|
|
mtir vi15, vf10.y | maxx.xyzw vf11, vf11, vf00
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
iand vi12, vi12, vi05 | add.xyzw vf16, vf16, vf19
|
|
ilw.w vi08, -1(vi02) | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L65 | madday.xyzw ACC, vf05, vf11
|
|
iand vi15, vi15, vi05 | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L65:
|
|
ibne vi05, vi12, L66 | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
b L67 | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
L66:
|
|
lq.xyzw vf20, 0(vi12) | mul.xyzw vf15, vf15, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf31, 0(vi15) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf25, 0(vi08) | mul.xyzw vf11, vf11, vf23
|
|
lq.xyzw vf23, 1(vi12) | add.xyzw vf09, vf09, vf22
|
|
lq.xyzw vf20, 1(vi15) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi12) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi15) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi12) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi15) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi12) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi15) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi12) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi15) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi12) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi15) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi12, vf13.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi15, vf13.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L67:
|
|
ibgez vi09, L68 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L68:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf12, vf12, vf20
|
|
erleng.xyz P, vf13 | ftoi0.xyzw vf11, vf11
|
|
ibeq vi07, vi03, L140 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
L69:
|
|
lqi.xyzw vf08, vi01 | mulax.xyzw ACC, vf01, vf12
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi10, vf08.x | itof0.xyzw vf23, vf23
|
|
mtir vi13, vf08.y | maxx.xyzw vf12, vf12, vf00
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
ilw.w vi08, -1(vi02) | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L70 | madday.xyzw ACC, vf05, vf12
|
|
iand vi13, vi13, vi05 | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L70:
|
|
ibne vi05, vi10, L71 | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
b L72 | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
L71:
|
|
lq.xyzw vf20, 0(vi10) | mul.xyzw vf16, vf16, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf31, 0(vi13) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf25, 0(vi08) | mul.xyzw vf12, vf12, vf23
|
|
lq.xyzw vf23, 1(vi10) | add.xyzw vf10, vf10, vf22
|
|
lq.xyzw vf20, 1(vi13) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi10) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi13) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi10) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi13) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi10) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi13) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi10) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi13) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi10) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi13) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi10, vf11.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi13, vf11.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L72:
|
|
ibgez vi09, L73 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L73:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf13, vf13, vf20
|
|
erleng.xyz P, vf11 | ftoi0.xyzw vf12, vf12
|
|
ibeq vi07, vi03, L150 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
L74:
|
|
lqi.xyzw vf09, vi01 | mulax.xyzw ACC, vf01, vf13
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi11, vf09.x | itof0.xyzw vf23, vf23
|
|
mtir vi14, vf09.y | maxx.xyzw vf13, vf13, vf00
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
ilw.w vi08, -1(vi02) | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L75 | madday.xyzw ACC, vf05, vf13
|
|
iand vi14, vi14, vi05 | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L75:
|
|
ibne vi05, vi11, L76 | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
b L77 | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L76:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf31, 0(vi14) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf25, 0(vi08) | mul.xyzw vf13, vf13, vf23
|
|
lq.xyzw vf23, 1(vi11) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 1(vi14) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi11) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi14) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi11) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi14) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi11) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi14) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi11) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi14) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi11) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi14) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi11, vf12.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi14, vf12.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L77:
|
|
ibgez vi09, L78 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L78:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
erleng.xyz P, vf12 | ftoi0.xyzw vf13, vf13
|
|
ibne vi07, vi03, L63 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
b L160 | nop
|
|
nop | nop
|
|
L79:
|
|
erleng.xyz P, vf12 | maxi.xy vf08, vf08, I
|
|
3072.0 | nop :i
|
|
nop | minii.xy vf08, vf08, I
|
|
nop | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
ibne vi04, vi03, L81 | madday.xyzw ACC, vf02, vf11
|
|
nop | maddz.xyzw vf11, vf03, vf11
|
|
ibne vi06, vi03, L92 | nop
|
|
nop | nop
|
|
b L125 | nop
|
|
nop | nop
|
|
L80:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf11 :i
|
|
lqi.xyzw vf10, vi01 | minii.xy vf08, vf08, I
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
L81:
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi08, vf10.x | itof0.xyzw vf23, vf23
|
|
ilw.y vi09, -9(vi01) | maxx.xyzw vf11, vf11, vf00
|
|
nop | miniw.w vf09, vf09, vf01
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
lq.xyz vf29, 4(vi08) | add.xyzw vf16, vf16, vf19
|
|
lq.xyz vf30, 5(vi08) | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L82 | madday.xyzw ACC, vf05, vf11
|
|
lq.xyzw vf31, 6(vi08) | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L82:
|
|
lq.xyzw vf25, 0(vi08) | maddw.xyzw vf11, vf07, vf00
|
|
lq.xyzw vf26, 1(vi08) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf27, 2(vi08) | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
ibne vi00, vi09, L83 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L83:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
lq.xyzw vf28, 3(vi08) | mulw.xyzw vf12, vf12, vf20
|
|
1024.0 | ftoi0.xyzw vf11, vf11 :i
|
|
erleng.xyz P, vf13 | maxi.xy vf09, vf09, I
|
|
ibne vi04, vi03, L84 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
ibne vi06, vi03, L97 | nop
|
|
ilw.y vi09, -6(vi01) | nop
|
|
ibne vi07, vi03, L130 | nop
|
|
nop | nop
|
|
b L140 | nop
|
|
nop | nop
|
|
L84:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf12 :i
|
|
lqi.xyzw vf08, vi01 | minii.xy vf09, vf09, I
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi08, vf08.x | itof0.xyzw vf23, vf23
|
|
ilw.y vi09, -9(vi01) | maxx.xyzw vf12, vf12, vf00
|
|
nop | miniw.w vf10, vf10, vf01
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
lq.xyz vf29, 4(vi08) | add.xyzw vf14, vf14, vf19
|
|
lq.xyz vf30, 5(vi08) | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L85 | madday.xyzw ACC, vf05, vf12
|
|
lq.xyzw vf31, 6(vi08) | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L85:
|
|
lq.xyzw vf25, 0(vi08) | maddw.xyzw vf12, vf07, vf00
|
|
lq.xyzw vf26, 1(vi08) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf27, 2(vi08) | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
ibne vi00, vi09, L86 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L86:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
lq.xyzw vf28, 3(vi08) | mulw.xyzw vf13, vf13, vf20
|
|
1024.0 | ftoi0.xyzw vf12, vf12 :i
|
|
erleng.xyz P, vf11 | maxi.xy vf10, vf10, I
|
|
ibne vi04, vi03, L87 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
ibne vi06, vi03, L102 | nop
|
|
ilw.y vi09, -6(vi01) | nop
|
|
ibne vi07, vi03, L135 | nop
|
|
nop | nop
|
|
b L150 | nop
|
|
nop | nop
|
|
L87:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf13 :i
|
|
lqi.xyzw vf09, vi01 | minii.xy vf10, vf10, I
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi08, vf09.x | itof0.xyzw vf23, vf23
|
|
ilw.y vi09, -9(vi01) | maxx.xyzw vf13, vf13, vf00
|
|
nop | miniw.w vf08, vf08, vf01
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
lq.xyz vf29, 4(vi08) | add.xyzw vf15, vf15, vf19
|
|
lq.xyz vf30, 5(vi08) | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L88 | madday.xyzw ACC, vf05, vf13
|
|
lq.xyzw vf31, 6(vi08) | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L88:
|
|
lq.xyzw vf25, 0(vi08) | maddw.xyzw vf13, vf07, vf00
|
|
lq.xyzw vf26, 1(vi08) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf27, 2(vi08) | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
ibne vi00, vi09, L89 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L89:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
lq.xyzw vf28, 3(vi08) | mulw.xyzw vf11, vf11, vf20
|
|
1024.0 | ftoi0.xyzw vf13, vf13 :i
|
|
erleng.xyz P, vf12 | maxi.xy vf08, vf08, I
|
|
ibne vi04, vi03, L80 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
ibne vi06, vi03, L91 | nop
|
|
ilw.y vi09, -6(vi01) | nop
|
|
ibne vi07, vi03, L124 | nop
|
|
nop | nop
|
|
b L160 | nop
|
|
nop | nop
|
|
L90:
|
|
erleng.xyz P, vf12 | maxi.xy vf08, vf08, I
|
|
3072.0 | nop :i
|
|
nop | minii.xy vf08, vf08, I
|
|
ibeq vi06, vi03, L123 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
jr vi08 | madday.xyzw ACC, vf02, vf11
|
|
nop | maddz.xyzw vf11, vf03, vf11
|
|
L91:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf11 :i
|
|
lqi.xyzw vf10, vi01 | minii.xy vf08, vf08, I
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
L92:
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi12, vf10.x | itof0.xyzw vf23, vf23
|
|
mtir vi15, vf10.y | maxx.xyzw vf11, vf11, vf00
|
|
nop | miniw.w vf09, vf09, vf01
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
iand vi12, vi12, vi05 | add.xyzw vf16, vf16, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L93 | madday.xyzw ACC, vf05, vf11
|
|
iand vi15, vi15, vi05 | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L93:
|
|
ibne vi05, vi12, L94 | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
b L95 | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
L94:
|
|
lq.xyzw vf20, 0(vi12) | mul.xyzw vf15, vf15, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf25, 0(vi15) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi12) | mul.xyzw vf11, vf11, vf23
|
|
lq.xyzw vf26, 1(vi15) | add.xyzw vf09, vf09, vf22
|
|
lq.xyzw vf20, 2(vi12) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi15) | maddy.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi12) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi15) | maddy.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi12) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi15) | maddy.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi12) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi15) | maddy.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi12) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi15) | maddy.xyz vf29, vf29, vf24
|
|
mtir vi12, vf13.x | mulax.xyzw ACC, vf23, vf24
|
|
mtir vi15, vf13.y | maddy.xyz vf30, vf30, vf24
|
|
b L110 | mulax.xyzw ACC, vf20, vf24
|
|
lqi.xyzw vf23, vi03 | maddy.xyzw vf31, vf31, vf24
|
|
L95:
|
|
ibgez vi09, L96 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L96:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf12, vf12, vf20
|
|
1024.0 | ftoi0.xyzw vf11, vf11 :i
|
|
erleng.xyz P, vf13 | maxi.xy vf09, vf09, I
|
|
ibne vi06, vi03, L97 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
ibne vi07, vi03, L130 | nop
|
|
nop | nop
|
|
b L140 | nop
|
|
nop | nop
|
|
L97:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf12 :i
|
|
lqi.xyzw vf08, vi01 | minii.xy vf09, vf09, I
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi10, vf08.x | itof0.xyzw vf23, vf23
|
|
mtir vi13, vf08.y | maxx.xyzw vf12, vf12, vf00
|
|
nop | miniw.w vf10, vf10, vf01
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L98 | madday.xyzw ACC, vf05, vf12
|
|
iand vi13, vi13, vi05 | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L98:
|
|
ibne vi05, vi10, L99 | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
b L100 | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
L99:
|
|
lq.xyzw vf20, 0(vi10) | mul.xyzw vf16, vf16, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf25, 0(vi13) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi10) | mul.xyzw vf12, vf12, vf23
|
|
lq.xyzw vf26, 1(vi13) | add.xyzw vf10, vf10, vf22
|
|
lq.xyzw vf20, 2(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi13) | maddy.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi10) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi13) | maddy.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi13) | maddy.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi10) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi13) | maddy.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi10) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi13) | maddy.xyz vf29, vf29, vf24
|
|
mtir vi10, vf11.x | mulax.xyzw ACC, vf23, vf24
|
|
mtir vi13, vf11.y | maddy.xyz vf30, vf30, vf24
|
|
b L115 | mulax.xyzw ACC, vf20, vf24
|
|
lqi.xyzw vf23, vi03 | maddy.xyzw vf31, vf31, vf24
|
|
L100:
|
|
ibgez vi09, L101 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L101:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf13, vf13, vf20
|
|
1024.0 | ftoi0.xyzw vf12, vf12 :i
|
|
erleng.xyz P, vf11 | maxi.xy vf10, vf10, I
|
|
ibne vi06, vi03, L102 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
ibne vi07, vi03, L135 | nop
|
|
nop | nop
|
|
b L150 | nop
|
|
nop | nop
|
|
L102:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf13 :i
|
|
lqi.xyzw vf09, vi01 | minii.xy vf10, vf10, I
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi11, vf09.x | itof0.xyzw vf23, vf23
|
|
mtir vi14, vf09.y | maxx.xyzw vf13, vf13, vf00
|
|
nop | miniw.w vf08, vf08, vf01
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L103 | madday.xyzw ACC, vf05, vf13
|
|
iand vi14, vi14, vi05 | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L103:
|
|
ibne vi05, vi11, L104 | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
b L105 | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L104:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf25, 0(vi14) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi11) | mul.xyzw vf13, vf13, vf23
|
|
lq.xyzw vf26, 1(vi14) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 2(vi11) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi14) | maddy.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi11) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi14) | maddy.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi11) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi14) | maddy.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi11) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi14) | maddy.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi11) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi14) | maddy.xyz vf29, vf29, vf24
|
|
mtir vi11, vf12.x | mulax.xyzw ACC, vf23, vf24
|
|
mtir vi14, vf12.y | maddy.xyz vf30, vf30, vf24
|
|
b L120 | mulax.xyzw ACC, vf20, vf24
|
|
lqi.xyzw vf23, vi03 | maddy.xyzw vf31, vf31, vf24
|
|
L105:
|
|
ibgez vi09, L106 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L106:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
1024.0 | ftoi0.xyzw vf13, vf13 :i
|
|
erleng.xyz P, vf12 | maxi.xy vf08, vf08, I
|
|
ibne vi06, vi03, L91 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
ibne vi07, vi03, L124 | nop
|
|
nop | nop
|
|
b L160 | nop
|
|
nop | nop
|
|
L107:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf11 :i
|
|
lqi.xyzw vf10, vi01 | minii.xy vf08, vf08, I
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi12, vf10.x | itof0.xyzw vf23, vf23
|
|
mtir vi15, vf10.y | maxx.xyzw vf11, vf11, vf00
|
|
nop | miniw.w vf09, vf09, vf01
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
iand vi12, vi12, vi05 | add.xyzw vf16, vf16, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L108 | madday.xyzw ACC, vf05, vf11
|
|
iand vi15, vi15, vi05 | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L108:
|
|
ibne vi05, vi12, L109 | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
b L110 | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
L109:
|
|
lq.xyzw vf20, 0(vi12) | mul.xyzw vf15, vf15, Q
|
|
lq.xyzw vf25, 0(vi15) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi12) | mul.xyzw vf11, vf11, vf23
|
|
lq.xyzw vf26, 1(vi15) | add.xyzw vf09, vf09, vf22
|
|
lq.xyzw vf20, 2(vi12) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi15) | maddw.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi12) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi15) | maddw.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi12) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi15) | maddw.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi12) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi15) | maddw.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi12) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi15) | maddw.xyz vf29, vf29, vf24
|
|
lqi.xyzw vf23, vi02 | mulaz.xyzw ACC, vf23, vf24
|
|
mtir vi12, vf13.x | maddw.xyz vf30, vf30, vf24
|
|
mtir vi15, vf13.y | mulaz.xyzw ACC, vf20, vf24
|
|
b L95 | maddw.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L110:
|
|
ibgez vi09, L111 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L111:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf12, vf12, vf20
|
|
1024.0 | ftoi0.xyzw vf11, vf11 :i
|
|
erleng.xyz P, vf13 | maxi.xy vf09, vf09, I
|
|
ibne vi06, vi03, L112 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
ibne vi07, vi03, L130 | nop
|
|
nop | nop
|
|
b L140 | nop
|
|
nop | nop
|
|
L112:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf12 :i
|
|
lqi.xyzw vf08, vi01 | minii.xy vf09, vf09, I
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi10, vf08.x | itof0.xyzw vf23, vf23
|
|
mtir vi13, vf08.y | maxx.xyzw vf12, vf12, vf00
|
|
nop | miniw.w vf10, vf10, vf01
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L113 | madday.xyzw ACC, vf05, vf12
|
|
iand vi13, vi13, vi05 | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L113:
|
|
ibne vi05, vi10, L114 | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
b L115 | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
L114:
|
|
lq.xyzw vf20, 0(vi10) | mul.xyzw vf16, vf16, Q
|
|
lq.xyzw vf25, 0(vi13) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi10) | mul.xyzw vf12, vf12, vf23
|
|
lq.xyzw vf26, 1(vi13) | add.xyzw vf10, vf10, vf22
|
|
lq.xyzw vf20, 2(vi10) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi13) | maddw.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi10) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi13) | maddw.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi10) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi13) | maddw.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi10) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi13) | maddw.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi10) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi13) | maddw.xyz vf29, vf29, vf24
|
|
lqi.xyzw vf23, vi02 | mulaz.xyzw ACC, vf23, vf24
|
|
mtir vi10, vf11.x | maddw.xyz vf30, vf30, vf24
|
|
mtir vi13, vf11.y | mulaz.xyzw ACC, vf20, vf24
|
|
b L100 | maddw.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L115:
|
|
ibgez vi09, L116 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L116:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf13, vf13, vf20
|
|
1024.0 | ftoi0.xyzw vf12, vf12 :i
|
|
erleng.xyz P, vf11 | maxi.xy vf10, vf10, I
|
|
ibne vi06, vi03, L117 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
ibne vi07, vi03, L135 | nop
|
|
nop | nop
|
|
b L150 | nop
|
|
nop | nop
|
|
L117:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf13 :i
|
|
lqi.xyzw vf09, vi01 | minii.xy vf10, vf10, I
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi11, vf09.x | itof0.xyzw vf23, vf23
|
|
mtir vi14, vf09.y | maxx.xyzw vf13, vf13, vf00
|
|
nop | miniw.w vf08, vf08, vf01
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
nop | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L118 | madday.xyzw ACC, vf05, vf13
|
|
iand vi14, vi14, vi05 | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L118:
|
|
ibne vi05, vi11, L119 | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
b L120 | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L119:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
lq.xyzw vf25, 0(vi14) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf23, 1(vi11) | mul.xyzw vf13, vf13, vf23
|
|
lq.xyzw vf26, 1(vi14) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 2(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf27, 2(vi14) | maddw.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 3(vi11) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf28, 3(vi14) | maddw.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf20, 4(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi14) | maddw.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf23, 5(vi11) | mulaz.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi14) | maddw.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf20, 6(vi11) | mulaz.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf31, 6(vi14) | maddw.xyz vf29, vf29, vf24
|
|
lqi.xyzw vf23, vi02 | mulaz.xyzw ACC, vf23, vf24
|
|
mtir vi11, vf12.x | maddw.xyz vf30, vf30, vf24
|
|
mtir vi14, vf12.y | mulaz.xyzw ACC, vf20, vf24
|
|
b L105 | maddw.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L120:
|
|
ibgez vi09, L121 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L121:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
1024.0 | ftoi0.xyzw vf13, vf13 :i
|
|
erleng.xyz P, vf12 | maxi.xy vf08, vf08, I
|
|
ibne vi06, vi03, L107 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
ibne vi07, vi03, L130 | nop
|
|
nop | nop
|
|
b L160 | nop
|
|
nop | nop
|
|
L122:
|
|
erleng.xyz P, vf12 | maxi.xy vf08, vf08, I
|
|
3072.0 | nop :i
|
|
nop | minii.xy vf08, vf08, I
|
|
nop | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
L123:
|
|
lqi.xyzw vf10, vi01 | mulax.xyzw ACC, vf01, vf11
|
|
b L125 | madday.xyzw ACC, vf02, vf11
|
|
nop | maddz.xyzw vf11, vf03, vf11
|
|
L124:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf11 :i
|
|
lqi.xyzw vf10, vi01 | minii.xy vf08, vf08, I
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
L125:
|
|
lqi.xyzw vf13, vi01 | add.xyzw vf09, vf09, vf28
|
|
lqi.xyzw vf16, vi01 | maxw.w vf08, vf08, vf02
|
|
mtir vi12, vf10.x | itof0.xyzw vf23, vf23
|
|
mtir vi15, vf10.y | maxx.xyzw vf11, vf11, vf00
|
|
nop | miniw.w vf09, vf09, vf01
|
|
div Q, vf01.w, vf09.w | add.zw vf10, vf10, vf17
|
|
move.xyzw vf21, vf08 | add.xyzw vf13, vf13, vf18
|
|
iand vi12, vi12, vi05 | add.xyzw vf16, vf16, vf19
|
|
ilw.w vi08, -1(vi02) | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L126 | madday.xyzw ACC, vf05, vf11
|
|
iand vi15, vi15, vi05 | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L126:
|
|
ibne vi05, vi12, L127 | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf09, vf09, Q
|
|
mtir vi12, vf13.x | mul.xyzw vf15, vf15, Q
|
|
mtir vi15, vf13.y | ftoi4.xyzw vf21, vf21
|
|
b L128 | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
L127:
|
|
lq.xyzw vf20, 0(vi12) | mul.xyzw vf15, vf15, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf31, 0(vi15) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf25, 0(vi08) | mul.xyzw vf11, vf11, vf23
|
|
lq.xyzw vf23, 1(vi12) | add.xyzw vf09, vf09, vf22
|
|
lq.xyzw vf20, 1(vi15) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi12) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi15) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi12) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi15) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi12) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi15) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi12) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi15) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi12) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi15) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi12, vf13.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi15, vf13.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L128:
|
|
ibgez vi09, L129 | mulaz.xyzw ACC, vf29, vf10
|
|
sq.xyzw vf21, 2(vi10) | maddaz.xyzw ACC, vf30, vf13
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L129:
|
|
mfp.w vf20, P | maddz.xyz vf13, vf31, vf16
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | mulaw.xyzw ACC, vf25, vf10
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf12, vf12, vf20
|
|
1024.0 | ftoi0.xyzw vf11, vf11 :i
|
|
erleng.xyz P, vf13 | maxi.xy vf09, vf09, I
|
|
ibeq vi07, vi03, L140 | maddaw.xyzw ACC, vf26, vf13
|
|
mr32.z vf16, vf00 | maddw.xyzw vf10, vf27, vf16
|
|
L130:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf12 :i
|
|
lqi.xyzw vf08, vi01 | minii.xy vf09, vf09, I
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
lqi.xyzw vf11, vi01 | add.xyzw vf10, vf10, vf28
|
|
lqi.xyzw vf14, vi01 | maxw.w vf09, vf09, vf02
|
|
mtir vi10, vf08.x | itof0.xyzw vf23, vf23
|
|
mtir vi13, vf08.y | maxx.xyzw vf12, vf12, vf00
|
|
nop | miniw.w vf10, vf10, vf01
|
|
div Q, vf01.w, vf10.w | add.zw vf08, vf08, vf17
|
|
move.xyzw vf21, vf09 | add.xyzw vf11, vf11, vf18
|
|
iand vi10, vi10, vi05 | add.xyzw vf14, vf14, vf19
|
|
ilw.w vi08, -1(vi02) | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L131 | madday.xyzw ACC, vf05, vf12
|
|
iand vi13, vi13, vi05 | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L131:
|
|
ibne vi05, vi10, L132 | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf10, vf10, Q
|
|
mtir vi10, vf11.x | mul.xyzw vf16, vf16, Q
|
|
mtir vi13, vf11.y | ftoi4.xyzw vf21, vf21
|
|
b L133 | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
L132:
|
|
lq.xyzw vf20, 0(vi10) | mul.xyzw vf16, vf16, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf31, 0(vi13) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf25, 0(vi08) | mul.xyzw vf12, vf12, vf23
|
|
lq.xyzw vf23, 1(vi10) | add.xyzw vf10, vf10, vf22
|
|
lq.xyzw vf20, 1(vi13) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi10) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi13) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi10) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi13) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi10) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi13) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi10) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi13) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi10) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi13) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi10, vf11.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi13, vf11.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L133:
|
|
ibgez vi09, L134 | mulaz.xyzw ACC, vf29, vf08
|
|
sq.xyzw vf21, 2(vi11) | maddaz.xyzw ACC, vf30, vf11
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L134:
|
|
mfp.w vf20, P | maddz.xyz vf11, vf31, vf14
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | mulaw.xyzw ACC, vf25, vf08
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf13, vf13, vf20
|
|
1024.0 | ftoi0.xyzw vf12, vf12 :i
|
|
erleng.xyz P, vf11 | maxi.xy vf10, vf10, I
|
|
ibeq vi07, vi03, L150 | maddaw.xyzw ACC, vf26, vf11
|
|
mr32.z vf14, vf00 | maddw.xyzw vf08, vf27, vf14
|
|
L135:
|
|
3072.0 | mulax.xyzw ACC, vf01, vf13 :i
|
|
lqi.xyzw vf09, vi01 | minii.xy vf10, vf10, I
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
lqi.xyzw vf12, vi01 | add.xyzw vf08, vf08, vf28
|
|
lqi.xyzw vf15, vi01 | maxw.w vf10, vf10, vf02
|
|
mtir vi11, vf09.x | itof0.xyzw vf23, vf23
|
|
mtir vi14, vf09.y | maxx.xyzw vf13, vf13, vf00
|
|
nop | miniw.w vf08, vf08, vf01
|
|
div Q, vf01.w, vf08.w | add.zw vf09, vf09, vf17
|
|
move.xyzw vf21, vf10 | add.xyzw vf12, vf12, vf18
|
|
iand vi11, vi11, vi05 | add.xyzw vf15, vf15, vf19
|
|
ilw.w vi08, -1(vi02) | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L136 | madday.xyzw ACC, vf05, vf13
|
|
iand vi14, vi14, vi05 | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L136:
|
|
ibne vi05, vi11, L137 | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -9(vi01) | mul.xyz vf08, vf08, Q
|
|
mtir vi11, vf12.x | mul.xyzw vf14, vf14, Q
|
|
mtir vi14, vf12.y | ftoi4.xyzw vf21, vf21
|
|
b L138 | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
L137:
|
|
lq.xyzw vf20, 0(vi11) | mul.xyzw vf14, vf14, Q
|
|
nop | mulw.xyzw vf24, vf24, vf29
|
|
lq.xyzw vf31, 0(vi14) | ftoi4.xyzw vf21, vf21
|
|
lq.xyzw vf25, 0(vi08) | mul.xyzw vf13, vf13, vf23
|
|
lq.xyzw vf23, 1(vi11) | add.xyzw vf08, vf08, vf22
|
|
lq.xyzw vf20, 1(vi14) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf26, 1(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 2(vi11) | maddz.xyzw vf25, vf25, vf24
|
|
lq.xyzw vf23, 2(vi14) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf27, 2(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 3(vi11) | maddz.xyzw vf26, vf26, vf24
|
|
lq.xyzw vf31, 3(vi14) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf28, 3(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lq.xyzw vf23, 4(vi11) | maddz.xyzw vf27, vf27, vf24
|
|
lq.xyzw vf20, 4(vi14) | mulax.xyzw ACC, vf20, vf24
|
|
lq.xyz vf29, 4(vi08) | madday.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 5(vi11) | maddz.xyzw vf28, vf28, vf24
|
|
lq.xyzw vf23, 5(vi14) | mulax.xyzw ACC, vf23, vf24
|
|
lq.xyz vf30, 5(vi08) | madday.xyzw ACC, vf20, vf24
|
|
lq.xyzw vf20, 6(vi11) | maddz.xyz vf29, vf29, vf24
|
|
lq.xyzw vf22, 6(vi14) | mulax.xyzw ACC, vf31, vf24
|
|
lq.xyzw vf31, 6(vi08) | madday.xyzw ACC, vf23, vf24
|
|
lqi.xyzw vf23, vi02 | maddz.xyz vf30, vf30, vf24
|
|
mtir vi11, vf12.x | mulax.xyzw ACC, vf20, vf24
|
|
mtir vi14, vf12.y | madday.xyzw ACC, vf22, vf24
|
|
lq.xyzw vf22, 2(vi00) | maddz.xyzw vf31, vf31, vf24
|
|
lqi.xyzw vf23, vi03 | itof0.xyzw vf24, vf23
|
|
L138:
|
|
ibgez vi09, L139 | mulaz.xyzw ACC, vf29, vf09
|
|
sq.xyzw vf21, 2(vi12) | maddaz.xyzw ACC, vf30, vf12
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L139:
|
|
mfp.w vf20, P | maddz.xyz vf12, vf31, vf15
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | mulaw.xyzw ACC, vf25, vf09
|
|
ilw.y vi09, -6(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
1024.0 | ftoi0.xyzw vf13, vf13 :i
|
|
erleng.xyz P, vf12 | maxi.xy vf08, vf08, I
|
|
ibne vi07, vi03, L124 | maddaw.xyzw ACC, vf26, vf12
|
|
mr32.z vf15, vf00 | maddw.xyzw vf09, vf27, vf15
|
|
b L160 | nop
|
|
nop | nop
|
|
L140:
|
|
ilw.w vi08, 1(vi00) | nop
|
|
xtop vi02 | mulax.xyzw ACC, vf01, vf12
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
iaddiu vi04, vi02, 0x8c | add.xyzw vf10, vf10, vf28
|
|
ilwr.x vi05, vi04 | maxw.w vf09, vf09, vf02
|
|
ilw.w vi06, 1(vi04) | itof0.xyzw vf23, vf23
|
|
ibne vi00, vi08, L148 | nop
|
|
ilw.x vi07, 2(vi04) | maxx.xyzw vf12, vf12, vf00
|
|
L141:
|
|
div Q, vf01.w, vf10.w | minix.xyzw vf25, vf00, vf00
|
|
move.xyzw vf21, vf09 | minix.xyzw vf26, vf00, vf00
|
|
iadd vi05, vi05, vi04 | nop
|
|
iaddiu vi04, vi02, 0x173 | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L142 | madday.xyzw ACC, vf05, vf12
|
|
iadd vi06, vi06, vi05 | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L142:
|
|
iadd vi07, vi07, vi06 | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -6(vi01) | mul.xyz vf10, vf10, Q
|
|
iaddiu vi08, vi00, 0x1ba | mul.xyzw vf16, vf16, Q
|
|
isub vi08, vi08, vi02 | ftoi4.xyzw vf21, vf21
|
|
iaddiu vi08, vi08, 0x173 | mul.xyzw vf12, vf12, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf10, vf10, vf22
|
|
ibgez vi09, L143 | nop
|
|
sq.xyzw vf21, 2(vi11) | nop
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L143:
|
|
mfp.w vf20, P | nop
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
sq.xyzw vf15, 0(vi14) | miniw.w vf10, vf10, vf03
|
|
sq.xyzw vf21, 2(vi14) | nop
|
|
ilw.y vi09, -3(vi01) | mulw.xyzw vf13, vf13, vf20
|
|
mfir.x vf25, vi04 | ftoi0.xyzw vf12, vf12
|
|
mfir.y vf25, vi04 | nop
|
|
mfir.x vf26, vi08 | nop
|
|
ilw.w vi02, 1(vi00) | nop
|
|
mfir.y vf26, vi04 | mulax.xyzw ACC, vf01, vf13
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
nop | nop
|
|
ibne vi00, vi02, L149 | maxw.w vf10, vf10, vf02
|
|
nop | itof0.xyzw vf23, vf23
|
|
L144:
|
|
8388608.0 | maxx.xyzw vf13, vf13, vf00 :i
|
|
256.0 | maxi.xy vf27, vf00, I :i
|
|
move.xyzw vf21, vf10 | maxi.w vf27, vf00, I
|
|
nop | nop
|
|
nop | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L145 | madday.xyzw ACC, vf05, vf13
|
|
nop | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L145:
|
|
nop | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -3(vi01) | itof0.xyzw vf25, vf25
|
|
nop | itof0.xyzw vf26, vf26
|
|
nop | ftoi4.xyzw vf21, vf21
|
|
nop | mul.xyzw vf13, vf13, vf23
|
|
ior vi02, vi05, vi00 | add.xyzw vf25, vf25, vf27
|
|
ibgez vi09, L146 | add.xyzw vf26, vf26, vf27
|
|
sq.xyzw vf21, 2(vi12) | nop
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L146:
|
|
ibne vi06, vi05, L147 | nop
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
ior vi06, vi07, vi00 | max.xyzw vf25, vf26, vf26
|
|
L147:
|
|
sq.xyzw vf16, 0(vi15) | nop
|
|
sq.xyzw vf21, 2(vi15) | nop
|
|
lqi.xyzw vf27, vi05 | nop
|
|
nop | ftoi0.xyzw vf13, vf13
|
|
nop | nop
|
|
nop | nop
|
|
nop | itof0.xyzw vf27, vf27
|
|
sq.xyzw vf13, 1(vi12) | nop
|
|
b L170 | nop
|
|
sq.xyzw vf13, 1(vi15) | nop
|
|
L148:
|
|
3072.0 | miniw.w vf10, vf10, vf01 :i
|
|
b L141 | minii.xy vf09, vf09, I
|
|
nop | nop
|
|
L149:
|
|
1024.0 | nop :i
|
|
3072.0 | maxi.xy vf10, vf10, I :i
|
|
b L144 | minii.xy vf10, vf10, I
|
|
isw.w vi00, 1(vi00) | nop
|
|
L150:
|
|
ilw.w vi08, 1(vi00) | nop
|
|
xtop vi02 | mulax.xyzw ACC, vf01, vf13
|
|
sq.xyzw vf12, 1(vi11) | madday.xyzw ACC, vf02, vf13
|
|
sq.xyzw vf12, 1(vi14) | maddz.xyzw vf13, vf03, vf13
|
|
iaddiu vi04, vi02, 0x8c | add.xyzw vf08, vf08, vf28
|
|
ilwr.x vi05, vi04 | maxw.w vf10, vf10, vf02
|
|
ilw.w vi06, 1(vi04) | itof0.xyzw vf23, vf23
|
|
ibne vi00, vi08, L158 | nop
|
|
ilw.x vi07, 2(vi04) | maxx.xyzw vf13, vf13, vf00
|
|
L151:
|
|
div Q, vf01.w, vf08.w | minix.xyzw vf25, vf00, vf00
|
|
move.xyzw vf21, vf10 | minix.xyzw vf26, vf00, vf00
|
|
iadd vi05, vi05, vi04 | nop
|
|
iaddiu vi04, vi02, 0x173 | mulax.xyzw ACC, vf04, vf13
|
|
ibgtz vi09, L152 | madday.xyzw ACC, vf05, vf13
|
|
iadd vi06, vi06, vi05 | maddaz.xyzw ACC, vf06, vf13
|
|
nop | addx.w vf21, vf21, vf17
|
|
L152:
|
|
iadd vi07, vi07, vi06 | maddw.xyzw vf13, vf07, vf00
|
|
ilw.x vi09, -6(vi01) | mul.xyz vf08, vf08, Q
|
|
iaddiu vi08, vi00, 0x1ba | mul.xyzw vf14, vf14, Q
|
|
isub vi08, vi08, vi02 | ftoi4.xyzw vf21, vf21
|
|
iaddiu vi08, vi08, 0x173 | mul.xyzw vf13, vf13, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf08, vf08, vf22
|
|
ibgez vi09, L153 | nop
|
|
sq.xyzw vf21, 2(vi12) | nop
|
|
nop | ftoi4.xyzw vf21, vf10
|
|
L153:
|
|
mfp.w vf20, P | nop
|
|
sq.xyzw vf16, 0(vi12) | miniy.xyzw vf13, vf13, vf17
|
|
sq.xyzw vf16, 0(vi15) | miniw.w vf08, vf08, vf03
|
|
sq.xyzw vf21, 2(vi15) | nop
|
|
ilw.y vi09, -3(vi01) | mulw.xyzw vf11, vf11, vf20
|
|
mfir.x vf25, vi04 | ftoi0.xyzw vf13, vf13
|
|
mfir.y vf25, vi04 | nop
|
|
mfir.x vf26, vi08 | nop
|
|
ilw.w vi02, 1(vi00) | nop
|
|
mfir.y vf26, vi04 | mulax.xyzw ACC, vf01, vf11
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
nop | nop
|
|
ibne vi00, vi02, L159 | maxw.w vf08, vf08, vf02
|
|
nop | itof0.xyzw vf23, vf23
|
|
L154:
|
|
8388608.0 | maxx.xyzw vf11, vf11, vf00 :i
|
|
256.0 | maxi.xy vf27, vf00, I :i
|
|
move.xyzw vf21, vf08 | maxi.w vf27, vf00, I
|
|
nop | nop
|
|
nop | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L155 | madday.xyzw ACC, vf05, vf11
|
|
nop | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L155:
|
|
nop | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -3(vi01) | itof0.xyzw vf25, vf25
|
|
nop | itof0.xyzw vf26, vf26
|
|
nop | ftoi4.xyzw vf21, vf21
|
|
nop | mul.xyzw vf11, vf11, vf23
|
|
ior vi02, vi05, vi00 | add.xyzw vf25, vf25, vf27
|
|
ibgez vi09, L156 | add.xyzw vf26, vf26, vf27
|
|
sq.xyzw vf21, 2(vi10) | nop
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L156:
|
|
ibne vi06, vi05, L157 | nop
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
ior vi06, vi07, vi00 | max.xyzw vf25, vf26, vf26
|
|
L157:
|
|
sq.xyzw vf14, 0(vi13) | nop
|
|
sq.xyzw vf21, 2(vi13) | nop
|
|
lqi.xyzw vf27, vi05 | nop
|
|
nop | ftoi0.xyzw vf11, vf11
|
|
nop | nop
|
|
nop | nop
|
|
nop | itof0.xyzw vf27, vf27
|
|
sq.xyzw vf11, 1(vi10) | nop
|
|
b L170 | nop
|
|
sq.xyzw vf11, 1(vi13) | nop
|
|
L158:
|
|
3072.0 | miniw.w vf08, vf08, vf01 :i
|
|
b L151 | minii.xy vf10, vf10, I
|
|
nop | nop
|
|
L159:
|
|
1024.0 | nop :i
|
|
3072.0 | maxi.xy vf08, vf08, I :i
|
|
b L154 | minii.xy vf08, vf08, I
|
|
isw.w vi00, 1(vi00) | nop
|
|
L160:
|
|
ilw.w vi08, 1(vi00) | nop
|
|
xtop vi02 | mulax.xyzw ACC, vf01, vf11
|
|
sq.xyzw vf13, 1(vi12) | madday.xyzw ACC, vf02, vf11
|
|
sq.xyzw vf13, 1(vi15) | maddz.xyzw vf11, vf03, vf11
|
|
iaddiu vi04, vi02, 0x8c | add.xyzw vf09, vf09, vf28
|
|
ilwr.x vi05, vi04 | maxw.w vf08, vf08, vf02
|
|
ilw.w vi06, 1(vi04) | itof0.xyzw vf23, vf23
|
|
ibne vi00, vi08, L168 | nop
|
|
ilw.x vi07, 2(vi04) | maxx.xyzw vf11, vf11, vf00
|
|
L161:
|
|
div Q, vf01.w, vf09.w | minix.xyzw vf25, vf00, vf00
|
|
move.xyzw vf21, vf08 | minix.xyzw vf26, vf00, vf00
|
|
iadd vi05, vi05, vi04 | nop
|
|
iaddiu vi04, vi02, 0x173 | mulax.xyzw ACC, vf04, vf11
|
|
ibgtz vi09, L162 | madday.xyzw ACC, vf05, vf11
|
|
iadd vi06, vi06, vi05 | maddaz.xyzw ACC, vf06, vf11
|
|
nop | addx.w vf21, vf21, vf17
|
|
L162:
|
|
iadd vi07, vi07, vi06 | maddw.xyzw vf11, vf07, vf00
|
|
ilw.x vi09, -6(vi01) | mul.xyz vf09, vf09, Q
|
|
iaddiu vi08, vi00, 0x1ba | mul.xyzw vf15, vf15, Q
|
|
isub vi08, vi08, vi02 | ftoi4.xyzw vf21, vf21
|
|
iaddiu vi08, vi08, 0x173 | mul.xyzw vf11, vf11, vf23
|
|
lqi.xyzw vf23, vi03 | add.xyzw vf09, vf09, vf22
|
|
ibgez vi09, L163 | nop
|
|
sq.xyzw vf21, 2(vi10) | nop
|
|
nop | ftoi4.xyzw vf21, vf08
|
|
L163:
|
|
mfp.w vf20, P | nop
|
|
sq.xyzw vf14, 0(vi10) | miniy.xyzw vf11, vf11, vf17
|
|
sq.xyzw vf14, 0(vi13) | miniw.w vf09, vf09, vf03
|
|
sq.xyzw vf21, 2(vi13) | nop
|
|
ilw.y vi09, -3(vi01) | mulw.xyzw vf12, vf12, vf20
|
|
mfir.x vf25, vi04 | ftoi0.xyzw vf11, vf11
|
|
mfir.y vf25, vi04 | nop
|
|
mfir.x vf26, vi08 | nop
|
|
ilw.w vi02, 1(vi00) | nop
|
|
mfir.y vf26, vi04 | mulax.xyzw ACC, vf01, vf12
|
|
sq.xyzw vf11, 1(vi10) | madday.xyzw ACC, vf02, vf12
|
|
sq.xyzw vf11, 1(vi13) | maddz.xyzw vf12, vf03, vf12
|
|
nop | nop
|
|
ibne vi00, vi02, L169 | maxw.w vf09, vf09, vf02
|
|
nop | itof0.xyzw vf23, vf23
|
|
L164:
|
|
8388608.0 | maxx.xyzw vf12, vf12, vf00 :i
|
|
256.0 | maxi.xy vf27, vf00, I :i
|
|
move.xyzw vf21, vf09 | maxi.w vf27, vf00, I
|
|
nop | nop
|
|
nop | mulax.xyzw ACC, vf04, vf12
|
|
ibgtz vi09, L165 | madday.xyzw ACC, vf05, vf12
|
|
nop | maddaz.xyzw ACC, vf06, vf12
|
|
nop | addx.w vf21, vf21, vf17
|
|
L165:
|
|
nop | maddw.xyzw vf12, vf07, vf00
|
|
ilw.x vi09, -3(vi01) | itof0.xyzw vf25, vf25
|
|
nop | itof0.xyzw vf26, vf26
|
|
nop | ftoi4.xyzw vf21, vf21
|
|
nop | mul.xyzw vf12, vf12, vf23
|
|
ior vi02, vi05, vi00 | add.xyzw vf25, vf25, vf27
|
|
ibgez vi09, L166 | add.xyzw vf26, vf26, vf27
|
|
sq.xyzw vf21, 2(vi11) | nop
|
|
nop | ftoi4.xyzw vf21, vf09
|
|
L166:
|
|
ibne vi06, vi05, L167 | nop
|
|
sq.xyzw vf15, 0(vi11) | miniy.xyzw vf12, vf12, vf17
|
|
ior vi06, vi07, vi00 | max.xyzw vf25, vf26, vf26
|
|
L167:
|
|
sq.xyzw vf15, 0(vi14) | nop
|
|
sq.xyzw vf21, 2(vi14) | nop
|
|
lqi.xyzw vf27, vi05 | nop
|
|
nop | ftoi0.xyzw vf12, vf12
|
|
nop | nop
|
|
nop | nop
|
|
nop | itof0.xyzw vf27, vf27
|
|
sq.xyzw vf12, 1(vi11) | nop
|
|
b L170 | nop
|
|
sq.xyzw vf12, 1(vi14) | nop
|
|
L168:
|
|
3072.0 | miniw.w vf09, vf09, vf01 :i
|
|
b L161 | minii.xy vf08, vf08, I
|
|
nop | nop
|
|
L169:
|
|
1024.0 | nop :i
|
|
3072.0 | maxi.xy vf09, vf09, I :i
|
|
b L164 | minii.xy vf09, vf09, I
|
|
isw.w vi00, 1(vi00) | nop
|
|
L170:
|
|
ibeq vi07, vi02, L176 | nop
|
|
ilw.w vi15, 132(vi00) | nop
|
|
ibne vi06, vi05, L171 | add.xyzw vf11, vf27, vf25
|
|
nop | nop
|
|
ibne vi07, vi06, L171 | nop
|
|
ior vi06, vi07, vi00 | max.xyzw vf25, vf26, vf26
|
|
nop | nop
|
|
nop | nop
|
|
mtir vi08, vf11.x | nop
|
|
mtir vi10, vf11.y | nop
|
|
nop | nop
|
|
nop | nop
|
|
lq.xyzw vf16, 2(vi08) | maxx.xyzw vf15, vf11, vf00
|
|
lq.xyzw vf13, 0(vi08) | nop
|
|
b L175 | nop
|
|
nop | nop
|
|
L171:
|
|
lqi.xyzw vf27, vi05 | nop
|
|
nop | nop
|
|
mtir vi08, vf11.x | nop
|
|
mtir vi09, vf11.y | nop
|
|
nop | itof0.xyzw vf27, vf27
|
|
nop | nop
|
|
lq.xyzw vf12, 2(vi08) | maxx.xyzw vf15, vf11, vf00
|
|
lq.xyzw vf13, 0(vi08) | nop
|
|
ibne vi06, vi05, L172 | add.xyzw vf11, vf27, vf25
|
|
nop | nop
|
|
ibeq vi07, vi06, L174 | nop
|
|
ior vi06, vi07, vi00 | max.xyzw vf25, vf26, vf26
|
|
L172:
|
|
lqi.xyzw vf27, vi05 | itof15.w vf12, vf12
|
|
lq.xyzw vf14, 1(vi08) | nop
|
|
mtir vi08, vf11.x | nop
|
|
mtir vi10, vf11.y | nop
|
|
sq.xyzw vf13, 0(vi09) | itof0.xyzw vf27, vf27
|
|
sq.xyzw vf14, 1(vi09) | add.w vf12, vf12, vf15
|
|
lq.xyzw vf16, 2(vi08) | maxx.xyzw vf15, vf11, vf00
|
|
lq.xyzw vf13, 0(vi08) | nop
|
|
ibne vi06, vi05, L173 | add.xyzw vf11, vf27, vf25
|
|
sq.xyzw vf12, 2(vi09) | nop
|
|
ibne vi07, vi06, L173 | nop
|
|
ior vi06, vi07, vi00 | max.xyzw vf25, vf26, vf26
|
|
move.xyzw vf12, vf16 | nop
|
|
b L174 | nop
|
|
ior vi09, vi10, vi00 | nop
|
|
L173:
|
|
lqi.xyzw vf27, vi05 | itof15.w vf16, vf16
|
|
lq.xyzw vf14, 1(vi08) | nop
|
|
mtir vi08, vf11.x | nop
|
|
mtir vi09, vf11.y | nop
|
|
sq.xyzw vf13, 0(vi10) | itof0.xyzw vf27, vf27
|
|
sq.xyzw vf14, 1(vi10) | add.w vf16, vf16, vf15
|
|
lq.xyzw vf12, 2(vi08) | maxx.xyzw vf15, vf11, vf00
|
|
lq.xyzw vf13, 0(vi08) | nop
|
|
ibne vi06, vi05, L172 | add.xyzw vf11, vf27, vf25
|
|
sq.xyzw vf16, 2(vi10) | nop
|
|
ibne vi07, vi06, L172 | nop
|
|
ior vi06, vi07, vi00 | max.xyzw vf25, vf26, vf26
|
|
L174:
|
|
nop | itof15.w vf12, vf12
|
|
lq.xyzw vf14, 1(vi08) | nop
|
|
mtir vi08, vf11.x | nop
|
|
mtir vi10, vf11.y | nop
|
|
sq.xyzw vf13, 0(vi09) | nop
|
|
sq.xyzw vf14, 1(vi09) | add.w vf12, vf12, vf15
|
|
lq.xyzw vf16, 2(vi08) | maxx.xyzw vf15, vf11, vf00
|
|
lq.xyzw vf13, 0(vi08) | nop
|
|
nop | nop
|
|
sq.xyzw vf12, 2(vi09) | nop
|
|
L175:
|
|
nop | itof15.w vf16, vf16
|
|
lq.xyzw vf14, 1(vi08) | nop
|
|
nop | nop
|
|
nop | nop
|
|
sq.xyzw vf13, 0(vi10) | nop
|
|
sq.xyzw vf14, 1(vi10) | add.w vf16, vf16, vf15
|
|
nop | nop
|
|
nop | nop
|
|
nop | nop
|
|
sq.xyzw vf16, 2(vi10) | nop
|
|
L176:
|
|
ibne vi00, vi15, L177 | nop
|
|
nop | nop
|
|
xgkick vi04 | nop
|
|
nop | nop :e
|
|
nop | nop
|
|
L177:
|
|
lq.xyzw vf20, 132(vi00) | nop
|
|
lq.xyzw vf21, 1(vi00) | nop
|
|
iaddi vi01, vi00, 0x1 | nop
|
|
isw.x vi01, -2(vi04) | nop
|
|
iaddiu vi02, vi00, 0x47 | maxw.x vf20, vf00, vf20
|
|
isw.z vi02, -1(vi04) | nop
|
|
sq.yzw vf21, -2(vi04) | nop
|
|
isw.w vi00, 132(vi00) | nop
|
|
sq.x vf20, -1(vi04) | nop
|
|
iaddi vi04, vi04, -0x2 | nop
|
|
xgkick vi04 | nop
|
|
nop | nop :e
|
|
nop | nop
|