shader_recompiler: More instructions

2025-05-18 17:34:52 +00:00 · 2024-07-01 22:42:45 +03:00 · 2024-07-01 22:42:45 +03:00 · a603bc7d88
commit a603bc7d88
parent 2fe897eeda
12 changed files with 93 additions and 21 deletions
--- a/src/shader_recompiler/frontend/format.cpp
+++ b/src/shader_recompiler/frontend/format.cpp
@ -1826,17 +1826,17 @@ constexpr std::array<InstFormat, 71> InstructionFormatVOP1 = {{
    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Float32,
     ScalarType::Float64},
    // 17 = V_CVT_F32_UBYTE0
-    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Undefined,
-     ScalarType::Undefined},
+    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Uint32,
+     ScalarType::Float32},
    // 18 = V_CVT_F32_UBYTE1
-    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Undefined,
-     ScalarType::Undefined},
+    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Uint32,
+     ScalarType::Float32},
    // 19 = V_CVT_F32_UBYTE2
-    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Undefined,
-     ScalarType::Undefined},
+    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Uint32,
+     ScalarType::Float32},
    // 20 = V_CVT_F32_UBYTE3
-    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Undefined,
-     ScalarType::Undefined},
+    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Uint32,
+     ScalarType::Float32},
    // 21 = V_CVT_U32_F64
    {InstClass::VectorConv, InstCategory::VectorALU, 1, 1, ScalarType::Float64, ScalarType::Uint32},
    // 22 = V_CVT_F64_U32
--- a/src/shader_recompiler/frontend/translate/translate.cpp
+++ b/src/shader_recompiler/frontend/translate/translate.cpp
@ -268,7 +268,10 @@ void Translate(IR::Block* block, std::span<const GcnInst> inst_list, Info& info)
            translator.V_AND_B32(inst);
            break;
        case Opcode::V_OR_B32:
-            translator.V_OR_B32(inst);
+            translator.V_OR_B32(false, inst);
+            break;
+        case Opcode::V_XOR_B32:
+            translator.V_OR_B32(true, inst);
            break;
        case Opcode::V_LSHLREV_B32:
            translator.V_LSHLREV_B32(inst);
@ -324,6 +327,24 @@ void Translate(IR::Block* block, std::span<const GcnInst> inst_list, Info& info)
        case Opcode::V_CVT_PKRTZ_F16_F32:
            translator.V_CVT_PKRTZ_F16_F32(inst);
            break;
+        case Opcode::V_CVT_F32_F16:
+            translator.V_CVT_F32_F16(inst);
+            break;
+        case Opcode::V_CVT_F32_UBYTE0:
+            translator.V_CVT_F32_UBYTE(0, inst);
+            break;
+        case Opcode::V_CVT_F32_UBYTE1:
+            translator.V_CVT_F32_UBYTE(1, inst);
+            break;
+        case Opcode::V_CVT_F32_UBYTE2:
+            translator.V_CVT_F32_UBYTE(2, inst);
+            break;
+        case Opcode::V_CVT_F32_UBYTE3:
+            translator.V_CVT_F32_UBYTE(3, inst);
+            break;
+        case Opcode::V_BFREV_B32:
+            translator.V_BFREV_B32(inst);
+            break;
        case Opcode::V_FRACT_F32:
            translator.V_FRACT_F32(inst);
            break;
@ -355,6 +376,9 @@ void Translate(IR::Block* block, std::span<const GcnInst> inst_list, Info& info)
        case Opcode::IMAGE_SAMPLE_L:
            translator.IMAGE_SAMPLE(inst);
            break;
+        case Opcode::IMAGE_GET_LOD:
+            translator.IMAGE_GET_LOD(inst);
+            break;
        case Opcode::IMAGE_GATHER4_C:
            translator.IMAGE_GATHER(inst);
            break;
@ -682,7 +706,10 @@ void Translate(IR::Block* block, std::span<const GcnInst> inst_list, Info& info)
            translator.V_SAD_U32(inst);
            break;
        case Opcode::V_BFE_U32:
-            translator.V_BFE_U32(inst);
+            translator.V_BFE_U32(false, inst);
+            break;
+        case Opcode::V_BFE_I32:
+            translator.V_BFE_U32(true, inst);
            break;
        case Opcode::V_MAD_I32_I24:
            translator.V_MAD_I32_I24(inst);
--- a/src/shader_recompiler/frontend/translate/translate.h
+++ b/src/shader_recompiler/frontend/translate/translate.h
@ -71,9 +71,10 @@ public:
    void V_SAD(const GcnInst& inst);
    void V_MAC_F32(const GcnInst& inst);
    void V_CVT_PKRTZ_F16_F32(const GcnInst& inst);
+    void V_CVT_F32_F16(const GcnInst& inst);
    void V_MUL_F32(const GcnInst& inst);
    void V_CNDMASK_B32(const GcnInst& inst);
-    void V_OR_B32(const GcnInst& inst);
+    void V_OR_B32(bool is_xor, const GcnInst& inst);
    void V_AND_B32(const GcnInst& inst);
    void V_LSHLREV_B32(const GcnInst& inst);
    void V_ADD_I32(const GcnInst& inst);
@ -110,7 +111,7 @@ public:
    void V_LSHRREV_B32(const GcnInst& inst);
    void V_MUL_HI_U32(bool is_signed, const GcnInst& inst);
    void V_SAD_U32(const GcnInst& inst);
-    void V_BFE_U32(const GcnInst& inst);
+    void V_BFE_U32(bool is_signed, const GcnInst& inst);
    void V_MAD_I32_I24(const GcnInst& inst);
    void V_MUL_I32_I24(const GcnInst& inst);
    void V_SUB_I32(const GcnInst& inst);
@ -130,6 +131,8 @@ public:
    void V_CMP_NE_U64(const GcnInst& inst);
    void V_BFI_B32(const GcnInst& inst);
    void V_NOT_B32(const GcnInst& inst);
+    void V_CVT_F32_UBYTE(u32 index, const GcnInst& inst);
+    void V_BFREV_B32(const GcnInst& inst);

    // Vector Memory
    void BUFFER_LOAD_FORMAT(u32 num_dwords, bool is_typed, const GcnInst& inst);
@ -149,6 +152,7 @@ public:
    void IMAGE_GATHER(const GcnInst& inst);
    void IMAGE_STORE(const GcnInst& inst);
    void IMAGE_LOAD(bool has_mip, const GcnInst& inst);
+    void IMAGE_GET_LOD(const GcnInst& inst);

    // Export
    void EXP(const GcnInst& inst);
--- a/src/shader_recompiler/frontend/translate/vector_alu.cpp
+++ b/src/shader_recompiler/frontend/translate/vector_alu.cpp
@ -26,6 +26,11 @@ void Translator::V_CVT_PKRTZ_F16_F32(const GcnInst& inst) {
    ir.SetVectorReg(dst_reg, ir.PackHalf2x16(vec_f32));
 }

+void Translator::V_CVT_F32_F16(const GcnInst& inst) {
+    const IR::U32 src0 = GetSrc(inst.src[0]);
+    SetDst(inst.dst[0], ir.ConvertUToF(32, 16, src0));
+}
+
 void Translator::V_MUL_F32(const GcnInst& inst) {
    SetDst(inst.dst[0], ir.FPMul(GetSrc(inst.src[0], true), GetSrc(inst.src[1], true)));
 }
@ -54,11 +59,11 @@ void Translator::V_CNDMASK_B32(const GcnInst& inst) {
    ir.SetVectorReg(dst_reg, IR::U32F32{result});
 }

-void Translator::V_OR_B32(const GcnInst& inst) {
+void Translator::V_OR_B32(bool is_xor, const GcnInst& inst) {
    const IR::U32 src0{GetSrc(inst.src[0])};
    const IR::U32 src1{ir.GetVectorReg(IR::VectorReg(inst.src[1].code))};
    const IR::VectorReg dst_reg{inst.dst[0].code};
-    ir.SetVectorReg(dst_reg, ir.BitwiseOr(src0, src1));
+    ir.SetVectorReg(dst_reg, is_xor ? ir.BitwiseXor(src0, src1) : ir.BitwiseOr(src0, src1));
 }

 void Translator::V_AND_B32(const GcnInst& inst) {
@ -345,11 +350,11 @@ void Translator::V_SAD_U32(const GcnInst& inst) {
    SetDst(inst.dst[0], ir.IAdd(ir.ISub(max, min), src2));
 }

-void Translator::V_BFE_U32(const GcnInst& inst) {
+void Translator::V_BFE_U32(bool is_signed, const GcnInst& inst) {
    const IR::U32 src0{GetSrc(inst.src[0])};
    const IR::U32 src1{ir.BitwiseAnd(GetSrc(inst.src[1]), ir.Imm32(0x1F))};
    const IR::U32 src2{ir.BitwiseAnd(GetSrc(inst.src[2]), ir.Imm32(0x1F))};
-    SetDst(inst.dst[0], ir.BitFieldExtract(src0, src1, src2));
+    SetDst(inst.dst[0], ir.BitFieldExtract(src0, src1, src2, is_signed));
 }

 void Translator::V_MAD_I32_I24(const GcnInst& inst) {
@ -486,4 +491,15 @@ void Translator::V_NOT_B32(const GcnInst& inst) {
    SetDst(inst.dst[0], ir.BitwiseNot(src0));
 }

+void Translator::V_CVT_F32_UBYTE(u32 index, const GcnInst& inst) {
+    const IR::U32 src0{GetSrc(inst.src[0])};
+    const IR::U32 byte = ir.BitFieldExtract(src0, ir.Imm32(8 * index), ir.Imm32(8));
+    SetDst(inst.dst[0], ir.ConvertUToF(32, 32, byte));
+}
+
+void Translator::V_BFREV_B32(const GcnInst& inst) {
+    const IR::U32 src0{GetSrc(inst.src[0])};
+    SetDst(inst.dst[0], ir.BitReverse(src0));
+}
+
 } // namespace Shader::Gcn
--- a/src/shader_recompiler/frontend/translate/vector_memory.cpp
+++ b/src/shader_recompiler/frontend/translate/vector_memory.cpp
@ -307,4 +307,19 @@ void Translator::BUFFER_STORE_FORMAT(u32 num_dwords, bool is_typed, const GcnIns
    ir.StoreBuffer(num_dwords, ir.GetScalarReg(sharp), address, value, info);
 }

+void Translator::IMAGE_GET_LOD(const GcnInst& inst) {
+    const auto& mimg = inst.control.mimg;
+    IR::VectorReg dst_reg{inst.dst[0].code};
+    IR::VectorReg addr_reg{inst.src[0].code};
+    const IR::ScalarReg tsharp_reg{inst.src[2].code * 4};
+
+    const IR::Value handle = ir.GetScalarReg(tsharp_reg);
+    const IR::Value body = ir.CompositeConstruct(
+        ir.GetVectorReg<IR::F32>(addr_reg), ir.GetVectorReg<IR::F32>(addr_reg + 1),
+        ir.GetVectorReg<IR::F32>(addr_reg + 2), ir.GetVectorReg<IR::F32>(addr_reg + 3));
+    const IR::Value lod = ir.ImageQueryLod(handle, body, {});
+    ir.SetVectorReg(dst_reg++, IR::F32{ir.CompositeExtract(lod, 0)});
+    ir.SetVectorReg(dst_reg++, IR::F32{ir.CompositeExtract(lod, 1)});
+}
+
 } // namespace Shader::Gcn