video_core: Moar shader instruction

2025-06-30 14:26:16 +00:00 · 2024-05-30 18:07:36 +03:00 · 2024-05-30 18:07:36 +03:00 · dd91456b48
commit dd91456b48
parent ff21750815
11 changed files with 127 additions and 20 deletions
--- a/src/shader_recompiler/frontend/translate/translate.cpp
+++ b/src/shader_recompiler/frontend/translate/translate.cpp
@ -111,6 +111,9 @@ IR::U32F32 Translator::GetSrc(const InstOperand& operand, bool force_flt) {
    case OperandField::ConstFloatNeg_1_0:
        value = ir.Imm32(-1.0f);
        break;
+    case OperandField::ConstFloatNeg_2_0:
+        value = ir.Imm32(-2.0f);
+        break;
    case OperandField::VccLo:
        value = ir.GetVccLo();
        break;
@ -327,9 +330,30 @@ void Translate(IR::Block* block, std::span<const GcnInst> inst_list, Info& info)
        case Opcode::S_ANDN2_B64:
            translator.S_ANDN2_B64(inst);
            break;
+        case Opcode::V_SIN_F32:
+            translator.V_SIN_F32(inst);
+            break;
+        case Opcode::V_LOG_F32:
+            translator.V_LOG_F32(inst);
+            break;
+        case Opcode::V_EXP_F32:
+            translator.V_EXP_F32(inst);
+            break;
+        case Opcode::V_SQRT_F32:
+            translator.V_SQRT_F32(inst);
+            break;
+        case Opcode::V_MIN_F32:
+            translator.V_MIN_F32(inst);
+            break;
+        case Opcode::V_MIN3_F32:
+            translator.V_MIN3_F32(inst);
+            break;
        case Opcode::S_NOP:
+        case Opcode::S_AND_B64:
        case Opcode::S_CBRANCH_EXECZ:
        case Opcode::S_CBRANCH_SCC0:
+        case Opcode::S_CBRANCH_SCC1:
+        case Opcode::S_BRANCH:
        case Opcode::S_MOV_B64:
        case Opcode::S_WQM_B64:
        case Opcode::V_INTERP_P1_F32:
--- a/src/shader_recompiler/frontend/translate/translate.h
+++ b/src/shader_recompiler/frontend/translate/translate.h
@ -68,6 +68,12 @@ public:
    void V_CMP_F32(ConditionOp op, const GcnInst& inst);
    void V_MAX_F32(const GcnInst& inst);
    void V_RSQ_F32(const GcnInst& inst);
+    void V_SIN_F32(const GcnInst& inst);
+    void V_LOG_F32(const GcnInst& inst);
+    void V_EXP_F32(const GcnInst& inst);
+    void V_SQRT_F32(const GcnInst& inst);
+    void V_MIN_F32(const GcnInst& inst);
+    void V_MIN3_F32(const GcnInst& inst);

    // Vector Memory
    void BUFFER_LOAD_FORMAT(u32 num_dwords, bool is_typed, const GcnInst& inst);
--- a/src/shader_recompiler/frontend/translate/vector_alu.cpp
+++ b/src/shader_recompiler/frontend/translate/vector_alu.cpp
@ -26,7 +26,7 @@ void Translator::V_CVT_PKRTZ_F16_F32(const GcnInst& inst) {

 void Translator::V_MUL_F32(const GcnInst& inst) {
    const IR::VectorReg dst_reg{inst.dst[0].code};
-    ir.SetVectorReg(dst_reg, ir.FPMul(GetSrc(inst.src[0]), GetSrc(inst.src[1])));
+    ir.SetVectorReg(dst_reg, ir.FPMul(GetSrc(inst.src[0], true), GetSrc(inst.src[1], true)));
 }

 void Translator::V_CMP_EQ_U32(const GcnInst& inst) {
@ -198,4 +198,37 @@ void Translator::V_RSQ_F32(const GcnInst& inst) {
    SetDst(inst.dst[0], ir.FPRecipSqrt(src0));
 }

+void Translator::V_SIN_F32(const GcnInst& inst) {
+    const IR::F32 src0{GetSrc(inst.src[0], true)};
+    SetDst(inst.dst[0], ir.FPSin(src0));
+}
+
+void Translator::V_LOG_F32(const GcnInst& inst) {
+    const IR::F32 src0{GetSrc(inst.src[0], true)};
+    SetDst(inst.dst[0], ir.FPLog2(src0));
+}
+
+void Translator::V_EXP_F32(const GcnInst& inst) {
+    const IR::F32 src0{GetSrc(inst.src[0], true)};
+    SetDst(inst.dst[0], ir.FPExp2(src0));
+}
+
+void Translator::V_SQRT_F32(const GcnInst& inst) {
+    const IR::F32 src0{GetSrc(inst.src[0], true)};
+    SetDst(inst.dst[0], ir.FPSqrt(src0));
+}
+
+void Translator::V_MIN_F32(const GcnInst& inst) {
+    const IR::F32 src0{GetSrc(inst.src[0], true)};
+    const IR::F32 src1{GetSrc(inst.src[1], true)};
+    SetDst(inst.dst[0], ir.FPMin(src0, src1));
+}
+
+void Translator::V_MIN3_F32(const GcnInst& inst) {
+    const IR::F32 src0{GetSrc(inst.src[0], true)};
+    const IR::F32 src1{GetSrc(inst.src[1], true)};
+    const IR::F32 src2{GetSrc(inst.src[2], true)};
+    SetDst(inst.dst[0], ir.FPMin(src0, ir.FPMin(src1, src2)));
+}
+
 } // namespace Shader::Gcn