MC: Allow getMaxInstLength to depend on the subtarget

Keep it optional in cases this is ever needed in some global context. Currently it's only used for getting an upper bound inline asm code size. For AMDGPU, gfx10 increases the maximum instruction size to 20-bytes. This avoids penalizing older subtargets when estimating code size, and making some annoying branch relaxation test adjustments. llvm-svn: 361405
author: Matt Arsenault <Matthew.Arsenault@amd.com> 2019-05-22 16:28:41 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> 2019-05-22 16:28:41 +0000
commit: ca64ef20434c0cb6912e795c85567d5b00ad9b0d (patch)
tree: 253c385f1311dfc20b539ed68633b3c3959fad04 /llvm/test/CodeGen/AMDGPU/branch-relaxation-inst-size-gfx10.ll
parent: c2187c20a461c19ff50dc358b932c44f2ef5d6c6 (diff)
download: bcm5719-llvm-ca64ef20434c0cb6912e795c85567d5b00ad9b0d.tar.gz
bcm5719-llvm-ca64ef20434c0cb6912e795c85567d5b00ad9b0d.zip
1 files changed, 33 insertions, 0 deletions
diff --git a/llvm/test/CodeGen/AMDGPU/branch-relaxation-inst-size-gfx10.ll b/llvm/test/CodeGen/AMDGPU/branch-relaxation-inst-size-gfx10.ll
new file mode 100644
index 00000000000..d40a6de6318
--- /dev/null
+++ b/llvm/test/CodeGen/AMDGPU/branch-relaxation-inst-size-gfx10.ll
@@ -0,0 +1,33 @@
+; RUN: llc -march=amdgcn -mcpu=gfx1010 -verify-machineinstrs -amdgpu-s-branch-bits=4 < %s | FileCheck -enable-var-scope -check-prefixes=GCN,GFX10 %s
+; RUN: llc -march=amdgcn -mcpu=gfx900 -verify-machineinstrs -amdgpu-s-branch-bits=4 < %s | FileCheck -enable-var-scope -check-prefixes=GCN,GFX9 %s
+
+; Make sure the code size estimate for inline asm is 12-bytes per
+; instruction, rather than 8 in previous generations.
+
+; GCN-LABEL: {{^}}long_forward_branch_gfx10only:
+; GFX9: s_cmp_eq_u32
+; GFX9-NEXT: s_cbranch_scc1
+
+; GFX10: s_cmp_eq_u32
+; GFX10-NEXT: s_cbranch_scc0
+; GFX10: s_getpc_b64
+; GFX10: s_add_u32
+; GFX10: s_addc_u32
+; GFX10: s_setpc_b64
+define amdgpu_kernel void @long_forward_branch_gfx10only(i32 addrspace(1)* %arg, i32 %cnd) #0 {
+bb0:
+  %cmp = icmp eq i32 %cnd, 0
+  br i1 %cmp, label %bb3, label %bb2 ; +9 dword branch
+
+bb2:
+    ; Estimated as 40-bytes on gfx10 (requiring a long branch), but
+    ; 16-bytes on gfx9 (allowing a short branch)
+  call void asm sideeffect
+   "v_nop_e64
+    v_nop_e64", ""() #0
+  br label %bb3
+
+bb3:
+  store volatile i32 %cnd, i32 addrspace(1)* %arg
+  ret void
+}
author	Matt Arsenault <Matthew.Arsenault@amd.com>	2019-05-22 16:28:41 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	2019-05-22 16:28:41 +0000
commit	ca64ef20434c0cb6912e795c85567d5b00ad9b0d (patch)
tree	253c385f1311dfc20b539ed68633b3c3959fad04 /llvm/test/CodeGen/AMDGPU/branch-relaxation-inst-size-gfx10.ll
parent	c2187c20a461c19ff50dc358b932c44f2ef5d6c6 (diff)
download	bcm5719-llvm-ca64ef20434c0cb6912e795c85567d5b00ad9b0d.tar.gz bcm5719-llvm-ca64ef20434c0cb6912e795c85567d5b00ad9b0d.zip