blob: 3f3a7f4d17224fa0c57f8578d6f1c4913d9ae1dc (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
|
// RUN: llvm-mc -triple=amdgcn-amd-amdhsa -mcpu=gfx700 -show-encoding %s | FileCheck --check-prefix=CHECK --check-prefix=GFX700 %s
// RUN: llvm-mc -triple=amdgcn-amd-amdhsa -mcpu=gfx800 -show-encoding %s | FileCheck --check-prefix=CHECK --check-prefix=GFX800 %s
// RUN: llvm-mc -triple=amdgcn-amd-amdhsa -mcpu=gfx900 -show-encoding %s | FileCheck --check-prefix=CHECK --check-prefix=GFX900 %s
// CHECK: .amdgpu_code_object_metadata
// CHECK: Version: [ 1, 0 ]
// CHECK: Isa:
// CHECK: WavefrontSize: 64
// CHECK: LocalMemorySize: 65536
// CHECK: EUsPerCU: 4
// CHECK: MaxWavesPerEU: 10
// CHECK: MaxFlatWorkGroupSize: 2048
// GFX700: SGPRAllocGranule: 8
// GFX800: SGPRAllocGranule: 16
// GFX900: SGPRAllocGranule: 16
// GFX700: TotalNumSGPRs: 512
// GFX800: TotalNumSGPRs: 800
// GFX900: TotalNumSGPRs: 800
// GFX700: AddressableNumSGPRs: 104
// GFX800: AddressableNumSGPRs: 96
// GFX900: AddressableNumSGPRs: 102
// CHECK: VGPRAllocGranule: 4
// CHECK: TotalNumVGPRs: 256
// CHECK: AddressableNumVGPRs: 256
// CHECK: Printf: [ '1:1:4:%d\n', '2:1:8:%g\n' ]
// CHECK: Kernels:
// CHECK: - Name: test_kernel
// CHECK: Language: OpenCL C
// CHECK: LanguageVersion: [ 2, 0 ]
// CHECK: Args:
// CHECK: - Size: 1
// CHECK: Align: 1
// CHECK: Kind: ByValue
// CHECK: ValueType: I8
// CHECK: AccQual: Default
// CHECK: TypeName: char
// CHECK: - Size: 8
// CHECK: Align: 8
// CHECK: Kind: HiddenGlobalOffsetX
// CHECK: ValueType: I64
// CHECK: - Size: 8
// CHECK: Align: 8
// CHECK: Kind: HiddenGlobalOffsetY
// CHECK: ValueType: I64
// CHECK: - Size: 8
// CHECK: Align: 8
// CHECK: Kind: HiddenGlobalOffsetZ
// CHECK: ValueType: I64
// CHECK: - Size: 8
// CHECK: Align: 8
// CHECK: Kind: HiddenPrintfBuffer
// CHECK: ValueType: I8
// CHECK: AddrSpaceQual: Global
// CHECK: .end_amdgpu_code_object_metadata
.amdgpu_code_object_metadata
Version: [ 1, 0 ]
Printf: [ '1:1:4:%d\n', '2:1:8:%g\n' ]
Kernels:
- Name: test_kernel
Language: OpenCL C
LanguageVersion: [ 2, 0 ]
Args:
- Size: 1
Align: 1
Kind: ByValue
ValueType: I8
AccQual: Default
TypeName: char
- Size: 8
Align: 8
Kind: HiddenGlobalOffsetX
ValueType: I64
- Size: 8
Align: 8
Kind: HiddenGlobalOffsetY
ValueType: I64
- Size: 8
Align: 8
Kind: HiddenGlobalOffsetZ
ValueType: I64
- Size: 8
Align: 8
Kind: HiddenPrintfBuffer
ValueType: I8
AddrSpaceQual: Global
.end_amdgpu_code_object_metadata
|