summaryrefslogtreecommitdiffstats
path: root/llvm/test/MC/AMDGPU/code-object-metadata-kernel-args.s
blob: 3f3a7f4d17224fa0c57f8578d6f1c4913d9ae1dc (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
// RUN: llvm-mc -triple=amdgcn-amd-amdhsa -mcpu=gfx700 -show-encoding %s | FileCheck --check-prefix=CHECK --check-prefix=GFX700 %s
// RUN: llvm-mc -triple=amdgcn-amd-amdhsa -mcpu=gfx800 -show-encoding %s | FileCheck --check-prefix=CHECK --check-prefix=GFX800 %s
// RUN: llvm-mc -triple=amdgcn-amd-amdhsa -mcpu=gfx900 -show-encoding %s | FileCheck --check-prefix=CHECK --check-prefix=GFX900 %s

// CHECK:  .amdgpu_code_object_metadata
// CHECK:    Version: [ 1, 0 ]
// CHECK:    Isa:
// CHECK:      WavefrontSize:        64
// CHECK:      LocalMemorySize:      65536
// CHECK:      EUsPerCU:             4
// CHECK:      MaxWavesPerEU:        10
// CHECK:      MaxFlatWorkGroupSize: 2048
// GFX700:     SGPRAllocGranule:     8
// GFX800:     SGPRAllocGranule:     16
// GFX900:     SGPRAllocGranule:     16
// GFX700:     TotalNumSGPRs:        512
// GFX800:     TotalNumSGPRs:        800
// GFX900:     TotalNumSGPRs:        800
// GFX700:     AddressableNumSGPRs:  104
// GFX800:     AddressableNumSGPRs:  96
// GFX900:     AddressableNumSGPRs:  102
// CHECK:      VGPRAllocGranule:     4
// CHECK:      TotalNumVGPRs:        256
// CHECK:      AddressableNumVGPRs:  256
// CHECK:    Printf: [ '1:1:4:%d\n', '2:1:8:%g\n' ]
// CHECK:    Kernels:
// CHECK:      - Name:            test_kernel
// CHECK:        Language:        OpenCL C
// CHECK:        LanguageVersion: [ 2, 0 ]
// CHECK:        Args:
// CHECK:          - Size:          1
// CHECK:            Align:         1
// CHECK:            Kind:          ByValue
// CHECK:            ValueType:     I8
// CHECK:            AccQual:       Default
// CHECK:            TypeName:      char
// CHECK:          - Size:          8
// CHECK:            Align:         8
// CHECK:            Kind:          HiddenGlobalOffsetX
// CHECK:            ValueType:     I64
// CHECK:          - Size:          8
// CHECK:            Align:         8
// CHECK:            Kind:          HiddenGlobalOffsetY
// CHECK:            ValueType:     I64
// CHECK:          - Size:          8
// CHECK:            Align:         8
// CHECK:            Kind:          HiddenGlobalOffsetZ
// CHECK:            ValueType:     I64
// CHECK:          - Size:          8
// CHECK:            Align:         8
// CHECK:            Kind:          HiddenPrintfBuffer
// CHECK:            ValueType:     I8
// CHECK:            AddrSpaceQual: Global
// CHECK:  .end_amdgpu_code_object_metadata
.amdgpu_code_object_metadata
  Version: [ 1, 0 ]
  Printf: [ '1:1:4:%d\n', '2:1:8:%g\n' ]
  Kernels:
    - Name:            test_kernel
      Language:        OpenCL C
      LanguageVersion: [ 2, 0 ]
      Args:
        - Size:          1
          Align:         1
          Kind:          ByValue
          ValueType:     I8
          AccQual:       Default
          TypeName:      char
        - Size:          8
          Align:         8
          Kind:          HiddenGlobalOffsetX
          ValueType:     I64
        - Size:          8
          Align:         8
          Kind:          HiddenGlobalOffsetY
          ValueType:     I64
        - Size:          8
          Align:         8
          Kind:          HiddenGlobalOffsetZ
          ValueType:     I64
        - Size:          8
          Align:         8
          Kind:          HiddenPrintfBuffer
          ValueType:     I8
          AddrSpaceQual: Global
.end_amdgpu_code_object_metadata
OpenPOWER on IntegriCloud