[X86] Prevent combining (v8i1 (bitconvert (i8 load)))->(v8i1 load) if we don't have DQI.

We end up using an i8 load via an isel pattern from v8i1 anyway. This just makes it more explicit. This seems to improve codgen in some cases and I'd like to kill off some of the load patterns. llvm-svn: 321598
author: Craig Topper <craig.topper@intel.com> 2017-12-31 07:38:41 +0000
committer: Craig Topper <craig.topper@intel.com> 2017-12-31 07:38:41 +0000
commit: 876ec0b558e21c78b18fdac116bb251c882997b3 (patch)
tree: 581cec180d62b35c4d7dc6436997118c4decae1e /llvm/lib/Target
parent: 6159f5ebd81e0f3e8e0391d50efeb4140dc5d557 (diff)
download: bcm5719-llvm-876ec0b558e21c78b18fdac116bb251c882997b3.tar.gz
bcm5719-llvm-876ec0b558e21c78b18fdac116bb251c882997b3.zip
3 files changed, 12 insertions, 0 deletions
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp
index 1cc09e5c23b..55912a2c3ec 100644
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -4632,6 +4632,14 @@ bool X86TargetLowering::isCheapToSpeculateCtlz() const {
   return Subtarget.hasLZCNT();
 }
 
+bool X86TargetLowering::isLoadBitCastBeneficial(EVT LoadVT,
+                                                EVT BitcastVT) const {
+  if (!Subtarget.hasDQI() && BitcastVT == MVT::v8i1)
+    return false;
+
+  return TargetLowering::isLoadBitCastBeneficial(LoadVT, BitcastVT);
+}
+
 bool X86TargetLowering::canMergeStoresTo(unsigned AddressSpace, EVT MemVT,
                                          const SelectionDAG &DAG) const {
   // Do not merge to float value size (128 bytes) if no implicit
diff --git a/llvm/lib/Target/X86/X86ISelLowering.h b/llvm/lib/Target/X86/X86ISelLowering.h
index 7708f577ba7..1fb7c7ed4e9 100644
--- a/llvm/lib/Target/X86/X86ISelLowering.h
+++ b/llvm/lib/Target/X86/X86ISelLowering.h
@@ -1023,6 +1023,8 @@ namespace llvm {
       return NumElem > 2;
     }
 
+    bool isLoadBitCastBeneficial(EVT LoadVT, EVT BitcastVT) const override;
+
     /// Intel processors have a unified instruction and data cache
     const char * getClearCacheBuiltinName() const override {
       return nullptr; // nothing to do, move along.
diff --git a/llvm/lib/Target/X86/X86InstrAVX512.td b/llvm/lib/Target/X86/X86InstrAVX512.td
index 0e56c2d208f..0b31f876b38 100644
--- a/llvm/lib/Target/X86/X86InstrAVX512.td
+++ b/llvm/lib/Target/X86/X86InstrAVX512.td
@@ -2742,6 +2742,8 @@ let Predicates = [HasAVX512, NoDQI] in {
 let Predicates = [HasAVX512] in {
   def : Pat<(v1i1 (load addr:$src)),
             (COPY_TO_REGCLASS (MOVZX32rm8 addr:$src), VK1)>;
+  def : Pat<(v8i1 (bitconvert (i8 (load addr:$src)))),
+            (COPY_TO_REGCLASS (MOVZX32rm8 addr:$src), VK8)>;
 }
 
 let Predicates = [HasAVX512] in {
author	Craig Topper <craig.topper@intel.com>	2017-12-31 07:38:41 +0000
committer	Craig Topper <craig.topper@intel.com>	2017-12-31 07:38:41 +0000
commit	876ec0b558e21c78b18fdac116bb251c882997b3 (patch)
tree	581cec180d62b35c4d7dc6436997118c4decae1e /llvm/lib/Target
parent	6159f5ebd81e0f3e8e0391d50efeb4140dc5d557 (diff)
download	bcm5719-llvm-876ec0b558e21c78b18fdac116bb251c882997b3.tar.gz bcm5719-llvm-876ec0b558e21c78b18fdac116bb251c882997b3.zip