Fix SROA to avoid unnecessary scalar conversions for 1-element vectors.

When a 1-element vector alloca is promoted, a store instruction can often be rewritten without converting the value to a scalar and using an insertelement instruction to stuff it into the new alloca. This patch just adds a check to skip that conversion when it is unnecessary. This turns out to be really important for some ARM Neon operations where <1 x i64> is used to get around the fact that i64 is not a legal type. llvm-svn: 184870
author: Bob Wilson <bob.wilson@apple.com> 2013-06-25 19:09:50 +0000
committer: Bob Wilson <bob.wilson@apple.com> 2013-06-25 19:09:50 +0000
commit: acfc01dedf156d0c74a7592e4b97ba629668b54d (patch)
tree: 14469b18f5f13d454426243f0fa662b3bf3a769e /llvm/lib/Transforms
parent: 51a55d99648865b63a35cca5fee8130dc0d343db (diff)
download: bcm5719-llvm-acfc01dedf156d0c74a7592e4b97ba629668b54d.tar.gz
bcm5719-llvm-acfc01dedf156d0c74a7592e4b97ba629668b54d.zip
1 files changed, 16 insertions, 15 deletions
diff --git a/llvm/lib/Transforms/Scalar/SROA.cpp b/llvm/lib/Transforms/Scalar/SROA.cpp
index d073e789dcb..7fb1dbd0771 100644
--- a/llvm/lib/Transforms/Scalar/SROA.cpp
+++ b/llvm/lib/Transforms/Scalar/SROA.cpp
@@ -2591,22 +2591,23 @@ private:
 
   bool rewriteVectorizedStoreInst(Value *V,
                                   StoreInst &SI, Value *OldOp) {
-    unsigned BeginIndex = getIndex(BeginOffset);
-    unsigned EndIndex = getIndex(EndOffset);
-    assert(EndIndex > BeginIndex && "Empty vector!");
-    unsigned NumElements = EndIndex - BeginIndex;
-    assert(NumElements <= VecTy->getNumElements() && "Too many elements!");
-    Type *PartitionTy
-      = (NumElements == 1) ? ElementTy
-                           : VectorType::get(ElementTy, NumElements);
-    if (V->getType() != PartitionTy)
-      V = convertValue(TD, IRB, V, PartitionTy);
-
-    // Mix in the existing elements.
-    Value *Old = IRB.CreateAlignedLoad(&NewAI, NewAI.getAlignment(),
-                                       "load");
-    V = insertVector(IRB, Old, V, BeginIndex, "vec");
+    if (V->getType() != VecTy) {
+      unsigned BeginIndex = getIndex(BeginOffset);
+      unsigned EndIndex = getIndex(EndOffset);
+      assert(EndIndex > BeginIndex && "Empty vector!");
+      unsigned NumElements = EndIndex - BeginIndex;
+      assert(NumElements <= VecTy->getNumElements() && "Too many elements!");
+      Type *PartitionTy
+        = (NumElements == 1) ? ElementTy
+        : VectorType::get(ElementTy, NumElements);
+      if (V->getType() != PartitionTy)
+        V = convertValue(TD, IRB, V, PartitionTy);
 
+      // Mix in the existing elements.
+      Value *Old = IRB.CreateAlignedLoad(&NewAI, NewAI.getAlignment(),
+                                         "load");
+      V = insertVector(IRB, Old, V, BeginIndex, "vec");
+    }
     StoreInst *Store = IRB.CreateAlignedStore(V, &NewAI, NewAI.getAlignment());
     Pass.DeadInsts.insert(&SI);
author	Bob Wilson <bob.wilson@apple.com>	2013-06-25 19:09:50 +0000
committer	Bob Wilson <bob.wilson@apple.com>	2013-06-25 19:09:50 +0000
commit	acfc01dedf156d0c74a7592e4b97ba629668b54d (patch)
tree	14469b18f5f13d454426243f0fa662b3bf3a769e /llvm/lib/Transforms
parent	51a55d99648865b63a35cca5fee8130dc0d343db (diff)
download	bcm5719-llvm-acfc01dedf156d0c74a7592e4b97ba629668b54d.tar.gz bcm5719-llvm-acfc01dedf156d0c74a7592e4b97ba629668b54d.zip