X86InterleaveAccess: A fix for bug33826

Reviewers: DavidKreitzer Differential Revision: https://reviews.llvm.org/D35638 llvm-svn: 308784
author: Farhana Aleen <farhana.a.aleen@intel.com> 2017-07-21 21:35:00 +0000
committer: Farhana Aleen <farhana.a.aleen@intel.com> 2017-07-21 21:35:00 +0000
commit: e4a89a646213718c86da9f81cc8b91030e84c4c7 (patch)
tree: 46ba2e61af6d0991a036031c49c2174f2e87ed3b /llvm/test/Transforms/InterleavedAccess
parent: 09f14114c98eca778f71788677efe7965cfb1bd7 (diff)
download: bcm5719-llvm-e4a89a646213718c86da9f81cc8b91030e84c4c7.tar.gz
bcm5719-llvm-e4a89a646213718c86da9f81cc8b91030e84c4c7.zip
1 files changed, 17 insertions, 0 deletions
diff --git a/llvm/test/Transforms/InterleavedAccess/X86/interleaved-accesses-64bits-avx.ll b/llvm/test/Transforms/InterleavedAccess/X86/interleaved-accesses-64bits-avx.ll
index dcef57fc625..1a48be2e7cd 100644
--- a/llvm/test/Transforms/InterleavedAccess/X86/interleaved-accesses-64bits-avx.ll
+++ b/llvm/test/Transforms/InterleavedAccess/X86/interleaved-accesses-64bits-avx.ll
@@ -217,3 +217,20 @@ define void @store_factorf64_4_arbitraryMask(<16 x double>* %ptr, <16 x double>
   store <16 x double> %interleaved.vec, <16 x double>* %ptr, align 16
   ret void
 }
+
+; This verifies whether the test passes and does not hit any assertions.
+; Today, X86InterleavedAccess could have handled this case and
+; generate transposed sequence by extending the current implementation
+; which would be creating dummy vectors of undef. But it decided not to
+; optimize these cases where the load-size is less than Factor * NumberOfElements.
+; Because a better sequence can easily be generated by CG.
+
+@a = local_unnamed_addr global <4 x double> zeroinitializer, align 32
+; Function Attrs: norecurse nounwind readonly uwtable
+define <4 x double> @test_unhandled(<4 x double> %b) {
+entry:
+  %0 = load <4 x double>, <4 x double>* @a, align 32
+  %1 = shufflevector <4 x double> %0, <4 x double> undef, <4 x i32> <i32 3, i32 undef, i32 undef, i32 undef>
+  %shuffle = shufflevector <4 x double> %1, <4 x double> %b, <4 x i32> <i32 0, i32 4, i32 0, i32 0>
+  ret <4 x double> %shuffle
+}
author	Farhana Aleen <farhana.a.aleen@intel.com>	2017-07-21 21:35:00 +0000
committer	Farhana Aleen <farhana.a.aleen@intel.com>	2017-07-21 21:35:00 +0000
commit	e4a89a646213718c86da9f81cc8b91030e84c4c7 (patch)
tree	46ba2e61af6d0991a036031c49c2174f2e87ed3b /llvm/test/Transforms/InterleavedAccess
parent	09f14114c98eca778f71788677efe7965cfb1bd7 (diff)
download	bcm5719-llvm-e4a89a646213718c86da9f81cc8b91030e84c4c7.tar.gz bcm5719-llvm-e4a89a646213718c86da9f81cc8b91030e84c4c7.zip