From ed775bc5dd6771c492bf0b3c918a768f60835cf9 Mon Sep 17 00:00:00 2001
From: Ka Wo Chen <kawoc@tepper.cmu.edu>
Date: Tue, 7 Jul 2015 23:59:15 -0400
Subject: [PATCH] BUG: GH9618 in read_msgpack where DataFrame has duplicate
 column names

---
 doc/source/whatsnew/v0.17.0.txt               |   4 +-
 pandas/io/packers.py                          |   9 +-
 .../0.16.2/0.16.2_x86_64_linux_2.7.10.msgpack | Bin 0 -> 4684 bytes
 .../0.16.2/0.16.2_x86_64_linux_3.4.3.msgpack  | Bin 0 -> 4684 bytes
 .../0.16.2/0.16.2_x86_64_linux_2.7.10.pickle  | Bin 0 -> 14893 bytes
 .../0.16.2/0.16.2_x86_64_linux_3.4.3.pickle   | Bin 0 -> 14116 bytes
 pandas/io/tests/generate_legacy_pickles.py    | 167 --------------
 .../io/tests/generate_legacy_storage_files.py | 205 ++++++++++++++++++
 pandas/io/tests/test_packers.py               |  75 ++++++-
 pandas/io/tests/test_pickle.py                |   8 +-
 setup.py                                      |   1 +
 11 files changed, 295 insertions(+), 174 deletions(-)
 create mode 100644 pandas/io/tests/data/legacy_msgpack/0.16.2/0.16.2_x86_64_linux_2.7.10.msgpack
 create mode 100644 pandas/io/tests/data/legacy_msgpack/0.16.2/0.16.2_x86_64_linux_3.4.3.msgpack
 create mode 100644 pandas/io/tests/data/legacy_pickle/0.16.2/0.16.2_x86_64_linux_2.7.10.pickle
 create mode 100644 pandas/io/tests/data/legacy_pickle/0.16.2/0.16.2_x86_64_linux_3.4.3.pickle
 delete mode 100644 pandas/io/tests/generate_legacy_pickles.py
 create mode 100644 pandas/io/tests/generate_legacy_storage_files.py

diff --git a/doc/source/whatsnew/v0.17.0.txt b/doc/source/whatsnew/v0.17.0.txt
index 5bd0f46dd0b18..ddd97c8d1b199 100644
--- a/doc/source/whatsnew/v0.17.0.txt
+++ b/doc/source/whatsnew/v0.17.0.txt
@@ -384,4 +384,6 @@ Bug Fixes
 
 - Bug in operator equal on Index not being consistent with Series (:issue:`9947`)
 
-- Reading "famafrench" data via ``DataReader`` results in HTTP 404 error because of the website url is changed (:issue:`10591`).
\ No newline at end of file
+- Reading "famafrench" data via ``DataReader`` results in HTTP 404 error because of the website url is changed (:issue:`10591`).
+
+- Bug in `read_msgpack` where DataFrame to decode has duplicate column names (:issue:`9618`)
diff --git a/pandas/io/packers.py b/pandas/io/packers.py
index f5e000449f232..847a7c4f90216 100644
--- a/pandas/io/packers.py
+++ b/pandas/io/packers.py
@@ -357,6 +357,7 @@ def encode(obj):
                     'klass': obj.__class__.__name__,
                     'axes': data.axes,
                     'blocks': [{'items': data.items.take(b.mgr_locs),
+                                'locs': b.mgr_locs.as_array,
                                 'values': convert(b.values),
                                 'shape': b.values.shape,
                                 'dtype': b.dtype.num,
@@ -485,9 +486,15 @@ def decode(obj):
         def create_block(b):
             values = unconvert(b['values'], dtype_for(b['dtype']),
                                b['compress']).reshape(b['shape'])
+
+            # locs handles duplicate column names, and should be used instead of items; see GH 9618
+            if 'locs' in b:
+                placement = b['locs']
+            else:
+                placement = axes[0].get_indexer(b['items'])
             return make_block(values=values,
                               klass=getattr(internals, b['klass']),
-                              placement=axes[0].get_indexer(b['items']))
+                              placement=placement)
 
         blocks = [create_block(b) for b in obj['blocks']]
         return globals()[obj['klass']](BlockManager(blocks, axes))
diff --git a/pandas/io/tests/data/legacy_msgpack/0.16.2/0.16.2_x86_64_linux_2.7.10.msgpack b/pandas/io/tests/data/legacy_msgpack/0.16.2/0.16.2_x86_64_linux_2.7.10.msgpack
new file mode 100644
index 0000000000000000000000000000000000000000..6bf1b9b9afaaafbd8feabf50954cabe53309b6e5
GIT binary patch
literal 4684
zcmds4OHUI~6dp=>DJGQAKj20eY9gWw7g`=6A%=+Yu{8s|m61-T&J2oZLWl^u5M`9a
z7#Eaw8WnZp!lf7!7h-g!7#A8h#^^%h3U}T!=iHV~J9IE;h+W+8&g0(s?s<IY^rEdK
zqHO3wCMuik(w#m{P3p`r=4Z{}d3zu(8^(hU{=`&N)&(!xQS)q)g)=dool142`Ncz6
z3D1u^JHbZsd#Oi~o_~2?{iacp!o%88!05(c2Jq4Cn?C^qJGQsJ<#_1H)2o0pJ;y!(
ze*g4!+akw(#>hFqE5W80i;bCttg`vEk}$_{icD(ql=EMfoL>ck6d<f53=&omRuk3`
z))Lkcq8aXWCCoi7jt$_{Xtr#U>53MeD8nd76sicT32O*z3F`<q5N;%_C)`AcjOKcr
zk2{pmAKk$0K5{~DWDWifGsbOI8Dh~1WL?I9Tj|_VIRma>81fdULk#k6!d2PB4l#6M
z$Z_5DLhi$35Poo&yAW80DXU5Qv>YE~uR~+EUcQ=?q^uT;8O)qd$24srLJJ`}*6SH-
zC_Ia-n>)0ah{Hq&lcf$5%9|3+mTFD4rP@;+sa7<t?F!P>`J&#<6Y2cePqZS4wS)~3
zI~LdEb!+xj9%pG}R#k-6DLCEswkj&Eil7y!v;usrqAchhjGIc%@^dO&Vh-A%T!xj_
z5-e?=(f+bKW=(_muYWaPohd{H@zR37a{A;~;JM33GderbJYL%4H?4H9tb_k>!kq|{
zVR2^|+-iXm;T@PbcTNos;T@RpJAOmOjw!lfa^>vP5>Y#*^Y|G9Z5zw>#<jiyV`|)1
zOr{zILhjZD3v{8hBIG05Hu~ix<58S-<kfHrccFFN)^=Z0O)9Du!aGRe4lkc=K%UBW
zMjqlh@uvqUSXbNv6ltvB=xzbXA*D(?RG$ZqxsR)ILO#KCeEBYKhvZIh2@2mo^$FVE
zON*CAR({?P!RJdObnZ@2?qy!7{|~&vlUcaL@{=Z0US+c=Nh<P5k_)hM2KO?wKW2W@
zw-hsxek+Im8mDDx{haovpIlLGvtMV7j8?Xy7RaQJe06$Y5ga%Cxxk~RT7%&5&O(38
z)*?7Ce5IUri)-|NJ2?FD>cGYBF0_orzRmo)))bPYz0H#!0WUw>yd%u<-I2%V0k?cU
zun-R6*13PA%cLvpk6im|$xUZ?HQxzCGYq?6Xn|oj?lgC>_ay6EE}|hHB6>sg?4{|f
zkMfq36D&UZCsoew;@wHBGy06u>w&63t_7J9VTdTooj@r<&k4m}5rO$KhwpinMX`@q
uCs3>x*hJqE`*<g=<N50a-Ye?L%G;)3{oiSB3O-Rp(YtZ<5?Q+kV&yl6hdSy2

literal 0
HcmV?d00001

diff --git a/pandas/io/tests/data/legacy_msgpack/0.16.2/0.16.2_x86_64_linux_3.4.3.msgpack b/pandas/io/tests/data/legacy_msgpack/0.16.2/0.16.2_x86_64_linux_3.4.3.msgpack
new file mode 100644
index 0000000000000000000000000000000000000000..660757079784628d0bebc54d4fb596f45954d1a0
GIT binary patch
literal 4684
zcmds5OHUI~6dp=T@s(Huf543{)I@wNT&O4^A;yUDu{8s|)zMC;&K(rdgb)#RA=<$v
z#<-xg(<rDL7cRw^xDcZ&A7P<!V~j2|u5{;|d(NFgr`Qe=C9;@rI-R-m-ShbR9WFQt
zQ`OmEUQ1bndFxF2URToSK5;}>Q|eJ>7SvwG?V&<kwNyLTn%m{X-FsNfIgwO3cREsW
z)_c3#(9<U4d=j2_G`Lnsxr<KXbJNONh5qUYLxlB&VM1IzimQ)zq^zx*tGuEp=<>`^
z@syhEVSHNYq_q_JvTC0t8F_#CXChVFCepj@(%S{Gax{zSe7-Sq_%Suj>`(+(z0>AK
zx*byDB$9^uzvTpT@ofj?WG7-H;g5d&JlFRtz56gH%gb{z-VQNa$gGU%+5)vn*3NgS
zX5L6KJh4t2aMCBQ^yTFh$2w**HmeiI_x2<$twOI%=<vl6(UcA}CAXb~W^${@S+|jj
zQ~%hd{_&c%S}ua+Ad_pI#kiVwP+!zVDljYW)H!6NygDj&Y$l+ldAxl6s%yP0UZps$
zgNEjI=h_0r;_vC`^$OAceI5Mh|Mzu(3>BZ^BeUqj*1@cZeHs0EttqA`+ggU-173cz
zdPB2|Zx22^2e{_ro~h;-@@g*Ub<fp)W@$R}30Njz!FWX~$z=-(!`KLi7C3Bz!)7>a
zp+YR@GO@4gIP3OHX(qRup1}IAxs848A|&ZNI16@(0wQdN_yvFZX}aOnDn)7TGY$d9
zmxT*}4{qJ~4j9_7zV)?>`yV~N3OL$%_#NQa51-e)adA8EKMQyz-1O|tDs&^rzzcE(
zvAhptAOWbCV^-f}Az`wUxwc}OnVJ#5C>e&yBt!@s2&06Jgi8pQ5-uZLPPl>)0}urR
zbr)ZS6iR79B71QY6P<#N*aB`2{F{^sp97+oDCIgCp~h(-j1o2yE+Hg#`0ko)nUhvi
zEIIId4>LlZ$?0$nRI4~HI)6D|Tj%$sqZCX6>2V|~JLwBT>4_w+r0dcnNeueDT&Kym
z9%i{_Pc`qXp*W3%A|Wg&rxR+$^&_Un_|TZey)L7Oc)I?l>R3q6;ujqZPw{{VOi2kq
zBq&<c`|+N%j9F0khT|Gmc~+W}pjJ%`gVlLD!XY8k?39<>!J?5!aAt||@ear@w^Tjt
zh=J~9Z1Cpu7sHAIVw`t>u%@VP6)e}-%ndB)q*-$|TqX8pLpoM()AEE+Dy*nXspDQQ
z<<oQ3zkFKcp*DT4F=g(!<J${TF4vusPLYnxOib3UtGDaIcBtMCxyOji9TE;OyTC96
zb5O0xz#pK1TktIH%q=X6+H%t|P%zoi7A%n)wT+B!*WeHdCt`>^+0%<x-~_@s^S?Ut
Ho+W<)tlc{5

literal 0
HcmV?d00001

diff --git a/pandas/io/tests/data/legacy_pickle/0.16.2/0.16.2_x86_64_linux_2.7.10.pickle b/pandas/io/tests/data/legacy_pickle/0.16.2/0.16.2_x86_64_linux_2.7.10.pickle
new file mode 100644
index 0000000000000000000000000000000000000000..60101c2f1e95ee0b33780f298f4d82235939586f
GIT binary patch
literal 14893
zcmd5@2b>f|*5BF0?jQ&ViaF~TSji%$1rc0VRs`ETj<dVH^bVW4W`-m!CeSrU&Maci
zIp>^n&Zl>JhP%_#Q_=Iz@BgpR)7{Jh%IAIG@cZqndiCDxs+a0jb#r8?=f)CNMQca1
zJ=;a6EMb*5r*pPj-qe-uXijHqa#>rn+SwXO5>Iv5vr-d4kZWzX>&O*%D~gjws46|T
zSHddI&2_69tnwCNyKZ%qv9qNmYv;1@3F$d;H@?+TZg0<BEn!u6bc*(LTkBlg?bB`b
zN+~k8Zxd(AiNyJ**>20F<L>J9vHFtwlH;bj{j340eAZ40yDgn-ov8@i{@qsjj9JZD
zcYtTbI_hKjM!Dj&yGBz-zP)QsO;e|^YufW|xz@B0m<afrIy<sCk#EYy-GPcK4&BI6
zcTj!F0xQ;t=dGE*qvH!SL33_SmmPQ4vPvh9!GvNU7@Vjtw_-arG&Jn_3x4uXeTfIH
zbY#Jbf4POZ#%^m$Ny!tRy;J%6fRd6yb2}}<=HBI(5#D;iIo}YL)(jc<2H-vqK71<S
z;wk%mK={>1Uu^p(;4azuhZCM$KJb}02jsBEj&!^2uHBGdIMrRpDr@b?x$7GB%M}Og
ztL?g8k@32Y+~|>de0|T|AmOax40H-Q*ih-f!LnP;vNuZ9mo2+&z0eZ*iz!f2s$rRi
z<r-FKSgBzz4XZS))-c!Ts3mS}Rd&H|JDc529Dg0gmDNamiX_mB+0=74OE}e5Y;t5p
zo9h*A1iO^$`Bi9GsbMb-t2C_EFs@;54Oi2!kB0tqx5!(SD$d+3JvV`fY;T=yH@jPf
zOrR*@(_}!#-K`NI+j#D_piUtY((aHDHB4-aj&xf#KCQK5dYe7It+Q#y<a9@Rx-H^v
z4Vbq}B;BFTdJYUZENaN%Tz16*2g^=q<(90-O8#<2q?7K*kY9|_;@}s18^0JW{bF7?
z9Cn3YB;D;3lgvZwV`f#kY+Gw%d|!lmHkWSiio0X#h7BJ*e8kX^Lj%8fLjyu>2dk{5
zv(p_rsaDIebB&nPj%u|#MOVA?s;qXGwCC<>RSvBgHnL`zTkE;wkVMn7?W{ZA8EREF
zQtw%Jx1>A4b9YZzRqfM73b?F0u_={m%(o)bbfi*otgZ<OV-k`@g-jQFSd}x=ZF$J4
zb4KOU`K;1!qqD9<)9>lI^$BN)Lrd-jOHNj6YlyCG?^Rjb6ew+<kR_)sN1U;laTL>+
zx}T=zw{LWQ)^Y^uI4Ozd1K-p3gYNftpz{L~&Uk0C11%ruxd$bjiB3V02Rn7n)PMr5
zvgUl3dx+Fx(sK_rT1-KUhZWLAAT8=7frm9lr{AQfKN@b^oUmf!tk`%fwwo23fHu5N
zCnOt+YzZlHx@JU3w3v`^dQ6pm5GtL1y{p!3t%6k=_N$e;ZiTKf*-Uh@GXj%s>v^*6
z;O(GRJE_&fsMRjdb;DW}(CYM{Rx4WCI@38fEA^W5+`Q52Oz3r%vi|JojOMJ0_2)vV
zhli9pPm6N`X-jFSCygzgFE!?=`5h6R-~3gX-;vPcQPktn)Z;Ab@fgoNHmt`5(Br(I
z9!uL>-Gx$#$9eAYMv2`};t55ab24ic?V%@n?nw!&vMt?cw`JXvlkO=AXP`--(xDsE
zSvx*abk4Oq8YYZWHO#4g4Re}aF8A+Yx@<YUSe`E7{*7%p7K_2h2Ra22XJ`?pb39fO
zE6p|9Rt3wCtb1nCJu6|Ab#~b9*;ZL@R;Rnj#%%4Gob4Zy?l}o%hI6B4IFCY0<#yE1
zWEYbh7-P=aENsqK+!sW-FC=%F<Q^PNC8o5HQWjClMYdI)?G(9A(QFI%Vp%dRhNoQ;
z^0Xy-nJe#UIyNuGBw?n@5)RCBIm{E#-4#LI718aL!Evoy2THvv;hgO(vK^@KYOTU+
zqDr`yyem}UbxMWTN4akx_e!hqM%z((y9p6+Gb7*@M!*S-fLlHHwr~X8jtE#1ihx|!
zy+cO8ot}G_iGaHi0rxl+4o(vHCY-7Ur`q8e;Xcp3KjHN0cKSMn+W!Hkf4AdT_>q$C
zL9Qjfz#06zl-fGsKLn3?IOH*p=*O~>R5=OZqZ`JTd-Bc|7ruDhqe?lC1(fr+=RUEF
za-LkCa-RBcDCcRo#WQq^XXzIA&@G<x+~<v3#AW^S0^H(}pj(tRVS9N|`o&A0`?B$i
zSKt?~Dz|+t>b9>3+_op3`+M{o(BYe*WQhmb(>q0LQ@Sm_TcGW}1;=~abKgO(O*M5k
zBelI7vh{oVxk!R#r6ov_R#i&o6BPCDcU!$vMlv`*z}%sa52JJcqn5$S;v;0u#<Xxh
zCYbB~$r)QHE&fc8V|Dw9Qo^TEL4Wx*O85*@`JATtf~I+uruouy|7uKACQb7<nC9((
zY4XUJT`7Hn`Mc+Sm2k2~k=d@a$l5jL@FIKW2=g`6_z%zhCV^9ZHs6RNv-_>pM{yW&
z|I{_^cQEt!YK1>USGbfbTwNyk**%&0w}w_+3+%1oY8v*@u&;)`8~q4V{8ZR=_4?Iy
z!8Eyiz3u+X-*$iI{Hqr@*i81&;xy=~Z0T342nK36Si^*dTi50$&0nf$j3rWPDsg!d
z)CI%8>sJps?teHF>=G;hM(P6KmmaH9dH$wCu=v0=fM8zJf_~|?s(4&yhRflaM8q(*
za3TCvl%gdKD#}P7&eEb>%lLm{R#AcZq&-o|N!NO!mz?r==X*qms6xjR)e@yn9@vVo
z);NjloS#*wSn-zDwziZ!)QR30@-5`7ZS`tY5h7N@fK{GCEQmgA>Wcx<7oB{gbBBYV
z5v!x)36??$=UZ!lju>8p>97&~F{UC%3?NxjtU(O7PccyPaR)W7VXj8Z4cz#Awzb2~
zW_c4Q27w&UTob?(Ye`<*!&NF;F&GH!yts4Yt(#bz-5z#cu@0G4sKUX_#h6%EqF3r}
z4B`Fa22YRsu763%1~(;7BWxe{%?E_{y|Qq~_kg{d*PTbWbgj3i{{T4Y>h?Pb7mY2g
zSPJ;bvx}w?j!bT|gmB~jpP&3AVAm4wJ;Db^4A|x;z`l=PF^4d@-;PiH)Zc`+SPzp;
zC&l_)=Rn7gVX=W;+wT^}P9#>vhWd#JS4J6wy+|x>6s8Kr;>H+LvA79Z$~iVAy)3UX
z+VGnJ<B82BzE5{1V(=}<*^|MyB$G6FhDPqT{_pLVz&sGgTXEX8p4gf*bjD|7bRd+s
zLEjVGN^CHchmgK5Lo2Ij&O{@)x-pm4F<b+x45K%rqBd_;VSj89I0T99fcC^t{9R^`
zlmv0LN8tKAJ&_D?F$}bbzu}T`1pYGSSJN@CgpQ=Rp6>rbH-BQ3k~W%hl45%)js=Jq
zBb%Z7T(JXjuwVHC2W5yD%Wm+F!>>Zbju=u7w3C#>>|z{fXJ9<Bi^MPMK)aH&CkLt}
z6DELiJ(w}ZN%Tr(4Ak2HyBWjJ1miIYJ1KVKTtcZ}f}V6QxucI^U>1HWzoQp+aD;w5
zw88GKpAeIwU(VVlvIS2JQ!wo1_B#o9gnVeed;IS6t<z5kq$(b1B6Hp|OvP344S<|?
zeUW+ZrRm`usGR&m6<F|Fc|9xo^=cK|NW)D671T2NpRAv(^-s>oS{lL>tRm$)_AauH
zDVnxYu45>r6@DvT$8!8+pYSXwH8RhsVG3mx?BmnaJmKH_l0u$Qge9Bd6tQ1H08_;N
z=psX;@fi6kMjQZy;y$nl_d#LqgC+O)0{0<4cd`igp<(Wn<i<hGJo_-8J6(jkG0fd0
zxsi7bcQX*SCu{)j6fGpjPQjGPqHj9;o^T{uZ54Qh2i3Kbpf1BKkoQE!A4g#=$7iT<
zMjgi6{PEIydAbtqYMkDU@eY5ytiD|GcdBuEP2T2f0lC#!)qDx0wu3GVS$$H?c1s$U
zgQ*#<9nHceu0p<z5Q6PB{P93pn#G7;mgXC?&O%S*NL?=M>BB`HO&Ie;Ps~J%S6E_}
zYy@tx#B5@av#S<3IRBz9iN#7w%gUtV`S*lkPJ{~AS^S6FLfmMHxg51BT3Q9(ydI7Y
z>tMWxZ5H#;;Z2wDNTNLJ2-yt#<$U4_Ti212<YNa%XRFN3&lX1kA-As##pB{n91W=C
z9V3au@{T1A@{q#l=L;kWZ{6rG8P19_76R(aFL4~&S*$^B`^Tf>iEjK&SaF>GQ@8|e
z>TDAy0As3fc|j}5@e17E{!au2w*Qj=GJ5kqnPQUS6aqElQ)M$e<I{-4jFF@`<I~X%
zMdlemfO~yUoLPkXEX|Ge;>N0<Nl3uTpC2V>1A{EF2*AO$i1-5<o;U}86He$-M4U^U
z(jfezG{#i)ez&9UKg4;GBfNt13mja*1(M|Bz~zUy5GW)XUc;oD99vw3z9%lmU%c{e
zZfzHf(X5Z*av_}*mylT2I!n-s9yl*0uAr{V&<&~Uav)G9T>-#!a3#r+4rm0XgR1~N
zakaz-v%xhSugg#^s&H(y`q2LPydovvn22jJl+jkcj%{t_>(PdlZy-?9zEL*AI=YFt
zf?wXut}4+A#n~-DDofv5M8a)ag1+93TH4%A`WC+(^sx9HQdIERf2S6No8pCZn!(Ev
zMOV2C^q#m|$_cy5Jz5f`<X@o$eC1xr64t|g1s3|s{gOn+dqEEm010o&C@*;sy^QZ4
zSkXh0M>@#EvKfBDBg7RP<WY3-vahgTJO+fa)8j?Bp9ph5DY*mt<WoRkw|N?X?)41G
z;a;>p-RoKQJ@K4G)4$Aa@;nLZGSoeGix>QHc)i>$UR2}Mwc0K40@--mOF$ZLdzqX`
z@d|-j#jCOz*1>DU6};_rcB9_*29VAa=<`iBf)4VQ;jXWc4&s+=z=wW4^^Gr@@o1m#
z^2FO1RV#Q0t!S9POI%?E@39+Q!TUfW)IR{AEj}a-Y(d@77Jmfv#77dVLS1d_A9K7e
z!&T}~cd|y+e*)5|`p@J{icbjCL_d|yu&Vz;Tw$W0u^XM}=Ri7hq3SQ#2&(!^!%bDM
ze098ZzOuuLs!sLVRQ#2Xl>zfNJ}+{G_jfY~wE=y_Zgd4-0|{0C1AwajhBQz$bwgEu
z3+Rb|N^DTo-*LPy!&MqpFEpzD9!R6=AIO;$O9|9Of0WIzs(&J`pz43I8=dISKtcja
zpMOgUD1H7T8^O}&7h)g?U(O(J6?;D_coP~VDJ>~AMNf=FvK*21gsgH(iBmJjn}lUl
z%ukX6Gv}8{2?tp(T-oqLB_)HODn-r2&z2|y$(EUuUoYW(qE(S|gpF^7$Q!A0_(7AY
za`;gb9FX5M@f7TT3nuy!1F_JC^uR<Y!k2SC!$uR7vwBbtb`@U^bS-}vm%r!@KT64@
z=qKkTU9`V!hAlt92v=)g16>%tkkbbOp)@zB2=|&{?zJR$U`H4X1akV?0CetkNDk+w
zH`2M+W#1F)Np!GgSf31a8EOzYeFJ~o<opfQI5lH(`XR>qHv-al|HkA@icJXADmInP
zunsmOu3-Po*;U?;zlF_n3*aFH<>Hn_ge0_(-}ud#*b4kG*VcSU(E8hGxn<Iej^_np
z@VBBo6@5Rl>?vPK+pJc>Ei^2=M^X4~YvtCmEvF})X$a>P$#*qouF9FVW4DMRhXRk3
zHw=JYF`Q)Z3R;O?F#^yNBPCWjg*q0F;&@$#3Na~fD`WK0KpLZOPtK$mL!jomgKUP4
zK9)EbUEl2O$gY_yzg{ZXeJ2blyYE~?&MsQcZ?*fb;D_C7rRbpH$7#X8GJSAk3OUgD
zpqygqLm9a6F5dJba&`;K!KVXALtifb@w9<>LojyuDIXGcKe|cHAi%fwy>lMnmY>!?
zJBV)%g6o<Pl*4?xI}!LKy0debn25G)4i}S5bA;H#G)Ia$(;OxCL=#qm^6Jsjrrt|7
z!=|20922o}%La5|=|Ya%8wlknQ;Kl!6Xu>OxdS<Fn$Nv&5pFBYy`SU`+_CKMb01KI
z`@k^wL6SRgzjH7U$ghV0Fp`oaM<mhp8A*q-?}?N|2lMM;B&f^K#gJdq{<z7njcS~(
zgYhPR+}yx4t8uyn#%+Jx+~BmRahh7^XRBI%(VN1ThhjR=CU70L^?9!qZ3J$HK-pu4
zY=*7bMjSU)WzBYWgMo{7A$B`3s$#dZh^VfDsA7SEQTbbTU)5K8E-2uBLW&OhcvcHu
z)!5Ai<rJHuiB(eyn0_SY@<BPP5W6$AoKkK^jNMs8WEiy>#%qR=nqiD)7@dKSn4KM*
z(8tJ7+iXy1JI|5Lu$|`;SBTof(G5lIJRp>pctyC62y@Su+<~Y)(&s*^2=~!p?qei(
zAZm~Gxfc}SUZ}bCP1$km%1>egj(I$gh}>=fM(zouLFCf+8M!C2?}?KnIvBYplb|j`
z2SenY;*XoiJyng<aWH<GKW-xTbTv+g!1x*dcxioQeJSp4&s5_yw2s`oRe}EsW4DR3
zfb+!JlI4)lm7N@qPa#!YECK<q!2nEPpF^IcI9IaD>ft=u3>*A>;$U!HhF`$03G9I8
zE(BhM^hHI4T&#us*6nz)Fa44t(wAuIE4mZB6m;<L%P1_E7cSTQDCVGT9!tMA5v$;T
zubflQtEp9RsD{Hd9IoLA4M%D?O2g3_Zm;1O4R_FRtcE*kxRZuEt1|KmDn>fOmDEV2
zjJ(QdNoDw}*)8G-*8q<)@>&3f&~+q32+_+JLe~R&;s%KgmXSAdye>mi=rS@RHze)1
zHvw<__GU6C#VrJCy0^+^*l%wm4t}e{{dRV(in^TLK2F?$PKJL9Thg8AIa4ycB!Y|F
zMe2}`+)WJgp6?_6Em4X586PpQMC;bTD&05Gd@5zGHkPRn?+HH<`;7lYv#%Hk%Fxf?
z4eV)LmTC9$IZBWB$!1uO_Y=p3E3-d<u2fy2P<s$4#s5$d{)fZ-k1WgoC{Recj{(qQ
z9w!4lhW4e$Ji)#vo|Ncd(tU~qbs1U)N%Luc+$7y+)HwBMj-%O(_NQloH2(A)Ig{df
z0=148WHYRX7l|wQ(@X41MJT5lFJ1<w;7_lh=giIUCJg@cDtp0{^BUPH&3C88Aq)EV
z5Wn4>l)PWdZ`{(HP=oH7PKwvL5Sb$0;0hus;!U$E<tuNoD|M6!E9Y$tAV<6dK#RXi
hI#`?*pvB(<^u+rTs|>C#GC$yWU52{TIU=90`5&828NUDk

literal 0
HcmV?d00001

diff --git a/pandas/io/tests/data/legacy_pickle/0.16.2/0.16.2_x86_64_linux_3.4.3.pickle b/pandas/io/tests/data/legacy_pickle/0.16.2/0.16.2_x86_64_linux_3.4.3.pickle
new file mode 100644
index 0000000000000000000000000000000000000000..6d5451f96e20d6e8aea11a1777edb024a7a561a5
GIT binary patch
literal 14116
zcmeHNdyE}b8NcuDqua-_D^-;63SFVBZ7H-umECS>sn;&WQvO?S=I)*CxzqdD-no}P
zXsIN2amfJ*9f=|S(I6pF`Gbf`LNtUJpBPOvicgGxXne%*5?lz0{=V~=nLGC}_inc<
zsI%GmX6~GG=A7^Qea|zWN__6UTO;B)>5TALG4Gsoc%ot+-0bkRvqmXr*rU_siaDAu
z<;<fF@5_|TBbhzo=8VG<yl-!<P|fQfXpmmJT&b2TIkVzS@?^;<nzl2A-;*=>id}Vh
z$~LFVrJQ5(RKdK{EQqHpg|U+UVG`8SVFNsoGpdHehfB5M>@hi+BE8e7RE%Q|Uzw@U
zcy_f?o31)%9K4bmI(!8tFPfZj(vj27L^SK%>wLl)Nk`L((_XV=u6k_Nq>iy$x1nV^
zDqF>Q^n^1xIr*`F;Si_vO;sm5PfLksjfz9(<2cWh%Qzpd9d%4Rug&2dSj`|<!G_o>
zHq6$si)aGu1N!wb+*~OKDwj-jt{y3Sory0-R`X>YU*i`;*09lGU{|Gl+$>G*9QQ5I
z8@~tRU(RFsP5$Mu_4SL1&|)TfB9Uk`7K_In++wC<^)scBc2ldU{G(Q;Sfb5)?Agpr
zg@gpiBxed`1H!#PP1c?@Dz-T)pYzrG#qCZAa+m0F#`)k$=OJ_);TL3b=8OS>W@hq*
zLgr4RP&1v~rxqkC`HGBP%R)jBv>a2tlMlH44gs5(LAFqyJ_PV)MC)Ecje31Dqaftx
zWWH22D<uQ)<12Si*S$u`I0(?Hxs5>3t{f+ui4iDLVvLSEJh}t_6ZqfhiINYgH&$)4
zk~eLwMT0_%zz(yTFPa+l><AwS{ze>%RgXiH5;GO^u*2UI7_mGvW1CehqJKxt&X-Kv
z-U+Sn@wc~Bt`v<z{<!JP^JvLQM|nzia(EB;BBtQ*UYbeHEI`#rU+9nE$`gl<<ZKA4
zmSsatxzH!Uw%4ya2_D@Z(47cYG7&4;ct8DBojJnN{KURU<R=&ZVEpy9k;uhQPCZDp
zIR5I3M8Emdxoh44?ay6wg6P79zdHC&(A{4ueuL=4H^h<)pnrV+;r&FnOkMrx!de<u
zAk-uQt_vbkS&e>)$maU9LM~~>zoa;OxS9TJlQ7limv2&6W0LkLx<=6<Mc0jCnjXkk
zDWPU0#9?LyA~i75eT_CGD(9HrQm5lh=a`6NGQ^hVqdYx7kyxQxkjUroM@_$2ZwiPh
zU!I>>k_EFTn=OgVA|?Zq6p5r-PFc62MI}_LHq$0}V%mV2|L9y!ve)~^B)vq@%j)FU
zd^sc`;w|-T&;35tqRlc=av2+GFz*Ooh973<I!!GTcbY=Ow5w}s9Eb<x>DVlsL%=t-
z?{K)=4wY^@*lq_C4lK2Cbkmm6O~NImgewto3EAJC;=xJ=9s)+TCtJ%S^ne-TNxP7r
zrnrGZ1{pN)l<;1*!yd1pqqR92iCEX+ga$F$#M*{i_PxO4SUT>1{JX&8csk*K{94WA
z3F9cjDweMyqRQ5?HlnWCjC3+$2{CdB+WSbWGO8Z)mD2X@7cR-?D%cbslua|_4D@hp
zi1%izw(89c3gF0@Ic%Ec_~8D0>0rTZ;X&Ckb{9CoPENAB**)6lv(xizE*)j}vim$w
z!|re6WL5)5h-m7aOoK(no0_?pqf6~#B9Tki{^kBR;c{jlJ^5Rr&t5xt^;@8;zVrAo
zqEmO=`2Dv$S7bl~8VqW$ROwqhb*8Ium6q+-jY&G9=v6_Bw7SvSYtu<RSK`09Rno1<
zC&W}MSLJCXOD9t+3vHO6cn1jRq+?x!xscX=2y}{+$fv)N^lG05T4gk;8P*OE>vp;(
zE#!U80$9XN2dq74<AQ&R4=63udNjmWWc9US-HOI++PY2mK_Du!qrN?*>h)W6Oh8)I
zJRnoLlJ6jT0psO?cZq}KO$RwwI)w8AO^Q3|mg$nPL5J|wpuOTQ5+P4UN53QjWpp{9
z?pG;F$P+=@f0t&YtjEB~wxY3~KnnqR$%_9R=evXa*D+BI`A6xRAa6Z_D>sa-WotZ%
zTnu#ruz;s#;U>yCfR_&kk{0!Z_wN%;{FuI*NB24{kd0VQv2R~OAvLLJO3@XH_9)t`
zXrH3}imp_2Kv5TvqTFEC8@W?FUY}IKfgv$fSrnXD)J>NLGd0^pMWSF-^LMIzN;<oC
z?yYGK)v0?!X#3qi|2p;a!ANBIc=-U)Tz}#*qECI{^RE((jb1bU3((u1eeSbF&+fb9
zMWQeL;jbHB0R5<a>Mo-9Cx(9b!l1{CIFe+@F9g*-u_*OMu|OV*yNk9b?o@y*U28yv
zshB@%<}$e&sseRIDwXf|B8#psG_V<Aeql;Oa{8nSSV!0_JIpG~X0yJkP6#8=S>bb}
zQ%1N8l-X*qQWQ-m=S2SE4k!n16(ua3q5&H{zZj?0+=6q}_w9yy8xo$Mz^wju_RR-}
z5b@lw`GMaPo&WY_qr;%Ty#47DMA!c*{rs?qgc@fR6RVSzums9zn^0~5LFtjmwUTU+
z<T_`!o);<@D_w(9$Y)W!xE=ATT{Vic2xsquQ+nXXKYHZTYbPfuZebgCkEyOC%6C-K
z;^iRiOHCA$2|fXm9w3po1frG^7~Z<DMP();?XWgN9RsOFePUu=-`Ju)`LMP(wuq%u
z=@@ZZzGVlsFlBJ`KDs7Pk>yFDw2n25pM)}Ytdnk?P3z?UHL|XpER}mnG*a3dfi&x8
z2+G<;r`>eAg-&~Lde<tETa55Z1>I`US**Xk20h-`BA`J}G`6VE|E;f53#CE#(Y4SZ
z7F~qyc!mT1%%?Z3hoaQJN!Cv;ae%Ed*=oOY#82%uF4$G<YX4~Mc01y(?b^zdRaP+(
zU2Stan`}G1w_)dj95Hqtka$F+QRRsOn-gx6SR^Kz$eoF$@uX`gpYGO^LRR7krcX4~
z^7x%@0evZ^+8)sBsf7aLOCA^xEFl=rZ&=kT?&!QKyl_g2wN=!$W=uYp(HEt(ZHuDK
zb<${X=FreOU+ym<T3Hf{DnWdluBDfaQ&7AJ(RfNqajzF*ga-fT81ps?CoV(Y&rns!
ze}pmL+gg#m8cX)__bbLEy;4!HfF^(6AQV4Th^-hFE=GT;*Luh&#uKg>ElOt>A;sp%
zT7DUdz+R{7lC7}g`a;oG_u7c+=fQh2rlI0#&WUj0)alrBKH+@D6%Oy4HmVtH+)tMa
zi%~T<4Ds)YgqT1qN3nB_=Avc~u|w~7@(Wd7BtF@|G|hwMN`BfXV0(DNcjwz4?#YNx
zHOw4#hf|qpW15Nm{6s02FJiCOMk$7VFXyP>-}Flcc<ESF)RK8W29WQh)*TwbtJnrN
z8mNU!wh8;f#afpJz2+0^Z#=OMkXZ4>OGbXmuzczVQ=){sE+|}$eZP<?SPFbl5>3bF
zIvT@z1?v^r7de;LaWikdfiry10*I8i^(HPGUqTiSvW~|hBG|I1INV;wo{dDfSSRH!
zf}yTA0zI_~4Tgf*FIE%?hTOe9ncLn-EmSac30(`Xi{cdY&Mb&cgF(owzA7c3@#H?y
zM(JM1*{^HK@Of0#ERH+YalF{o80%XQmi0B9TE@MUoVVEn4?5P!m_%VufO=7meBP$k
zL~m?m{<YoG(3XRF?jh`Xcd@i!mb=m09<JK5)b|MmQ2-+MG=eAqvwM9YvRx2io2Z1F
z?n)yrIK-SKLUwrHA6cIya2$}}Xw+!9X^oAuS`3nEOlYbxp=mfa>c`RjG;P&iV@wBg
zI`Zx|vKH*Ho&rBzMG1Ejb-w=@5{!zkpKyg_9U+ExFDK6uE@OBd8uxV=RWt$zF}eoM
z%guok6m(Fqdi#3uQM!EZ=$ND%72TxhW<{@6bc>?bDSEx4TNT}==!X@(LD3r(-LB|I
zmNh$g)d#|#xge~$Uto|E-vxuo2mNuM+DhiB{S9AuV8=MHv+Uc<xBiZybZ~$zF6$NC
z`**jjf8d9XcC##5jXZx_Q<MNSghA(dBZ}VnZe>?!aiP!ueZv(fyJ_RMmaZwxsb!`0
z>&Fi+N*V#xHtMI6o!rN0++J%cQtE(0O^4fGvS>#GEq)fEoJ#sRb(@b<JAIrw9fO|;
z<5Wn}cP^!smdq5~_id$FlbC5>i%c-^d`_-A9v}7b_>jkA)WgFVTwmqhin6n+a(jzo
zTU!*mb-oRgCl0Vl9BwM+cdu+)vr&AB9l{22z=(?j%Mgb<+EUcP@sWN^gvY*5YXX_#
z;`OO+!{C37mE8gM86RLD@&L=@s4zI8p!KlX^b1)Zs1%0W%31?Np~y`#ew1{UA;s^+
zh;+4<P#M$}R^Rr?;AKw+$g<iS4Usanw4R;2B45T5BG7X(^Px<s^H%He3Ags^m(#WK
r>!REo!WXJDwBn1hm9Cf8HZurNeNRTJ6MQTqYi{<jX53><tv32^q6{_2

literal 0
HcmV?d00001

diff --git a/pandas/io/tests/generate_legacy_pickles.py b/pandas/io/tests/generate_legacy_pickles.py
deleted file mode 100644
index 2d93ecf38a76d..0000000000000
--- a/pandas/io/tests/generate_legacy_pickles.py
+++ /dev/null
@@ -1,167 +0,0 @@
-""" self-contained to write legacy pickle files """
-from __future__ import print_function
-
-
-def _create_sp_series():
-
-    import numpy as np
-    from pandas import SparseSeries
-
-    nan = np.nan
-
-    # nan-based
-    arr = np.arange(15, dtype=np.float64)
-    arr[7:12] = nan
-    arr[-1:] = nan
-
-    bseries = SparseSeries(arr, kind='block')
-    bseries.name = 'bseries'
-    return bseries
-
-def _create_sp_tsseries():
-
-    import numpy as np
-    from pandas import bdate_range, SparseTimeSeries
-
-    nan = np.nan
-
-    # nan-based
-    arr = np.arange(15, dtype=np.float64)
-    arr[7:12] = nan
-    arr[-1:] = nan
-
-    date_index = bdate_range('1/1/2011', periods=len(arr))
-    bseries = SparseTimeSeries(arr, index=date_index, kind='block')
-    bseries.name = 'btsseries'
-    return bseries
-
-def _create_sp_frame():
-    import numpy as np
-    from pandas import bdate_range, SparseDataFrame
-
-    nan = np.nan
-
-    data = {'A': [nan, nan, nan, 0, 1, 2, 3, 4, 5, 6],
-            'B': [0, 1, 2, nan, nan, nan, 3, 4, 5, 6],
-            'C': np.arange(10).astype(np.int64),
-            'D': [0, 1, 2, 3, 4, 5, nan, nan, nan, nan]}
-
-    dates = bdate_range('1/1/2011', periods=10)
-    return SparseDataFrame(data, index=dates)
-
-def create_data():
-    """ create the pickle data """
-
-    from distutils.version import LooseVersion
-    import numpy as np
-    import pandas
-    from pandas import (Series,TimeSeries,DataFrame,Panel,
-                        SparseSeries,SparseTimeSeries,SparseDataFrame,SparsePanel,
-                        Index,MultiIndex,PeriodIndex,
-                        date_range,period_range,bdate_range,Timestamp,Categorical)
-    nan = np.nan
-
-    data = {
-        'A': [0., 1., 2., 3., np.nan],
-        'B': [0, 1, 0, 1, 0],
-        'C': ['foo1', 'foo2', 'foo3', 'foo4', 'foo5'],
-        'D': date_range('1/1/2009', periods=5),
-        'E' : [0., 1, Timestamp('20100101'),'foo',2.],
-        }
-
-    index = dict(int = Index(np.arange(10)),
-                 date = date_range('20130101',periods=10),
-                 period = period_range('2013-01-01', freq='M', periods=10))
-
-    mi = dict(reg2 = MultiIndex.from_tuples(tuple(zip(*[['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],
-                                                      ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']])),
-                                                 names=['first', 'second']))
-    series = dict(float = Series(data['A']),
-                  int = Series(data['B']),
-                  mixed = Series(data['E']),
-                  ts = TimeSeries(np.arange(10).astype(np.int64),index=date_range('20130101',periods=10)),
-                  mi = Series(np.arange(5).astype(np.float64),index=MultiIndex.from_tuples(tuple(zip(*[[1,1,2,2,2],
-                                                                                                    [3,4,3,4,5]])),
-                                                                                           names=['one','two'])),
-                  dup=Series(np.arange(5).astype(np.float64), index=['A', 'B', 'C', 'D', 'A']),
-                  cat=Series(Categorical(['foo', 'bar', 'baz'])))
-
-    frame = dict(float = DataFrame(dict(A = series['float'], B = series['float'] + 1)),
-                 int = DataFrame(dict(A = series['int']  , B = series['int']   + 1)),
-                 mixed = DataFrame(dict([ (k,data[k]) for k in ['A','B','C','D']])),
-                 mi = DataFrame(dict(A = np.arange(5).astype(np.float64), B = np.arange(5).astype(np.int64)),
-                                index=MultiIndex.from_tuples(tuple(zip(*[['bar','bar','baz','baz','baz'],
-                                                                       ['one','two','one','two','three']])),
-                                                             names=['first','second'])),
-                 dup=DataFrame(np.arange(15).reshape(5, 3).astype(np.float64),
-                               columns=['A', 'B', 'A']),
-                 cat_onecol=DataFrame(dict(A=Categorical(['foo', 'bar']))),
-                 cat_and_float=DataFrame(dict(A=Categorical(['foo', 'bar', 'baz']),
-                                              B=np.arange(3).astype(np.int64))),
-    )
-    panel = dict(float = Panel(dict(ItemA = frame['float'], ItemB = frame['float']+1)),
-                 dup = Panel(np.arange(30).reshape(3, 5, 2).astype(np.float64),
-                             items=['A', 'B', 'A']))
-
-    if LooseVersion(pandas.__version__) >= '0.14.1':
-        # Pre-0.14.1 versions generated non-unpicklable mixed-type frames and
-        # panels if their columns/items were non-unique.
-        mixed_dup_df = DataFrame(data)
-        mixed_dup_df.columns = list("ABCDA")
-
-        mixed_dup_panel = Panel(dict(ItemA=frame['float'], ItemB=frame['int']))
-        mixed_dup_panel.items = ['ItemA', 'ItemA']
-
-        frame['mixed_dup'] = mixed_dup_df
-        panel['mixed_dup'] = mixed_dup_panel
-
-    return dict( series = series,
-                 frame = frame,
-                 panel = panel,
-                 index = index,
-                 mi = mi,
-                 sp_series = dict(float = _create_sp_series(),
-                                  ts = _create_sp_tsseries()),
-                 sp_frame = dict(float = _create_sp_frame())
-                 )
-
-def write_legacy_pickles():
-
-    # force our cwd to be the first searched
-    import sys
-    sys.path.insert(0,'.')
-
-    import os, os.path
-    import numpy as np
-    import pandas
-    import pandas.util.testing as tm
-    import platform as pl
-
-    # make sure we are < 0.13 compat (in py3)
-    try:
-        from pandas.compat import zip, cPickle as pickle
-    except:
-        import pickle
-
-    version = pandas.__version__
-    if len(sys.argv) != 2:
-        exit("Specify output directory: generate_legacy_pickles.py <output_dir>")
-
-    output_dir = str(sys.argv[1])
-
-    print("This script generates a pickle file for the current arch, system, and python version")
-    print("  pandas version: {0}".format(version))
-    print("  output dir    : {0}".format(output_dir))
-
-    # construct a reasonable platform name
-    f = '_'.join([ str(version), str(pl.machine()), str(pl.system().lower()), str(pl.python_version()) ])
-    pth = '{0}.pickle'.format(f)
-
-    fh = open(os.path.join(output_dir,pth),'wb')
-    pickle.dump(create_data(),fh,pickle.HIGHEST_PROTOCOL)
-    fh.close()
-
-    print("created pickle file: %s" % pth)
-
-if __name__ == '__main__':
-    write_legacy_pickles()
diff --git a/pandas/io/tests/generate_legacy_storage_files.py b/pandas/io/tests/generate_legacy_storage_files.py
new file mode 100644
index 0000000000000..e7cc89fcc0b61
--- /dev/null
+++ b/pandas/io/tests/generate_legacy_storage_files.py
@@ -0,0 +1,205 @@
+""" self-contained to write legacy storage (pickle/msgpack) files """
+from __future__ import print_function
+from distutils.version import LooseVersion
+from pandas import (Series, TimeSeries, DataFrame, Panel,
+                    SparseSeries, SparseTimeSeries, SparseDataFrame, SparsePanel,
+                    Index, MultiIndex, PeriodIndex, bdate_range, to_msgpack,
+                    date_range, period_range, bdate_range, Timestamp, Categorical)
+import os
+import sys
+import numpy as np
+import pandas
+import pandas.util.testing as tm
+import platform as pl
+
+
+def _create_sp_series():
+    nan = np.nan
+
+    # nan-based
+    arr = np.arange(15, dtype=np.float64)
+    arr[7:12] = nan
+    arr[-1:] = nan
+
+    bseries = SparseSeries(arr, kind='block')
+    bseries.name = 'bseries'
+    return bseries
+
+
+def _create_sp_tsseries():
+    nan = np.nan
+
+    # nan-based
+    arr = np.arange(15, dtype=np.float64)
+    arr[7:12] = nan
+    arr[-1:] = nan
+
+    date_index = bdate_range('1/1/2011', periods=len(arr))
+    bseries = SparseTimeSeries(arr, index=date_index, kind='block')
+    bseries.name = 'btsseries'
+    return bseries
+
+
+def _create_sp_frame():
+    nan = np.nan
+
+    data = {'A': [nan, nan, nan, 0, 1, 2, 3, 4, 5, 6],
+            'B': [0, 1, 2, nan, nan, nan, 3, 4, 5, 6],
+            'C': np.arange(10).astype(np.int64),
+            'D': [0, 1, 2, 3, 4, 5, nan, nan, nan, nan]}
+
+    dates = bdate_range('1/1/2011', periods=10)
+    return SparseDataFrame(data, index=dates)
+
+
+def create_data():
+    """ create the pickle/msgpack data """
+
+    data = {
+        'A': [0., 1., 2., 3., np.nan],
+        'B': [0, 1, 0, 1, 0],
+        'C': ['foo1', 'foo2', 'foo3', 'foo4', 'foo5'],
+        'D': date_range('1/1/2009', periods=5),
+        'E': [0., 1, Timestamp('20100101'), 'foo', 2.]
+    }
+
+    index = dict(int=Index(np.arange(10)),
+                 date=date_range('20130101', periods=10),
+                 period=period_range('2013-01-01', freq='M', periods=10))
+
+    mi = dict(reg2=MultiIndex.from_tuples(tuple(zip(*[['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],
+                                                      ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']])),
+                                          names=['first', 'second']))
+    series = dict(float=Series(data['A']),
+                  int=Series(data['B']),
+                  mixed=Series(data['E']),
+                  ts=TimeSeries(np.arange(10).astype(np.int64), index=date_range('20130101',periods=10)),
+                  mi=Series(np.arange(5).astype(np.float64),
+                            index=MultiIndex.from_tuples(tuple(zip(*[[1, 1, 2, 2, 2], [3, 4, 3, 4, 5]])),
+                                                         names=['one', 'two'])),
+                  dup=Series(np.arange(5).astype(np.float64), index=['A', 'B', 'C', 'D', 'A']),
+                  cat=Series(Categorical(['foo', 'bar', 'baz'])))
+
+    mixed_dup_df = DataFrame(data)
+    mixed_dup_df.columns = list("ABCDA")
+    frame = dict(float=DataFrame(dict(A=series['float'], B=series['float'] + 1)),
+                 int=DataFrame(dict(A=series['int'], B=series['int'] + 1)),
+                 mixed=DataFrame(dict([(k, data[k]) for k in ['A', 'B', 'C', 'D']])),
+                 mi=DataFrame(dict(A=np.arange(5).astype(np.float64), B=np.arange(5).astype(np.int64)),
+                              index=MultiIndex.from_tuples(tuple(zip(*[['bar', 'bar', 'baz', 'baz', 'baz'],
+                                                                       ['one', 'two', 'one', 'two', 'three']])),
+                                                           names=['first', 'second'])),
+                 dup=DataFrame(np.arange(15).reshape(5, 3).astype(np.float64),
+                               columns=['A', 'B', 'A']),
+                 cat_onecol=DataFrame(dict(A=Categorical(['foo', 'bar']))),
+                 cat_and_float=DataFrame(dict(A=Categorical(['foo', 'bar', 'baz']),
+                                              B=np.arange(3).astype(np.int64))),
+                 mixed_dup=mixed_dup_df)
+
+    mixed_dup_panel = Panel(dict(ItemA=frame['float'], ItemB=frame['int']))
+    mixed_dup_panel.items = ['ItemA', 'ItemA']
+    panel = dict(float=Panel(dict(ItemA=frame['float'], ItemB=frame['float'] + 1)),
+                 dup=Panel(np.arange(30).reshape(3, 5, 2).astype(np.float64),
+                           items=['A', 'B', 'A']),
+                 mixed_dup=mixed_dup_panel)
+
+    return dict(series=series,
+                frame=frame,
+                panel=panel,
+                index=index,
+                mi=mi,
+                sp_series=dict(float=_create_sp_series(),
+                               ts=_create_sp_tsseries()),
+                sp_frame=dict(float=_create_sp_frame()))
+
+
+def create_pickle_data():
+    data = create_data()
+
+    # Pre-0.14.1 versions generated non-unpicklable mixed-type frames and
+    # panels if their columns/items were non-unique.
+    if LooseVersion(pandas.__version__) < '0.14.1':
+        del data['frame']['mixed_dup']
+        del data['panel']['mixed_dup']
+    return data
+
+
+def create_msgpack_data():
+    data = create_data()
+    if LooseVersion(pandas.__version__) < '0.17.0':
+        del data['frame']['mixed_dup']
+        del data['panel']['mixed_dup']
+        del data['frame']['dup']
+        del data['panel']['dup']
+    # Not supported
+    del data['sp_series']
+    del data['sp_frame']
+    del data['series']['cat']
+    del data['frame']['cat_onecol']
+    del data['frame']['cat_and_float']
+    return data
+
+
+def platform_name():
+    return '_'.join([str(pandas.__version__), str(pl.machine()), str(pl.system().lower()), str(pl.python_version())])
+
+
+def write_legacy_pickles(output_dir):
+
+    # make sure we are < 0.13 compat (in py3)
+    try:
+        from pandas.compat import zip, cPickle as pickle
+    except:
+        import pickle
+
+    version = pandas.__version__
+
+    print("This script generates a storage file for the current arch, system, and python version")
+    print("  pandas version: {0}".format(version))
+    print("  output dir    : {0}".format(output_dir))
+    print("  storage format: pickle")
+
+    pth = '{0}.pickle'.format(platform_name())
+
+    fh = open(os.path.join(output_dir, pth), 'wb')
+    pickle.dump(create_pickle_data(), fh, pickle.HIGHEST_PROTOCOL)
+    fh.close()
+
+    print("created pickle file: %s" % pth)
+
+
+def write_legacy_msgpack(output_dir):
+
+    version = pandas.__version__
+
+    print("This script generates a storage file for the current arch, system, and python version")
+    print("  pandas version: {0}".format(version))
+    print("  output dir    : {0}".format(output_dir))
+    print("  storage format: msgpack")
+
+    pth = '{0}.msgpack'.format(platform_name())
+    to_msgpack(os.path.join(output_dir, pth), create_msgpack_data())
+
+    print("created msgpack file: %s" % pth)
+
+
+def write_legacy_file():
+    # force our cwd to be the first searched
+    sys.path.insert(0, '.')
+
+    if len(sys.argv) != 3:
+        exit("Specify output directory and storage type: generate_legacy_storage_files.py <output_dir> <storage_type>")
+
+    output_dir = str(sys.argv[1])
+    storage_type = str(sys.argv[2])
+
+    if storage_type == 'pickle':
+        write_legacy_pickles(output_dir=output_dir)
+    elif storage_type == 'msgpack':
+        write_legacy_msgpack(output_dir=output_dir)
+    else:
+        exit("storage_type must be one of {'pickle', 'msgpack'}")
+
+
+if __name__ == '__main__':
+    write_legacy_file()
diff --git a/pandas/io/tests/test_packers.py b/pandas/io/tests/test_packers.py
index 9f1fd41e90413..33b7cc79083db 100644
--- a/pandas/io/tests/test_packers.py
+++ b/pandas/io/tests/test_packers.py
@@ -1,5 +1,6 @@
 import nose
 
+import os
 import datetime
 import numpy as np
 import sys
@@ -11,7 +12,7 @@
                     date_range, period_range, Index, SparseSeries, SparseDataFrame,
                     SparsePanel)
 import pandas.util.testing as tm
-from pandas.util.testing import ensure_clean
+from pandas.util.testing import ensure_clean, assert_index_equal
 from pandas.tests.test_series import assert_series_equal
 from pandas.tests.test_frame import assert_frame_equal
 from pandas.tests.test_panel import assert_panel_equal
@@ -39,6 +40,8 @@ def check_arbitrary(a, b):
         assert_frame_equal(a, b)
     elif isinstance(a, Series):
         assert_series_equal(a, b)
+    elif isinstance(a, Index):
+        assert_index_equal(a, b)
     else:
         assert(a == b)
 
@@ -396,6 +399,24 @@ def tests_datetimeindex_freq_issue(self):
         result = self.encode_decode(df)
         assert_frame_equal(result, df)
 
+    def test_dataframe_duplicate_column_names(self):
+
+        # GH 9618
+        expected_1 = DataFrame(columns=['a', 'a'])
+        expected_2 = DataFrame(columns=[1]*100)
+        expected_2.loc[0] = np.random.randn(100)
+        expected_3 = DataFrame(columns=[1, 1])
+        expected_3.loc[0] = ['abc', np.nan]
+
+        result_1 = self.encode_decode(expected_1)
+        result_2 = self.encode_decode(expected_2)
+        result_3 = self.encode_decode(expected_3)
+
+        assert_frame_equal(result_1, expected_1)
+        assert_frame_equal(result_2, expected_2)
+        assert_frame_equal(result_3, expected_3)
+
+
 class TestSparse(TestPackers):
 
     def _check_roundtrip(self, obj, comparator, **kwargs):
@@ -496,6 +517,58 @@ def test_compression_blosc(self):
             assert_frame_equal(self.frame[k], i_rec[k])
 
 
+class TestMsgpack():
+    """
+    How to add msgpack tests:
+
+    1. Install pandas version intended to output the msgpack.
+
+    2. Execute "generate_legacy_storage_files.py" to create the msgpack.
+    $ python generate_legacy_storage_files.py <output_dir> msgpack
+
+    3. Move the created pickle to "data/legacy_msgpack/<version>" directory.
+
+    NOTE: TestMsgpack can't be a subclass of tm.Testcase to use test generator.
+    http://stackoverflow.com/questions/6689537/nose-test-generators-inside-class
+    """
+    def setUp(self):
+        from pandas.io.tests.generate_legacy_storage_files import create_msgpack_data
+        self.data = create_msgpack_data()
+        self.path = u('__%s__.msgpack' % tm.rands(10))
+
+    def compare(self, vf):
+        data = read_msgpack(vf)
+        for typ, dv in data.items():
+            for dt, result in dv.items():
+                try:
+                    expected = self.data[typ][dt]
+                except KeyError:
+                    continue
+                check_arbitrary(result, expected)
+
+        return data
+
+    def read_msgpacks(self, version):
+
+        pth = tm.get_data_path('legacy_msgpack/{0}'.format(str(version)))
+        n = 0
+        for f in os.listdir(pth):
+            vf = os.path.join(pth, f)
+            self.compare(vf)
+            n += 1
+        assert n > 0, 'Msgpack files are not tested'
+
+    def test_msgpack(self):
+        msgpack_path = tm.get_data_path('legacy_msgpack')
+        n = 0
+        for v in os.listdir(msgpack_path):
+            pth = os.path.join(msgpack_path, v)
+            if os.path.isdir(pth):
+                yield self.read_msgpacks, v
+            n += 1
+        assert n > 0, 'Msgpack files are not tested'
+
+
 if __name__ == '__main__':
     import nose
     nose.runmodule(argv=[__file__, '-vvs', '-x', '--pdb', '--pdb-failure'],
diff --git a/pandas/io/tests/test_pickle.py b/pandas/io/tests/test_pickle.py
index d1396463f3b23..e691fac215002 100644
--- a/pandas/io/tests/test_pickle.py
+++ b/pandas/io/tests/test_pickle.py
@@ -24,8 +24,8 @@ class TestPickle():
 
     1. Install pandas version intended to output the pickle.
 
-    2. Execute "generate_legacy_pkcles.py" to create the pickle.
-    $ python generate_legacy_pickles.py <version> <output_dir>
+    2. Execute "generate_legacy_storage_files.py" to create the pickle.
+    $ python generate_legacy_storage_files.py <output_dir> pickle
 
     3. Move the created pickle to "data/legacy_pickle/<version>" directory.
 
@@ -35,8 +35,8 @@ class TestPickle():
     _multiprocess_can_split_ = True
 
     def setUp(self):
-        from pandas.io.tests.generate_legacy_pickles import create_data
-        self.data = create_data()
+        from pandas.io.tests.generate_legacy_storage_files import create_pickle_data
+        self.data = create_pickle_data()
         self.path = u('__%s__.pickle' % tm.rands(10))
 
     def compare_element(self, typ, result, expected):
diff --git a/setup.py b/setup.py
index f20b0ac0a5fb5..30c5d1052d9b3 100755
--- a/setup.py
+++ b/setup.py
@@ -537,6 +537,7 @@ def pxd(name):
                 ],
       package_data={'pandas.io': ['tests/data/legacy_hdf/*.h5',
                                   'tests/data/legacy_pickle/*/*.pickle',
+                                  'tests/data/legacy_msgpack/*/*.msgpack',
                                   'tests/data/*.csv*',
                                   'tests/data/*.dta',
                                   'tests/data/*.txt',