Apache Parquet、インキュベータから卒業してトップレベルプロジェクトに
Apache Parquetはオープンソースで開発が進められているカラム型データフォーマット。Apache Hadoopでの利用を想定して開発が進められており、次のようなさまざまなフレームワークやデータモデルと連携して動作することが想定されている。
プロセッシングフレームワーク(MapReduce、Apache Spark、Scalding、Cascading、Crunch、Kite)
データモデル(Apache Avro、Apache Thrift、Protocol Buffers、POJOs)
クエリエンジン(Apache Hive、Impala、HAWQ、Apache Drill、Apache Tajo、Apache Pig、Presto、Apache Spark SQL)
Apache ParquetはTwitterをはじめCloudera、NASA、Netflix、Stripeなどビッグデータを処理する必要がある多くのベンダで実用的に活用されている。今回、インキュベータから卒業してトップレベルプロジェクトになったことで、今後Apache Parquetの活用がさらに促進されると見られる。
提供元の記事
関連リンク
-
「金欠だから日焼け止め貸して☆」いつも人の物を借りては遠慮なく使う友人。ある日、服を褒めてきたかと思えば⇒「それ、私にタダでちょうだい?」図々しさがエスカレートして・・・
-
「えっと、実は2カ月前から付き合ってて…」と彼氏が紹介してきた彼女は私と丸かぶりだった!? 3年間裏切られた彼氏への反撃開始!
-
a flood of circle、初武道館翌日に古巣下北沢SHELTERで灼熱のワンマン敢行
-
「えー!3年も付き合ってるのにまだ結婚できないんだ?w」彼氏との関係性をバカにしてくる同僚…自分の方が先に結婚すると張り切り⇒「全然愛されてなくてかわいそうw」ついには見下した発言まで・・・
-
“いい人すぎて無理…”優しい男ほど落とせないってこういうこと?