NTTとNTTデータ、日本企業初のApache Hadoopのコミッタ3名を輩出
初めに、基盤システム事業本部 システム方式技術事業部 OSSプロフェッショナルサービスの濱野賢一朗氏が、Hadoopプロジェクトの概要、同社のHadoopへの取り組み、コミッタ就任の経緯などについて説明した。
Hadoopは、Apacheソフトウェア・ファンデーションが運営するオープンソースプロジェクトの1つとして開発が進められている並列分散処理を実現するオープンソースソフトウェア。大規模データを効率的に格納・処理できることから、ビッグデータ活用を支える基盤として普及が進んでいる。
Hadoppのメンテナンスや開発はコミュニティで行われており、コミュニティが選出したコミットのみがプログラムを書き換える権限(コミット権)を持つ。現在、コミッタは約100名、コントリビュータは約3000名いるという。コミュニティはPMCという組織が運営を担っており、コントリビュータの選出も行うという。
HadoopプロジェクトはHadoop本体に加え、その利活用に有用な周辺ソフトウェアも開発が行われているが、今回、鰺坂氏と小沢氏はHadoop本体のコミッタに、岩崎氏はHTraceのコミッタに就任した。
NTTデータでは2008年からHadoopについて取り組みを開始し、2010年に「Hadoop構築・運用ソリューション」としてHadoopを使ったシステムインテグレーションやサービスの提供を開始した。
濱野氏は、同社がHadoopの開発に取り組んでいる経緯について、「Hadoopを実際に使っていると、さまざまな課題に直面する。それらを解決するにあたり、使っているからこそ得られる知見が生まれるので、それを伝えたかった。今では、事象の報告にとどまらず、先を見据えた開発に参加している」と語った。
Hadoopのコア機能の開発に加え、バグの改修や利用者向けのドキュメントなどに貢献しているという。具体的な活動としては、「YARNの高可用正機能に向けた活動」「Sqoop PostgreSQLコネクタの開発」「HTraceの開発」などが紹介された。Hadoopコミュニティへの貢献の度合いは「解決済みissueの数」や「貢献コードの行数」を指標に測ることができるが、2014年上半期において、同社はいずれも世界第4位につけているという。
鰺坂明氏は2011年入社で、「OfflineImage Viewerの拡張」「Hadoop 2のドキュメント整備」などに取り組んできた。
小沢健史氏は2010年入社で、YARNの「高可用化」「処理基盤間のインタフェースの整備と実装」「致命的なバグ修正」などに取り組んできた。岩崎正剛氏は2002年入社で、HTraceの「モジュール開発」「トレーシング機能をHDFSに追加」などに取り組んできた。
濱野氏は、今後の活動目標について、「オープンソースのデータベースソフトであるPostgre SQLやMySQLがそのまま使えるクオリティであるのに対し、現在のHadoopは手を入れないと使えないと言われている。今後、単体で利用できるクオリティのものを提供していきたい」と説明した。
提供元の記事
関連リンク
-
ハルカミライ、新たな自主ライブ『A CLASSIC CRATER 2012~2019』幕張メッセ9-10ホールで開催
-
息子を”暗い公園に放置”し危ない目にあわせた義母。だが、ガチ切れした嫁の【ある通告】に…「いやぁー!」義母絶叫
-
夫「ほぼ冷凍食品じゃん」妻「作っただけエラいじゃん!」文句ばかり言う夫…? 家事にも給料ほしいんですけど?と言った結果…
-
落合福嗣、父・博満氏&母・信子と「みんなでお蕎麦を食べに来ました!」 写真披露に「親孝行してますね」「夫婦仲良しでいい写真」
-
産後【39度の高熱】で苦しむ嫁を無視し…家に乱入する義母!?だが直後、夫の〈想定外の一言〉に義母が絶句…