PR
NTTデータ、OSSの分散処理基盤Hadoopの構築・運用ソリューションを提供開始
NTTデータは、同社のクラウドサービス「BizXaaS」(ビズエクサース)の「クラウド構築サービス」のラインナップとして、「Hadoop構築・運用ソリューション」の提供を2010年7月1日より開始した。オープンソース(OSS)の分散処理基盤ソフトウェアであるHadoopを活用し、大規模データを保有する顧客に対して、新しいビジネス機会を生み出すためのコンサルティング、システム構築、運用まで幅広く対応する。
Hadoopは、大規模データを多数のサーバーに分散して蓄積するとともに、大量・複雑な計算を並列処理させることで、データを高速に処理できるという、OSSの分散処理基盤ソフトウェア。広く一般に利用されているPCサーバーを活用し、その利用台数に応じて扱えるデータの規模や処理能力を拡張する利便性の高い分散処理システムを構成できる。従来、複数サーバーで1つの処理を行う場合、処理の分散や結果の集約、分散処理の信頼性確保などについて、アプリケーションごとに個別の設計が必要だったが、Hadoopでは、アプリケーション開発者はMapReduceと呼ばれる分散処理フレームワークを用いて個々の分散制御を意識することなく、処理の分散化が可能になる。
NTTデータでは、これまでに数十台~千台のサーバーで構成したHadoopシステムを顧客に提供してきたとのことで、今回、これまでに培ったHadoopの構築・運用に関する技術力をもとに、BizXaaSの「クラウド構築サービス」のラインナップのひとつとして「Hadoop構築・運用ソリューション」を提供する。同ソリューションによってスケーラビリティを追求したクラウド環境を提供することで、プライベートクラウドの活用シーンの拡大を目指す。
発表による同ソリューションの特徴は以下のとおり。
1. 高いスケーラビリティを持つ分散処理基盤
HadoopとPCサーバーを活用することにより、従来より比較的低いコストで分散処理システムを導入できる。サーバー台数を増やすことで性能向上に対応でき、需要に応じた設備拡張が可能。Hadoopが持つ耐障害性の仕組みに加え、NTTデータが開発した冗長化機構を組み合わせ、業務システムや社会基盤として求められる信頼性を実現可能にする。
2. 準定型データの分析やアドホックな分析
従来のRDBMSで扱ってきた定型データだけでなく、個々にフォーマットが変動するような準定型のデータも格納・処理することが可能。各種データソースから集まってくる多様なログデータをそのまま格納しておき、処理する際にデータの意味づけを行うような処理や、ワンタイムでマーケティング分析を行うようなアドホックな処理にも対応できる。
3. 運用コストを低減する仕組み
数十台~千台規模の大量のサーバーを持つシステムではサーバーの運用コストが増大しがちだが、同ソリューションでは、サーバー台数が増加した場合でも、ハードウエア故障時の復旧手順などを自動化するなど、人手のかかる作業や判断を減らし運用コストの増大を抑える仕組みを可能にする。
4. 周辺プロダクトとの連携対応、サポート
Hadoopが持つ分散ファイルシステムHDFS(Hadoop Distributed File System)や分散処理フレームワークHadoop MapReduceに加え、連携して動作するHBase、Hive、Pig、Mahout、Avro、Sqoopなどの周辺プロダクトにも対応。また、Hadoopを動作させるために必要なLinuxやJDK(Java Development Kit)などのミドルウェアも含めたソフトウェアサポートサービスも提供する。




