@techreport{oai:jaxa.repo.nii.ac.jp:00001957, author = {村田, 健史 and 磯田, 総子 and 渡邉, 英伸 and 深沢, 圭一郎 and 山本, 和憲 and 建部, 修見 and 田中, 昌宏 and 木村, 映善 and Murata, Ken T. and Isoda, Fusako and Watanabe, Hidenobu and Fukazawa, Keiichiro and Yamamoto, Kazunori and Tatebe, Osamu and Tanaka, Masahiro and Kimura, Eizen}, month = {Mar}, note = {現在,欧米や日本において,科学研究向けクラウドとしてサイエンスクラウドが提案され,システムや利活用についての議論が進められている.サイエンスクラウドはビッグデータ時代のデータ指向型科学研究基盤として提案されている.クラウド上でのビッグデータ処理では,CPU の並列分散化だけではなくネットワークやI/O の並列分散が重要である.本研究ではクラウド環境で高い計算効率を得るための基礎研究として,CPU およびI/O を同時に分散処理するシステムを提案する.8 コアを有する6 台のクラスタ計算機で基礎実験を行った結果,ノード内のプロセス数が少ない場合はほぼ100%の並列化効率が達成され,100 台を超える大規模クラスタ環境でも高いスケーラビリティーが予測された.一方,ノード内で複数プロセスが処理を行う場合にはディスクアクセスの輻輳が発生し,必ずしも高いスケーラビリティーを得ることができない.8 コアを有する6 台の計算サーバで最も高い並列化効率を得たのは6 プロセス並列の場合であり,高速化率は20.6 であった.今後は,同ノード内のI/O 処理を分散化することで,並列化効率をさらに向上させることが期待される., Science cloud is a cloud system designed for scientific researches, and expected as a new infrastructure for big data sciences. Not only parallelization of CPU as in super-computers, but I/O and network throughput parallelization are crucial for the big data sciences. One of the typical structures of science cloud is a scalable cluster in which multiple clusters in a cloud are connected with high-speed network. In the present study, we examine performance of parallelization of both CPU and I/O in a cloud system as the first step to high performance scalable clusters. In case with few processes executed on each computational node (server), parallelization efficiency is almost 100%. This high efficiency is expected to maintain in larger-scale cluster systems such as those with 100 servers. On the condition of multi-processes on each node, the present parallelization does not show good performance due to the congestions of I/O. Parallelization efficiency (speed-up) is as low as 20.6%. New techniques of decentralization of I/O within each node are required in the next step., 形態: カラー図版あり, Physical characteristics: Original contains color illustrations, 資料番号: AA0062302007, レポート番号: JAXA-RR-13-010}, title = {NICTサイエンスクラウドによる大規模シミュレーションデータ分散可視化処理}, year = {2014} }