2015/03/02 Version 1.0.0

はじめに

このサイトは、「IIJ GIOストレージ&アナリシスサービス(以下、本サービス)」で提供している解析オプションの開発者ガイドです。
本サービスの解析オプションは、ストレージに格納された解析対象データを指定された方法で解析し、
解析結果をストレージに出力するオプションサービスです。

機能のご紹介

解析機能、データベース・テーブル管理機能、クエリ管理機能の3つの機能の概要を説明します。

../_images/dag-analysis-option-introduction.png

解析機能

計算リソースであるクラスタを用いてストレージを入出力としたデータの解析機能を提供します。
解析はクエリの単位で実行します。
クエリには解析対象とするデータベースとテーブル、処理内容および出力先を指定します。

データベース・テーブル管理機能

ストレージに格納された解析対象データの場所などの定義情報を作成および削除する機能を提供します。
データベースには、解析対象データのバケット名を指定します。
また、テーブルには解析対象データの場所や形式(csvやjsonなど)、列の名前や型を指定します。

クエリ管理機能

クエリの情報取得とキャンセルの機能を提供します。
クエリを実行すると、そのクエリを識別するためのID(クエリID)が発行されます。
このクエリIDを用いてクエリの状態やクエリが解析対象とするデータベース・テーブルの情報を取得できます。
また、キャンセル機能ではクエリを中断する事が可能です。

解析オプションの構成要素

本サービスの解析オプションは、クラスタ、データベース、テーブル、クエリという4つの要素で構成されています。また、それぞれの要素はHTTPのリソースとしても表現されます。

クラスタ

クラスタは解析を行うための計算リソースで、1つ以上のインスタンスで構成されます。
1つの契約で最大5つまでクラスタを作成する事ができます。

Note

契約とは、本サービスのご契約を意味しています。
1つの契約は、IIJサービスオンラインから確認頂けますサービスコードの単位となります。

データベース

データベースは、解析機能を利用する際に指定する解析対象データの保管場所を保持します。
データベース名はストレージのバケットと対応します。

Note

データベース名には以下の制約があります。

  • 文字列の長さが3~63の範囲内である。
  • 小文字(a-z)、数字(0-9)で構成される。

ストレージの1つのバケット (= データベース) に格納可能なオブジェクトの数に制限はありませんが、バケットは1契約につき最大で100個まで作成することができます。

テーブル

テーブルは解析対象データの場所と形式、列の名前と型を保持します。
解析機能を使ってクエリを投入する際に、データベース名とテーブル名を使って解析対象データを指定します。

Note

解析オプションのデータベース・テーブルは、
一般的なデータベース・テーブルとは異なり、解析対象データの定義情報のみを保持します。

クエリ

クエリは、クラスタに対して解析を指示するための要求の最小単位です。
実行するクラスタの名前や解析対象のデータベースとテーブル、出力先、処理内容を保持します。
クエリは投入時に発行されるクエリIDによって識別されます。
クエリIDを用いて問合せをおこなう事で、そのクエリの状態を取得する事ができます。

詳細情報

各構成要素の詳細は以下をご覧ください。

ページ先頭へ