HOME

概要

本ウェブサイトは、JST AIP加速課題「超高速データサイエンス基盤」のポータルサイトです。

データを元に意思決定を下す「データサイエンス」は、過去10年、産学問わず最も注目されている領域であるといえます。そのデータサイエンスの計算処理を高速化することは、理論的にも実用上も極めて重要です。データサイエンスは機械学習をはじめデータマニング・自然言語処理・画像処理・データベースなど様々な分野を含む大きな概念ですが、それらに共通する基盤的な処理は、「探索」や「クラスタリング」といった基本的な数学的操作を様々なデータに適用することであるといえます。そのような基盤的な数学的操作を高速化することが出来れば、データサイエンス全体を加速させることが出来ます。そうすれば、誰しもが今以上に簡単に大量のデータを用いた処理が可能となります。

一方で、様々な高速化の技術は、現在各分野で独立に発展している現状があります。例えば、画像処理分野におけるベクトル探索の技術は、データベース分野におけるグラフに関する探索技術と独立に発展しています。両分野はデータ形式こそ違えど探索の高速化という同じ目標をもちますが、技術が交じり合うことは少ないといえます。現在、データサイエンス処理を高速化したい場合、ユーザは自分が対象とする問題に最適な方式やライブラリを自ら探す必要があります。

本研究課題では、データサイエンス基盤の超高速化を目指します。特に、過去に様々な分野で発展してきた高速化技術を整備統合し、様々なモダリティに適用可能な超高速な探索技術を構築します。これにより、対象のモダリティに関わらず、巨大なデータに対して極めて高速な探索を実現します。我々のチームは松井がベクトル量子化、天方がメトリック空間での探索、塩川がグラフ、西村が並列計算及びGPGPUコンピューティングを専門としており、全員がそれぞれの分野での高速化の専門家です。我々はお互いがお互いの専門領域を参照・補完しあいながら、各種高速なアルゴリズム・データ構造を創出し、データサイエンスを高速化します。

News

メンバー