HOME

概要

本ウェブサイトは、JST AIP加速課題「超高速データサイエンス基盤」のポータルサイトです。

データを元に意思決定を下す「データサイエンス」は、過去10年、産学問わず最も注目されている領域であるといえます。そのデータサイエンスの計算処理を高速化することは、理論的にも実用上も極めて重要です。データサイエンスは機械学習をはじめデータマニング・自然言語処理・画像処理・データベースなど様々な分野を含む大きな概念ですが、それらに共通する基盤的な処理は、「探索」や「クラスタリング」といった基本的な数学的操作を様々なデータに適用することであるといえます。そのような基盤的な数学的操作を高速化することが出来れば、データサイエンス全体を加速させることが出来ます。そうすれば、誰しもが今以上に簡単に大量のデータを用いた処理が可能となります。

一方で、様々な高速化の技術は、現在各分野で独立に発展している現状があります。例えば、画像処理分野におけるベクトル探索の技術は、データベース分野におけるグラフに関する探索技術と独立に発展しています。両分野はデータ形式こそ違えど探索の高速化という同じ目標をもちますが、技術が交じり合うことは少ないといえます。現在、データサイエンス処理を高速化したい場合、ユーザは自分が対象とする問題に最適な方式やライブラリを自ら探す必要があります。

本研究課題では、データサイエンス基盤の超高速化を目指します。特に、過去に様々な分野で発展してきた高速化技術を整備統合し、様々なモダリティに適用可能な超高速な探索技術を構築します。これにより、対象のモダリティに関わらず、巨大なデータに対して極めて高速な探索を実現します。我々のチームは松井がベクトル量子化、天方がメトリック空間での探索、塩川がグラフ、西村が並列計算及びGPGPUコンピューティングを専門としており、全員がそれぞれの分野での高速化の専門家です。我々はお互いがお互いの専門領域を参照・補完しあいながら、各種高速なアルゴリズム・データ構造を創出し、データサイエンスを高速化します。

News

  • [2024.07.01] 西村らの論文がIROS2024に採録されました。
  • [2024.04.17] 塩川らの論文がIJCAI2024に採録されました。
  • [2024.03.12] 西村らの論文がCHI2024に採録されました。
  • [2024.02.11] 天方の論文がICDE2024に採録されました。
  • [2024.01.20] 天方の論文がAISTATS2024に採録されました。
  • [2023.09.22] 松井らの論文がNeurIPS2023に採録されました。
  • [2023.09.04] 松井らがSISAP 2023 Indexing Challengeにおいていくつかの部門で二位になりました。[結果] [レポート]
  • [2023.07.31] 松井が2023/8/30にYANS 2023にて高速探索に関するチュートリアルを行います。
  • [2023.07.31] 松井の論文がACM Multimedia 2023に採録されました。
  • [2023.07.05] 天方の論文がACM Transactions on Knowledge Discovery from Dataに採録されました。
  • [2023.05.19] オムロンサイニックエックスで スケーラブルな高速検索アルゴリズムに関する研究インターン を募集しています。
  • [2023.05.12] 天方の論文がSIGIR2023に採録されました。
  • [2023.05.08] 塩川の論文がIJCAI2023に採録されました。
  • [2023.05.07] 松井の共著論文がACL2023に採録されました。
  • [2023.04.27] 松井がCVPR2023にて高速探索に関するチュートリアルを開催します。
  • [2023.04.14] webサイトを公開しました

メンバー