株式会社Unyte

https://www.unyte.co.jp

東京都

RAG開発でB+木を学び直した話 ― AI時代に効く基礎の判断【Unyte テックブログ】

Unyte 広報, 渋谷拓海 and 1 others

CTO

Unyte 広報

株式会社Unyte /

渋谷拓海

株式会社Unyte / CTO

平野瑠登

株式会社Unyte / テックリード

on 2026-05-08

1. はじめに：なぜ B+木を学び直したのか
2. B+木が解く問題
2.1 ディスク I/O というボトルネック
2.2 二分探索木では足りない理由
3. B+木の定義と構造
3.1 葉ノードの性質
3.2 内部ノードの性質
3.3 平衡性
4. 検索アルゴリズム
4.1 単一キー検索
4.2 範囲検索
4.3 計算量
5. 挿入アルゴリズム
5.1 葉ノードへの挿入
5.2 ノードの分割
5.3 親への伝播
5.4 ルートの分割と木の成長
5.5 具体例
6. 削除アルゴリズム
6.1 葉ノードからの削除
6.2 再分配
6.3 併合
6.4 親への伝播
6.5 根ノードの縮約
6.6 具体例
7. 勉強会でのディスカッション
8. まとめ
9. おわりに

1. はじめに：なぜ B+木を学び直したのか

Unyte でエンジニアをしている平野です。社内データを AI でどう活用するかに取り組んでいます。Unyteでは、毎週技術勉強会を開催しており、今回はグラフ理論とB+木がテーマでした。本記事はそのうちB+木に絞ってまとめたものです。

勉強会にこのテーマを選択した理由としては、まずグラフというコンピュータ分野でよく出てくるデータ構造についてイメージしやすくなってもらうことで、自社プロダクトにグラフDBを使用すべきかどうか等の技術選定がしやすくなり、またB+木について詳しく理解することでパフォーマンスチューニングに役立つのではないかと考えたためです。

リレーショナルデータベースを日常的に使うエンジニアであれば、CREATE INDEX を書いた経験は誰しもあるはずです。しかしそのインデックスの内部で何が起きているかは、意外とわかっていない人が多いと思います。多くの主要なデータベース（MySQL、PostgreSQL、SQLite、Oracle など）がインデックスの実装に B+木を採用しているので、ここを押さえると、適切なインデックス設計・クエリチューニング・パフォーマンス問題の根本原因分析に直結します。

実際、僕も最近、自社で開発している RAG で、ある重要なクエリのレスポンスが想定より遅いという問題に当たりました。最終的には GIN という B+木とは別系統のインデックスを使って解決したのですが、振り返ってみると、B+木の仕組みをちゃんと押さえていれば、「B+木でも対応できるのか、それとも GIN のような別系統が要るのか」を最初から比較して選べたな、と感じています。

AI に実装を聞けば一瞬で答えが出てくる時代ですが、複数の選択肢を比較して根拠を持って選ぶ判断の部分は、結局自分の中にデータ構造のイメージがないと回らない。現状では、AIが毎回完璧な実装を行うとは限りません。それが原因でレビューの負荷が高くなっているとよく言われています。そのような時代だからこそ、こういう基礎の判断が大事だな、と改めて実感しました。

本記事では、B+木の定義から始め、検索・挿入・削除の各アルゴリズムを図解とともに解説します。前提知識としては、二分探索木と計算量（O 記法）の基本を理解していれば十分です。

2. B+木が解く問題

2.1 ディスク I/O というボトルネック

データベースが扱うデータはメモリに収まらないことが多く、ディスク（あるいは SSD）といった二次記憶装置に格納されます。ディスクアクセスはメモリアクセスに比べて桁違いに遅いため、データ構造の評価軸は「比較回数」ではなく「I/O 回数」になります。

ディスクは通常、ページと呼ばれる単位で読み書きされます。したがって、目的のデータに到達するまでに何ページ読む必要があるか、が支配的なコストになります。

2.2 二分探索木では足りない理由

データベースのインデックスは、データベースの内容に更新が生じるとそれに伴い動的に更新しなければなりません。インデックスのデータ構造に二分探索木を使用すると、例えば新しいデータを追加するときに、現在の葉ノードから下向きに新たなノードを追加することになります。しかし、このような方法で更新に対処していると木構造のバランスが悪くなり、探索キーによってページアクセスにばらつきが出てしまいます。この問題を解決するためにB+木が考案されました。

3. B+木の定義と構造

B+木は、データを実際に保持する 葉ノード と、葉への経路を提供する 内部ノード(中間ノードとも呼ぶ)からなる多分木です。また、木の頂点を 根ノード と呼びます。

1 ノードに格納できるキーの最大数を次数 n と呼びます。次数はディスクのページサイズとキーサイズから決まる定数で、実用的には数百のオーダーになります。

3.1 葉ノードの性質

葉ノードはインデックスの実体を担い、次の性質を持ちます。

各エントリは インデックスキー と、対応するレコードを指す ポインタ(タプル ID やページ ID など)の組である
エントリはキーの昇順にソートされて格納される
隣接する葉ノード同士は連結リストでつながれており、範囲検索を効率化する
各葉ノードは、容量の半分以上が常に埋まっている(最低充填率の保証)

3.2 内部ノードの性質

内部ノードは、目的の葉ノードへルーティングする役割を持ちます。

各ノードは、キーと子ポインタを交互に格納する。k 個のキーを持つ内部ノードは k+1 個の子ポインタを持つ
キー Ki は境界として働き、i 番目の子ポインタの先にある部分木には Ki 未満のキーのみ、(i+1) 番目の子ポインタの先にある部分木には Ki 以上のキーのみが含まれる
ルート以外の内部ノードは、葉ノードと同様に容量の半分以上が埋まっている
根ノードのみ例外で、最低 1 個のキーがあれば成立する

3.3 平衡性

B+木の最も重要な性質は、ルートからすべての葉までの距離(高さ)が等しい ことです。

この不変条件のおかげで、任意のキーへの検索コストが木の高さ h で抑えられ、h=O(logn N) となります(N は格納エントリ数、n は次数)。後述する挿入・削除アルゴリズムは、いずれもこの不変条件を維持するように設計されています。

4. 検索アルゴリズム

4.1 単一キー検索

ルートから始めて、各内部ノードでキーを比較し、適切な子ポインタをたどります。葉ノードに到達したら、目的のキーを二分探索で探します。

木の高さを h とすると、ページ読み込みは h 回程度で済みます。実用的な次数（数百）では、数十億件のデータでも h は 3〜4 程度に収まります。

4.2 範囲検索

範囲検索は次の手順で行います。

範囲の下限キーを通常の検索で見つけ、対応する葉ノードに到達する
その位置から葉ノードを兄弟ポインタでたどりながら、上限キーを超えるまでデータを返す

内部ノードを再訪する必要がない点が、B木に対する B+木の明確な優位点です。

4.3 計算量

検索：O(logn N)
範囲検索：O(logn N+k)、ここで k は返されるレコード数

5. 挿入アルゴリズム

B+木における挿入に対処する考え方を直感的に説明すると、木を下に成長させるのではなく、木構造自体を変更し、必要に応じて木を上に成長させるということになります。

5.1 葉ノードへの挿入

検索と同じ手順で、挿入先の葉ノードを特定します。葉ノードに空きがあればキーをソート順に挿入して終了です。

5.2 ノードの分割

葉ノードのキー数が上限を超えた場合、ノード分割を行います。

挿入するキーと、その葉ノードにすでに存在するキーを合わせた全キーを小さい前半分と大きい後半分の2 つに分ける
新しい葉ノードを作成し、後半のキーを移す
兄弟ポインタを張り直す
新しい葉ノードの最小キーを、親のノードに昇格させる

5.3 親への伝播

昇格したキーを受け取った親ノードも、結果としてキー数が上限を超える可能性があります。その場合、親ノードも同じ要領で分割し、さらに上の親へキーを昇格させます。

これは再帰的に、必要に応じてルートまで伝播します。

5.4 ルートの分割と木の成長

根ノードが分割された場合、新しいルートが作られ、元のルートと分割で生まれた新ノードがその子になります。B+木が高さを増やすのは、このタイミングだけです。

すべての葉が同じ深さに保たれるという不変条件は、この「ルートからしか伸びない」性質によって自然に維持されます。

5.5 具体例

図1のB+木に、索引キーが700のデータを挿入する例を考えます。

まず、挿入すべき葉ノードは左から3つめの葉ノードであることが分かります。葉ノードに空きがないので、ステップ2に進みます。
500, 700が前半のキーなので、500, 700は既存の葉ノードにそのまま格納します。後半分である800を格納するための新たな葉ノードを作成します。そして新しい葉ノードの最小キーである800を親のノードに昇格させます。
親のノードにも空きが無いので同様に分割を行います。最終的に図2のようになります。

6. 削除アルゴリズム

削除は挿入の逆で、「葉から削除 → 必要なら再分配・併合を上に伝播」という流れです。挿入より場合分けが多く、実装上のバグが生まれやすい部分でもあります。

6.1 葉ノードからの削除

検索で対象の葉ノードを特定し、キーを削除します。削除後も対象の葉ノードの収容スペースの半分以上が使われていればそれで終了です。

6.2 再分配

削除後にキー数が下限を下回った場合、まず再分配を試みます。

隣接する左の兄弟ノード（左に兄弟ノードがなければ右の兄弟ノード）に余裕があれば、そこから 1 つキーを借りてきます。借りたキーを反映するため、親ノードのキーも更新します。

6.3 併合

兄弟ノードにも余裕がない場合、ノード併合を行います。

自ノードと兄弟ノードを 1 つにまとめる
兄弟ポインタを張り直す
親ノードから、両者を分けていたキーを削除する

6.4 親への伝播

親ノードからキーが削除された結果、親もまた下限を割る可能性があります。その場合は親に対しても同じく再分配または併合を行い、必要に応じて根ノードまで伝播させます。

6.5 根ノードの縮約

伝播の結果根ノードに到達し、根ノードの探索キーが0個の場合は、根ノードを削除して終了します。

6.6 具体例

今回も図1のB+木で考えてみましょう。まず、800を削除します。800が格納されていた葉ノードはまだ半分以上使用されているので、6.1に従い終了します。

つづけて500を削除します。そうすると左から3番目のノードが使用されなくなったので、まず再分配を試みます。左の兄弟ノードはキーを借りると半分以上使用されなくなってしまう(=余裕がない)ので、次に併合を試みます。

自ノードと兄弟ノードを1つにまとめます。今回の場合自ノードは空、兄弟ノードは300が格納されるので、まとめて、[300]というひとつのノードになります。
兄弟ポインタを張り直します。500が格納されていたノードが削除されるので、300が格納されているノードから、[1000, 1500]が格納されているノードにリンクを張ります。
親ノードから、両者を分けていたキーを削除します。ここでいう両者とは削除対象の500と、兄弟ノードに格納されていた300なので、これらを区別していた500を削除します。

親ノードは500を削除してもまだ半分以上使われている(300が残っている)のでここで終了します。この時点でB+木は図3のようになります。

さらにここから200、300を削除することを考えます。200を削除したとき、左端の葉ノードには100がのこっているのでそこで終了します。つづけて300を削除すると、左から二番目の葉ノードは使用されてなくなるので、左の兄弟ノードとの併合を試みます。その結果先程と同様に、葉ノードは[100]のみの一つの葉ノードにまとめられ、100, 300を区別していた親ノードの探索キーである300が削除されます。そうすると左端の内部ノードが使われなくなるので、ここでも兄弟ノードが一つにまとまり、親ノード(根ノード)の探索キーが削除されます。最終的に根ノードが削除され、図4のようになります。

以上のようなアルゴリズムを使用することで、B+木の定義の一部である

全ての中間ノードは常に半分以上の領域が使用されている
根ノードから葉ノードまでの距離が常に一定

を厳密に守ることができ、結果として効率よく探索が行えることになります。

7. 勉強会でのディスカッション

勉強会では、本文で扱った内容のほかに、こんなトピックも話題に上がりました。

複合インデックスはどのようなデータ構造になっているのか
プロダクト開発時、インデックスがうまく効かず遅くなっていたクエリを確認してみて原因を考える
中間ノードに、葉ノードにない探索キーが残るケースがありうるが、それは問題ないのか
インデックスを張りすぎると、その分メモリを消費することになるがそれは実用上問題ないのか

参加したメンバーからは「直接探索が早いのは理解していたけど、範囲検索も早くなる理由があまりわかっていなかったので勉強になった」「挿入・削除処理を行っても木の高さが保たれ、探索回数が一定になるのは知らなかった」といった声がありました。

そこから自然に、冒頭で触れたグラフDBをいつ使うべきか、という話にも流れていきました。

グラフDBを活用した実サービスにはどのようなものがあるのか?
グラフDBにおけるエッジは、RDBにおける外部参照として表現できるのでは?
最近よく耳にする GraphRAG は、本当に精度が高いのか?

このあたりは、その場では決着がつかないまま「次回はちゃんと調べよう」というテーマとして残りました。新しい知見を得た上に、次に調べたいテーマまで議論の中で現れた、とても有意義な勉強会になったと思います。

8. まとめ

ここまで B+木の構造、検索、挿入、削除のアルゴリズムを追ってきました。最後に押さえておきたい性質をまとめると:

内部ノードはルーティング、葉ノードがデータを保持する
葉ノードを連結リストでつなぐことで範囲検索を効率化する
挿入では分割が、削除では再分配と併合が、ノードの均衡を保つ
結果として、検索・挿入・削除・範囲スキャンのすべてが対数時間で実現できる

インデックスが思うように効かない、というのはパフォーマンスの課題で非常によくあるケースだと思います。冒頭で触れたように、選択肢には B+木のほかにも GIN のような別系統があって、どれを選ぶかは結局それぞれの内部構造を理解しているかにかかってきます。AI に実装は聞ける時代になったぶん、こういう「選択肢を比較して根拠を持って選ぶ判断」の重みはむしろ増している気がしていて、その出発点として、B+木の知識は長く使えるはずです。

9. おわりに

Unyte ではいま AI プロダクト開発のエンジニアを募集中 です。AI 周りのデータ基盤や検索を、流行りに流されずデータ構造のレベルまで降りて考えるのが好きな人と一緒に働いてみたいと思っています。興味があればぜひ以下からカジュアル面談を申し込んでください。

AI領域プロダクトマネージャー

経験者歓迎｜AI領域｜上流設計から実装まで牽引する、PM募集！

▍当社について￣￣￣￣￣￣￣￣￣￣￣￣￣￣ UnyteはAI×Web3領域で「AIで、見えない価値を証明する」ことを目指すスタートアップです。日々の「見えない貢献」（助言・レビュー・知見共有のような「いいこと」）をAIで拾い上げてスコア化し、ブロックチェーンで改ざん不能な形で証明できる仕組みを提供しています。現在は企業向けに、 Slack・Discord・Teamsの会話データからハルシネーションを最小限に抑制したRAG基盤の構築や、Google Workspace・Notionなどのデータから組織の文脈を汲み取った業務効率化エージェント、プロジェクトリスク検出AIの提供を行っています。これらを基に、組織に最適化された評価指標をAIが自動的に生成する仕組みをつくり、日常的に使われているツール群から「貢献データ」を横断的に収集分析し、メンバー一人ひとりの貢献を評価者のバイアスなく可視化することにより、「いい人がいい思いをする」組織づくりへと繋がる貢献証明システムの構築に取り組んでいます。日常的に新しい事業テーマや最先端技術に触れられる「成長の密度が高い」環境が整っています。 ▍プロダクトについて￣￣￣￣￣￣￣￣￣￣￣￣￣￣ Unyteは、組織内のあらゆる情報ソースを統合し、プロジェクトの実行に必要なすべてのことをAI活用可能なコンテキストとして構造化する基盤「プロジェクトモデル」と、その上で動く組織特化のAIプロダクト群を開発しています。データ基盤の構築からAIプロダクトの提供まで一気通貫で担うことで、あらゆる企業が既存のアセットを活用してそれぞれの組織に合わせたAI活用をすぐに始められるサービスです。プロジェクトの進捗、メンバーの貢献、業務の実態、これらの情報はSlack・GitHub・カレンダー・会議録・ドキュメントに散在していて、統合された全体像は人間の脳内にしかありませんでした。従来の技術では、フォーマットも粒度も異なるデータの横断的な統合は現実的ではありません。しかし、LLMの登場により、非構造データも含めた網羅的な情報統合が可能になりつつあります。さらにこのプロジェクトモデルが不完全でファジーな状態であってもAIが文脈を読み取り、実用的な価値を引き出すシステムを構築しています。この基盤の上に、以下のプロダクト群を展開しています： ◾️ チャットRAG基盤 Slack・Discord・Teamsの会話データを取り込み、組織内で最も生に近い情報を検索・活用可能にする。プロジェクトモデルの構築とファジーなデータ活用の双方を支えるコアサービス ◾️ 業務効率化エージェント Google Workspace上で動くAIツール群。組織固有のナレッジをRAG基盤で検索可能にし、汎用AIでは不可能な「自社の文脈を踏まえた」業務自動化を実現 ◾️ プロジェクトリスク検出AI Git・チャット・カレンダー・会議録・ドキュメント等あらゆるソースを横断分析し、ルールベースとLLMのハイブリッドで検出。見積もりの楽観性、指示の曖昧さ、進捗と実態の乖離を定量的に捉える ◾️ 貢献可視化・人事評価チャットや活動ログからメンバーの貢献度をスコア化。ブロックチェーンで改ざん不能な証明として記録し、組織を超えて持ち運べる実績データへ ▍募集背景￣￣￣￣￣￣￣￣￣￣￣￣￣￣ Unyteはこれまで、大手企業へのシステム開発を通じて、組織の課題解決に伴走してきました。RAG基盤の構築、業務効率化エージェント、プロジェクトリスク検出AIなど、実際の現場で使われるプロダクトを届け続けるなかで、「Unyteと一緒に進めたい」という声とともに、開発依頼の引き合いが着実に増えています。その過程で蓄積してきた組織データとノウハウは、自社プロダクトの社会実装を加速させる確かな土台にもなっています。受託と自社開発が互いを強化し合うフェーズに、Unyteはいま差し掛かっています。この成長を前に進めるために、私たちには専任のAIプロジェクトマネージャーを募集します。複数のプロジェクトを横断しながら、クライアントと「何を作るべきか」を最上流から議論し、エンジニアと共に形にするポジションを担ってほしいと考えています。決まった仕様を管理する役割ではなく、事業の可能性を一緒に広げていただける方にお会いしたいと思っています。

株式会社Unyte

AIアーキテクト

AIの力を現場で最大限活用するFDE/フォワードデプロイドエンジニア募集！

▍当社について￣￣￣￣￣￣￣￣￣￣￣￣￣￣ UnyteはAI×Web3領域で「AIで、見えない価値を証明する」ことを目指すスタートアップです。日々の「見えない貢献」（助言・レビュー・知見共有のような「いいこと」）をAIで拾い上げてスコア化し、ブロックチェーンで改ざん不能な形で証明できる仕組みを提供しています。現在は企業向けに、 Slack・Discord・Teamsの会話データからハルシネーションを最小限に抑制したRAG基盤の構築や、Google Workspace・Notionなどのデータから組織の文脈を汲み取った業務効率化エージェント、プロジェクトリスク検出AIの提供を行っています。これらを基に、組織に最適化された評価指標をAIが自動的に生成する仕組みをつくり、日常的に使われているツール群から「貢献データ」を横断的に収集分析し、メンバー一人ひとりの貢献を評価者のバイアスなく可視化することにより、「いい人がいい思いをする」組織づくりへと繋がる貢献証明システムの構築に取り組んでいます。日常的に新しい事業テーマや最先端技術に触れられる「成長の密度が高い」環境が整っています。 ▍プロダクトについて￣￣￣￣￣￣￣￣￣￣￣￣￣￣ Unyteは、組織内のあらゆる情報ソースを統合し、プロジェクトの実行に必要なすべてのことをAI活用可能なコンテキストとして構造化する基盤「プロジェクトモデル」と、その上で動く組織特化のAIプロダクト群を開発しています。データ基盤の構築からAIプロダクトの提供まで一気通貫で担うことで、あらゆる企業が既存のアセットを活用してそれぞれの組織に合わせたAI活用をすぐに始められるサービスです。プロジェクトの進捗、メンバーの貢献、業務の実態、これらの情報はSlack・GitHub・カレンダー・会議録・ドキュメントに散在していて、統合された全体像は人間の脳内にしかありませんでした。従来の技術では、フォーマットも粒度も異なるデータの横断的な統合は現実的ではありません。しかし、LLMの登場により、非構造データも含めた網羅的な情報統合が可能になりつつあります。さらにこのプロジェクトモデルが不完全でファジーな状態であってもAIが文脈を読み取り、実用的な価値を引き出すシステムを構築しています。この基盤の上に、以下のプロダクト群を展開しています： ◾️ チャットRAG基盤 Slack・Discord・Teamsの会話データを取り込み、組織内で最も生に近い情報を検索・活用可能にする。プロジェクトモデルの構築とファジーなデータ活用の双方を支えるコアサービス ◾️ 業務効率化エージェント Google Workspace上で動くAIツール群。組織固有のナレッジをRAG基盤で検索可能にし、汎用AIでは不可能な「自社の文脈を踏まえた」業務自動化を実現 ◾️ プロジェクトリスク検出AI Git・チャット・カレンダー・会議録・ドキュメント等あらゆるソースを横断分析し、ルールベースとLLMのハイブリッドで検出。見積もりの楽観性、指示の曖昧さ、進捗と実態の乖離を定量的に捉える ◾️ 貢献可視化・人事評価チャットや活動ログからメンバーの貢献度をスコア化。ブロックチェーンで改ざん不能な証明として記録し、組織を超えて持ち運べる実績データへ ▍募集背景￣￣￣￣￣￣￣￣￣￣￣￣￣￣ Unyteはこれまで、大手企業へのシステム開発を通じて、組織の課題解決に伴走してきました。RAG基盤の構築、業務効率化エージェント、プロジェクトリスク検出AIなど、実際の現場で使われるプロダクトを届け続けるなかで、「Unyteと一緒に進めたい」という声とともに、開発依頼の引き合いが着実に増えています。その過程で蓄積してきた組織データとノウハウは、自社プロダクトの社会実装を加速させる確かな土台にもなっています。受託と自社開発が互いを強化し合うフェーズに、Unyteはいま差し掛かっています。増える案件に対して技術品質を落とさず応えるためには、クライアントの課題定義から設計・実装・運用までを一貫して担える専任者が不可欠な状況です。現在はエンジニアがその役割を兼務しながら対応していますが、AIソリューション設計の専門性を日本版FDE（フォワードデプロイドエンジニア）ともいえるこのポジションに集約することで、提案の質とプロジェクトの完遂力をさらに高めたいと考えています。決まったアーキテクチャを管理する役割ではなく、技術の可能性を事業の言葉に変換しながら、Unyteのプロダクトとお客様の事業を同時に前進させていただける方にお会いしたいと思っています。

株式会社Unyte

アカウントエグゼクティブ

AIに興味のあるセールス＆事業開発メンバー募集！SaaS営業経験歓迎

▍当社について￣￣￣￣￣￣￣￣￣￣￣￣￣￣ UnyteはAI×Web3領域で「「いい人」が「いい思い」をできる、信用のインフラを作る」ことを目指すスタートアップです。日々の「見えない貢献」（助言・レビュー・知見共有のような「いいこと」）をAIで拾い上げてスコア化し、ブロックチェーンで改ざん不能な形で証明できる仕組みを提供しています。現在は企業向けに、 Slack・Discord・Teamsの会話データからハルシネーションを最小限に抑制したRAG基盤の構築や、Google Workspace・Notionなどのデータから組織の文脈を汲み取った業務効率化エージェント、プロジェクトリスク検出AIの提供を行っています。これらを基に、組織に最適化された評価指標をAIが自動的に生成する仕組みをつくり、日常的に使われているツール群から「貢献データ」を横断的に収集分析し、メンバー一人ひとりの貢献を評価者のバイアスなく可視化することにより、「いい人がいい思いをする」組織づくりへと繋がる貢献証明システムの構築に取り組んでいます。日常的に新しい事業テーマや最先端技術に触れられる「成長の密度が高い」環境が整っています。 ▍プロダクトについて￣￣￣￣￣￣￣￣￣￣￣￣￣￣ Unyteは、組織内のあらゆる情報ソースを統合し、プロジェクトの実行に必要なすべてのことをAI活用可能なコンテキストとして構造化する基盤「プロジェクトモデル」と、その上で動く組織特化のAIプロダクト群を開発しています。データ基盤の構築からAIプロダクトの提供まで一気通貫で担うことで、あらゆる企業が既存のアセットを活用してそれぞれの組織に合わせたAI活用をすぐに始められるサービスです。プロジェクトの進捗、メンバーの貢献、業務の実態、これらの情報はSlack・GitHub・カレンダー・会議録・ドキュメントに散在していて、統合された全体像は人間の脳内にしかありませんでした。従来の技術では、フォーマットも粒度も異なるデータの横断的な統合は現実的ではありません。しかし、LLMの登場により、非構造データも含めた網羅的な情報統合が可能になりつつあります。さらにこのプロジェクトモデルが不完全でファジーな状態であってもAIが文脈を読み取り、実用的な価値を引き出すシステムを構築しています。この基盤の上に、以下のプロダクト群を展開しています： ◾️ チャットRAG基盤 Slack・Discord・Teamsの会話データを取り込み、組織内で最も生に近い情報を検索・活用可能にする。プロジェクトモデルの構築とファジーなデータ活用の双方を支えるコアサービス ◾️ 業務効率化エージェント Google Workspace上で動くAIツール群。組織固有のナレッジをRAG基盤で検索可能にし、汎用AIでは不可能な「自社の文脈を踏まえた」業務自動化を実現 ◾️ プロジェクトリスク検出AI Git・チャット・カレンダー・会議録・ドキュメント等あらゆるソースを横断分析し、ルールベースとLLMのハイブリッドで検出。見積もりの楽観性、指示の曖昧さ、進捗と実態の乖離を定量的に捉える ◾️ 貢献可視化・人事評価チャットや活動ログからメンバーの貢献度をスコア化。ブロックチェーンで改ざん不能な証明として記録し、組織を超えて持ち運べる実績データへ ▍募集背景￣￣￣￣￣￣￣￣￣￣￣￣￣￣ Unyteはこれまで、大手企業へのシステム開発を通じて、組織の課題解決に伴走してきました。RAG基盤の構築、業務効率化エージェント、プロジェクトリスク検出AIなど、実際の現場で使われるプロダクトを届け続けるなかで、「Unyteと一緒に進めたい」という声とともに、開発依頼の引き合いが着実に増えています。その過程で蓄積してきた組織データとノウハウは、自社プロダクトの社会実装を加速させる確かな土台にもなっています。受託と自社開発が互いを強化し合うフェーズに、Unyteはいま差し掛かっています。 2025年11月に電算システムHD（東証プライム）グループの一員となり、信頼基盤もさらに厚みを増しました。引き合いの増加に対してスピードを落とさず応えながら、アカウントエグゼクティブとしてエンタープライズ企業との関係を開拓・深耕する専任メンバーを、今まさに必要としています。プロダクトを売り込む役割ではなく、お客様が言語化できていない経営課題の輪郭を整理し、Unyteとして何ができるかを一緒に設計するパートナーとして動いてほしいと考えています。決まった答えを持ち込むのではなく、お客様と共に答えを見つけることに手応えを感じられる方とお会いしたいです。

株式会社Unyte

マーケティング

AI活用の自社プロダクト×受託開発で成長中。マーケティングの主導者を募集！

▍当社について￣￣￣￣￣￣￣￣￣￣￣￣￣￣ UnyteはAI×Web3領域で「「いい人」が「いい思い」をできる、信用のインフラを作る」ことを目指すスタートアップです。現在は企業向けに、様々なツールの会話データからハルシネーションを最小限に抑制したRAG基盤の構築や、社内ナレッジなどのデータから組織の文脈を汲み取った業務効率化エージェント、プロジェクトリスク検出AIの提供を行っています。これらを基に、組織に最適化された評価指標をAIが自動的に生成する仕組みをつくり、日常的に使われているツール群から「貢献データ」を横断的に収集分析し、メンバー一人ひとりの貢献を評価者のバイアスなく可視化することにより、「いい人がいい思いをする」組織づくりへと繋がる貢献証明システムの構築に取り組んでいます。日常的に新しい事業テーマや最先端技術に触れられる「成長の密度が高い」環境が整っています。 ▍プロダクトについて￣￣￣￣￣￣￣￣￣￣￣￣￣￣組織内のあらゆる情報ソースを統合し、プロジェクトの実行に必要なすべてのことをAI活用可能なコンテキストとして構造化する基盤「プロジェクトモデル」と、その上で動く組織特化のAIプロダクト群を開発しています。さらにこのプロジェクトモデルが不完全でファジーな状態であってもAIが文脈を読み取り、実用的な価値を引き出すシステムを構築しています。この基盤の上に、以下のプロダクト群を展開しています： ◾️ チャットRAG基盤 Slack・Discord・Teamsの会話データを取り込み、生に近い情報を検索・活用 ◾️ 業務効率化エージェント Google Workspace上で動くAIツール群 ◾️ プロジェクトリスク検出AI Git・チャット・カレンダー・会議録・ドキュメント等あらゆるソースを横断分析し、ルールベースとLLMのハイブリッドで検出 ◾️ 貢献可視化・人事評価チャットや活動ログからメンバーの貢献度をスコア化

株式会社Unyte

株式会社Unyte's job postings

経験者歓迎｜AI領域｜上流設計から実装まで牽引する、PM募集！

渋谷拓海さんを指名できます

話を聞きに行きたい

RAG開発でB+木を学び直した話 ― AI時代に効く基礎の判断【Unyte テックブログ】

Unyte 広報

株式会社Unyte /

開発秘話エンジニアアルゴリズムデータベースデータ構造

株式会社Unyte

UnyteはAIとブロックチェーンを活用した貢献証明プラットフォームを開発している会社です。これは日々の「見えない貢献」（助言・レビュー・知見共有のようないいこと）をAIで拾い上げてスコア化し、ブロックチェーンで改ざん不能な形で証明できる仕組みです。現在は企業向けに、SlackやTeamsといったチャットサービス用の拡張機能を提供しています。この拡張機能をインストールするだけで、日々のやり取りのデータからメンバーごとの貢献度を見える化できる仕組みを構築しています。現場での使い方はシンプルです。拡張機能を入れるだけで、チャット上の発言やリアクションをAIが解析し、「提案」「サポート」「知見共有」などの行動を抽出して貢献スコアに変換します。結果はダッシュボードで可視化され、評価・アサイン・育成にそのまま使えます。さらに、貢献の対象はKPIのような定量成果だけではありません。日々の支援やレビュー、学習・資格取得といった“埋もれがちな良い仕事”まで拾い上げ、個人が持ち運べる実績データとして整理します。将来的には、これらのデータを「免許証×履歴書」のようなウォレットに蓄積し、必要なときだけ安全に開示できる形を目指します。また、プロダクト開発に加え、企業向けに自社のナレッジを簡単に検索し解析ができるRAG基盤を構築する事業も行っています。これにより、日々の業務においてさまざまな人やツールに社内知識が分散してしまっている状態から、1つのシステムに問い合わせるだけであらゆる会社の情報にアクセスできる状態を実現することが可能です。これにより問い合わせ対応や意思決定のスピードを上げ、貢献の連鎖を生み出す土台を整えます。将来的には、これらの事業で得られた知見をもとに、あらゆる組織の垣根を超えて人々が自らの活動履歴を生涯にわたって記録・証明ができる貢献証明プラットフォームを構築します。

Like Unyte 広報's Story

Let Unyte 広報's company know you're interested in their content

株式会社Unyte

RAG開発でB+木を学び直した話 ― AI時代に効く基礎の判断【Unyte テックブログ】

目次

1. はじめに：なぜ B+木を学び直したのか

2. B+木が解く問題

2.1 ディスク I/O というボトルネック

2.2 二分探索木では足りない理由

3. B+木の定義と構造

3.1 葉ノードの性質

3.2 内部ノードの性質

3.3 平衡性

4. 検索アルゴリズム

4.1 単一キー検索

4.2 範囲検索

4.3 計算量

5. 挿入アルゴリズム

5.1 葉ノードへの挿入

5.2 ノードの分割

5.3 親への伝播

5.4 ルートの分割と木の成長

5.5 具体例

6. 削除アルゴリズム

6.1 葉ノードからの削除

6.2 再分配

6.3 併合

6.4 親への伝播

6.5 根ノードの縮約

6.6 具体例

7. 勉強会でのディスカッション

8. まとめ

9. おわりに

株式会社Unyte

エンジニア

Weekly ranking