1
/
5

All posts

GraphRAG - 知識グラフRAG

従来のRAGシステムは、テキストを分割してベクトル化するだけで、文脈や関係性が失われてしまう課題がありました。GraphRAGは、この問題を解決する次世代のRAG技術です。本記事では、GraphRAGの仕組みから実装方法まで、実例を交えて詳しく解説します。続きはこちらから。

回帰分析を極める(4/4):回帰分析その他

回帰分析シリーズの最終回となる今回は、特殊な応用分野における回帰手法について解説します。制限付き従属変数を扱うトービットモデル、時間軸を考慮した生存時間分析、そして現代の機械学習の代表格であるニューラルネットワークモデルまで、幅広い回帰分析の応用を学びます。続きはこちらから。

階層クラスタリングをスクラッチで徹底解説(シングルリンク編)

「階層的クラスタリングってライブラリで一発じゃないの?」でも中身を知らないと、なぜそのクラスタになったのか説明できませんよね。このブログでは、6つの点をもとに、ユークリッド距離とシングルリンク法でデンドログラムを自作する方法をステップバイステップで解説します!続きはこちらから。

回帰分析を極める(3/4):質的回帰

これまで連続値を目的変数とする線形回帰について学んできました。しかし、実際の分析では、「病気の有無」「購入の有無」「選択肢の種類」など、カテゴリカルな目的変数を扱うことも多くあります。今回は、そうした質的な目的変数に対する回帰分析手法について詳しく解説します。続きはこちらから。

初学者向けにAIがデータをグループ分けする仕組みをやさしく解説

AIの「クラスタリング」をご存知ですか?これは、データの中から「似たもの同士」を自動でグループ分けする「教師なし学習」技術です。この記事では、その基本的な仕組み、顧客分析などの活用例、そして評価の難しさといった注意点まで、初心者にもわかりやすく解説します。続きはこちらから。

体裁が崩れたExcelファイルをS3→Databricksでテーブルに変換する

A1から始まらない・空白セルが多いなど体裁が崩れたExcelファイルを、S3とUnity CatalogのVolumeを経由してDatabricksで読み込み、Pandasで加工してDeltaテーブル化する手順を解説!業務Excelを安定したデータパイプラインに変換する方法を紹介します。続きはこちらから。

データ分析の第一歩!欠損値処理の基本とDataikuでの実践ガイド

はじめに — 学びを“使える力”へ現場で分析を回すと、最初にぶつかる壁はモデルづくりではなく“データの整える力”。なかでも欠損値への向き合い方は、分析の質を静かに左右します。2022年のKaggle調査では、データサイエンティストが作業時間の約20%を欠損や矛盾データの処理に費やすという結果も。地味に見えて、ここが勝負所です。続きはこちらから。

Databricks One (public preview) を試してみた

2025年9月リリースのDatabricks Oneパブリックプレビューを実際に試してみました。ビジネスユーザーが技術知識なしにダッシュボードやGenieでデータ分析できる新UIで、追加ライセンス不要、全クラウド対応です。機能・前提条件・使い方を詳しく解説します。続きはこちらから。

VS Codeでuvを使ってDjango開発を始める方法

本記事では VS Code 環境を前提に、uv の基礎知識と導入メリットを整理します。続きはこちらから。

Difyでコールセンターの応答率や応答精度を大幅に改善!

コールセンターでは、問い合わせ対応のスピードと正確さが、顧客満足度に直結します。しかし、新人スタッフや情報の属人化により、応答が遅れたり、回答がばらついたりすることがあります。そこでDifyを活用したコールセンター運用では、蓄積したQ&Aをチャットボット化し、問い合わせ内容を入力するだけで最適な回答を瞬時に検索可能に。続きはこちらから。

Dataikuとは?AI活用を加速する統合プラットフォームを初学者向けに解説

AI活用が“PoC止まり”で進まない…そんな悩みを解決する統合プラットフォーム「Dataiku」を初心者向けに解説。専門家でなくてもAIプロジェクトを推進できる理由、ツールの分断を防ぐ強み、現場での活用法まで、実務目線でわかりやすく紹介します。続きはこちらから。

Pythonのパッケージマネージャ ”uv” 入門

Python開発の新標準ツール「uv」を徹底解説。Rust製で10〜100倍高速、pip・venv・pyenv・pipxの機能を統合し、pyproject.tomlとuv.lockで再現可能な環境を実現。プロジェクト初期化から依存管理、Python本体のバージョン管理まで、uv init・add・runの基本から実践的な使い方までを丁寧に紹介します。続きはこちらから。

PythonでEDAを自動化!ydata-profiling・Sweetviz・AutoViz徹底比較

この記事では、代表的な3つのライブラリydata-profiling・Sweetviz・AutoVizについて紹介します。続きはこちらから。

現場で使える「データ分析・AIを実務に活かすデータ・ドリブン思考」──分析を“現実に活かす力”を学ぶ一冊

『データ分析・AIを実務に活かすデータ・ドリブン思考』の要点を要約。課題の定義、4段シナリオ、形式知化で“分析をごっこで終わらせない”。現場で意思決定を変える実践のヒントを解説。続きはこちらから。

OpenAI Codex をVSCodeで始める方法

OpenAIのAIコーディングエージェント「Codex」の環境構築ガイド。HomebrewでのCLIインストールと、VSCode拡張機能の導入手順を解説します。基本的な使い方に加えて、AGENTS.md/config.tomlでの初期設定も紹介します。続きはこちらから。