618ZXW

DeepSeek を個人のナレッジ ベースに統合するためのステップバイステップのチュートリアルが用意されています。

張龍飛(Datawhale)によるオリジナル

Datawhaleのヒント

著者: Zhang Longfei、 Datawhale のティーチング アシスタント*

対象者: コンピュータ初心者

読了時間: 7分

前回の記事「最も包括的な概要:RAGテクノロジーの5つのパラダイムを1つの記事で理解!」では、RAGの包括的な概要を説明しました。今回は、RAGアプリケーションの初心者向けチュートリアルをお届けします。Ragflowフレームワークを使用して、DeepSeekを個人の知識ベースに統合する方法をご紹介します。もちろん、他のモデルも同様であり、自由に組み合わせることができます。

まずは結果を見てみましょう:

ラグフローの紹介:

RAGFlowは、深い文書理解に基づくオープンソースの検索拡張生成(RAG)エンジンです。情報検索と生成AIの利点を組み合わせることで、データ処理と回答生成における既存技術の課題を解決することを目指しています。

効果

RAGFlow は、次のような動的に生成されたコンテンツを必要とし、外部のナレッジ ベースに依存するシナリオで広く使用されています。

  • インテリジェントな顧客サービス: 企業のナレッジ ベースから関連情報をリアルタイムで取得し、顧客に正確でパーソナライズされた回答を提供します。
  • ドキュメント生成とレポート分析: 複数のデータ ソースから情報を取得し、大規模なコンテンツ管理に適した構造化されたドキュメントまたは要約を生成します。
  • 診断支援: 医療専門家は RAGFlow を使用して関連する医学文献や症例データをすばやく見つけ、診断や治療の参考資料として利用できます。
  • 文献レビュー: 学生や研究者が関連する学術文献を迅速に見つけて分析し、文献レビューの執筆を効率的に完了するのに役立ちます。
  • ニュース報道と投資分析: ジャーナリストや金融機関は、RAGFlow を使用して大量の資料を統合および改良し、ニュース記事や投資分析レポートを生成できます。

利点

  1. ドキュメントの深い理解: 複雑な形式の非構造化データから正確に知識を抽出し、複数のドキュメント形式 (Word、PPT、Excel、PDF など) をサポートし、ドキュメントのレイアウトを自動的に認識します。
  2. 錯覚のリスクを軽減: 明確な主要引用元を提供し、テキスト チャンクの視覚化と人間の介入をサポートし、生​​成された回答が証拠に基づいていることを確認します。
  3. 異種データ ソースとの互換性: 複数のデータ形式をシームレスに処理し、さまざまなソースからのデータを統合し、ユーザーにワンストップのデータ処理と Q&A エクスペリエンスを提供します。
  4. 自動化されたワークフロー: 個人用アプリケーションから大規模な企業まで幅広いエコシステムをサポートし、さまざまなビジネス システムに迅速に統合できる使いやすい API を提供します。
  5. 効率とコストの最適化: プロセスを動的に最適化することで、不要な計算やクエリが削減され、運用コストが削減されます。
  6. 正確性と信頼性: 検索プロセスと生成プロセスは相互に補完し、最終結果の正確性と信頼性を確保します。

RAGFlow のこれらの機能と利点により、情報検索とコンテンツ生成の分野で RAGFlow は幅広く適用でき、高い競争力を備えています。

私の理解では、Ragflow の意義は、もともと複雑だった Rag システムの開発をゼロコード開発モデルへと変革し、コンピュータの知識がない人でも Rag システムの構築と保守を容易に行えるようにする点にあります。さらに、Dify に似た強力なワークフローオーケストレーション機能も備えています。

Ragflow ローカル Windows 展開

設定要件:Ragflow はかなり「重い」プロジェクトです。お使いのコンピュータが以下の要件を満たしていない場合は、使用しないでください。

I. ソフトウェアの構成とインストール

まず、Docker ソフトウェアをインストールする必要があります。

https://www.runoob.com/docker...

Docker がインストールされると、ログインしたり設定したりすることなく、プロセスをスキップして起動できます。

ここで、Docker イメージ ソースを構成する必要があります。

{
「レジストリミラー」: [
「https://registry.docker-cn.com」、
「http://hub-mirror.c.163.com」、
https://docker.mirrors.ustc.edu.cn
],
「安全でないレジストリ」: [],
「デバッグ」:偽、
「実験的」:偽、
"特徴": {
"ビルドキット": true
},
「ビルダー」: {
"gc": {
「有効」:true、
"defaultKeepStorage": "20GB"
}
}
}

上記のコードを貼り付けて置き換えた後、右下隅をクリックします。

Docker の設定はこれで完了です。

次に、git をインストールする必要があります: https://cloud.tencent.com/dev...

最後に、VS Code をインストールする必要があります: https://zhuanlan.zhihu.com/p/...

II. ラグフローの設置

インストールパスを設定する

Cドライブ外のフォルダを開いてRagflowをインストールします。右クリックして「Git Bashをここで開く」を選択します。

次のコマンドを入力します:

git クローン https://github.com/infiniflow…

Enter キーを押すと、ragflow という名前の新しいフォルダーが表示されます。

デフォルト設定には埋め込みモデルが含まれていないため、設定をフルバージョンに変更します。VS Codeで.envファイルを開き、84行目と87行目を修正して、Ctrl+Sでファイルを保存します。

Dockerイメージをプルする

次に、Dockerイメージをデプロイします。Win+Rを押し、「powershell」と入力してEnterキーを押します。次に、「cd + 先ほどダウンロードしたragflowフォルダへのパス(私の場合は「cd D:\demo\ragflow\docker」)を入力してEnterキーを押します。次に「docker compose -f docker-compose.yml up -d」と入力してEnterキーを押します。Dockerがイメージを読み込んでいるのが確認できます。完了するまで少しお待ちください。

約15分後、イメージがロードされ、デプロイメントが完了します。最後に「docker logs -f ragflow-server」と入力します。RAGFLOWのロゴが表示されれば、バックエンドサービスが正常に起動したことを意味します。

次に、ブラウザのアドレスバーに「localhost:80」と入力して、Ragflowのログインページを開きます。任意のメールアドレス(指定された形式に準拠するメールアドレスであれば何でも構いません)を入力でき、入力した情報はすべてローカルコンピュータに保存されるため、データ漏洩の心配はありません。ただし、最初に登録したユーザーはデフォルトで管理者として登録されるため、登録したメールアドレスの情報は必ず保存してください。その後、「ログイン」をクリックしてRagflowをご利用ください。

III. シンプルなユーザーガイド

まず、Deepseekモデルサービスを設定する必要があります。APIキーはhttps://platform.deepseek.com..._keyから取得できます(公式サイトでは有料化が再開されています)。

次に、資料をアップロードしてローカルナレッジベースを作成します。アップロードした資料は、スキャンしたPDFドキュメントを含む複数の形式をサポートしていることがわかります。

ファイルをアップロードした後、ドキュメントの解析が完了するまでお待ちください。解析結果は非常に良好です。

チャットアシスタントを作成したら、チャットを開始できます。モデル設定でモデルを deepseek-chat に置き換えることを忘れないでください。

IV. ラグフロープログラムの開始と停止:

ラグフロー プログラムを閉じます。

PowerShell ウィンドウを閉じて、Docker プロセスを終了するだけです。

ラグフロー プログラムを開始します。

Dockerソフトウェアを開き、Win+Rキーを押してPowerShellを起動し、「docker logs -f ragflow-server」と入力してEnterキーを押すと、バックエンドサービスが起動します。Dockerソフトウェアで、すべてのragflowサービスが実行中であることを確認します。つまり、以下の画像に示されているサービスはすべて実行状態になっている必要があります。

すべてが実行されている場合は、ブラウザに localhost:80 と入力してフロントエンド インターフェイスを起動し、ragflow をお楽しみください。

このチュートリアルは、主に次の 2 つの公式ドキュメントを参考に作成されました。

1. https://github.com/infiniflow...

2. https://ragflow.io/docs/dev/

いいね (3件のいいね!)↓