|
3人チームで作り上げた学術検索エンジンが最先端を一気に超えた! 検索結果は Google Scholar より平均 5 倍関連性が高いと主張しており、1 億件以上の研究対象を検索でき、LLM に依存していません。 さらに重要なのは、無料だということです!学生たちは大喜びです! 結果を見てみましょう。検索キーワードを入力すると、わずか350ミリ秒で関連性の高い文献がリストアップされます。 また、ワンクリックで PDF として表示できるファイルを除外することもできます。 年や引用数から出版タイプや特定のジャーナルまで、ワンクリックでフィルタリングを設定できます。 検索結果では、タイトルをクリックして論文をプレビューすることができ、一般的な学術引用形式をワンクリックでコピーすることができます。 「Lumina」と名付けられた新しい検索エンジンは、30万件以上のクエリを処理し、24の言語をサポートしていると報告されています。 Google Scholarなどの従来の学術検索エンジンと比較するため、開発チームはベンチマークテストを実施し、コードベースはオープンソースとして公開されました。テスト結果によると、Luminaの検索結果は最先端の関連性を達成しています。 開発者がGoogleに異議を唱えるツイート: 私たち3人は数か月でそれを完成させました。Googleのものよりも優れています。 Ego の共同創設者兼 CTO、そして元 Meta 研究者は、それをレビューした後、「ぜひやってみよう!」と言いました。 皆さんもぜひ試してみることをお勧めします。 多くの学者も、それがうまく機能していると述べています。 検索関連性は最大 11 倍向上しました。冒頭で述べたように、Lumina のパフォーマンスをテストするために、研究チームはベンチマークテストをオープンソース化しました。 GPT-4 を「審査員」として使用し、Lumina Base、Lumina Recursive、Semantic Scholar、Google Scholar からの検索結果の関連性と精度を比較しました。 各検索エンジンの検索結果上位10件を直接テストして評価し、比較すると次のようになります。 基本検索モード (Lumina Base) では、生成された約 2,470 個のクエリ データセットの評価に基づいて、Lumina の検索結果の関連性は Google Scholar の 4.8 倍、Semantic Scholar の 8 倍高くなりました。 再帰検索モードでは、Lumina は検索結果の関連性をさらに向上させ、同じく 2,470 件のクエリのデータセットに基づいて、Google Scholar よりも 6.8 倍、Semantic Scholar よりも 11.3 倍高い関連性を達成しました。 さらに、Lumina では、1 回の検索で関連性の高い結果が常に 2 ~ 3 件提供されますが、Google Scholar 検索では関連性の高い結果が 50% で 1 件しか提供されず、Semantic Scholar 検索では関連性の高い結果が 30% しか提供されません。 言い換えれば、Lumina を使用すると、他の方法では見つけるのが非常に難しい研究結果を見つけることができます。 また、チームは、Lumina API とシンプルな再帰スクリプトを使用することで、Google Scholar よりも 11 倍高い関連性を実現できると述べており、Lumina API は近々リリースされる予定です。 基本的な検索に加えて、Lumina はAI 概要機能も提供します。 たとえば、「機械学習」というキーワードを使って検索すると、機械学習を要約して紹介する論文が引用されて表示されます。 AI 概要で下線付きのキーワードをクリックすると、そのキーワードのさらなる検索が開始されます。 AI概要の下には、検索論文の研究結果の概要表があります。 3人チームLumina はわずか 3 人の開発チームによって支えられており、Y Combinator から投資を受けています。 共同創業者兼CEOのメフル・チャダは、ウィスコンシン大学マディソン校で材料工学の学位を取得しています。以前は、高精度科学機器メーカーであるCAMECAで製造エンジニアとして勤務し、原子プローブの開発を担当していました。 共同創業者兼CTOのアキレス・シャルマは、イリノイ大学アーバナ・シャンペーン校で機械工学の学位を取得しています。以前はソーシャルメディアプラットフォームPostpressの共同創業者兼最高技術責任者を務め、米国のテクノロジーコンサルティング会社Neudescではクラウド技術コンサルタントも務めていました。 共同創設者の Ishaan Kapoor は UCLA で統計学の学位を取得しており、ディープラーニング、線形代数、大規模言語モデルに興味を持っています。 新しく立ち上げられた学術検索エンジンに加えて、チームは以前にもLumina-chatと呼ばれる AI 論文解釈ツールを開発しました。 Lumina ホームページの右上にある「レガシー システム」をクリックしてアクセスし、使用してください。 開くとこんな感じです。PDF をアップロードして、AI と対話して論文を解釈できます。 興味のある方はぜひお試しください! |