|
最近、このAI証明写真アプリが大人気になってます! ベンがハリー・ポッターの写真を何気なくアップロードすると、あっという間に青い背景の身分証明書用写真が生成されました。 さらに重要なのは、この素晴らしいツールは現在無料でオープンソースなので、誰でもすぐに使い始めることができるということです。 この素晴らしいツールはHivisionIDPhotosと呼ばれ、ここ数日 GitHub でトレンドになっており、現在 3.2K のスターを誇っています。 背景の変更だけでなく、軽量な背景削除、さまざまなサイズや用途の標準ID写真の選択、簡単に印刷できる6インチレイアウト写真もサポートしています。 すでにそれを体験した人たちは、次のように感想を述べています。 これはAIの優れた実用性の一例です。これからは、適当に写真を撮るだけで、AIが自動的に最終製品を作成してくれるようになります。 マスク氏はすでに最初の「テストユーザー」の一人となる予定だ。 ネット上では、ジャック・マー氏の息子であるラオ・マー氏が公務員試験(ドージ)を受ける際に使えるように、すでにこれを勧めたと冗談を言う人もいた。 興味深いことに、この驚くべきデバイスの開発者は、西安電子科技大学の博士課程の学生です。 皆さんに試してみます。さあ、皆さんも試してみましょう。 プロジェクトの作者はウェブページのデモを提供しており、現在中国語版と英語版の両方で利用可能です。今回は中国語版を直接使用します。 もちろん、最初のハードルは AI の画像切り取り能力をテストすることです。 「日常の写真から正式な身分証明書の写真を作成する」というシナリオを想定して、このツールが予期しないニーズに対応できるかどうかを確認してみましょう。 注意: このツールはフォーマルな服装をサポートしていないため、アップロードする写真にはフォーマルな服装を着用する必要があります。 たとえば、下の写真では背景が少し乱雑になっています。 公平に言えば、結果から判断すると、カットアウト効果はまだかなり明白であり、フォーマルな場での使用を躊躇させます。 しかし、他の写真に変更すると、切り抜きだけ見ると効果はかなり良さそうですよね? 公式サイトに掲載されている作例を見る限り、元の画像自体は非常に高品質なようです。 そこで、これからは主に費用を節約するために、このツールを使用して、ID写真を撮影した後に背景やサイズを変更できることに気付きました。 現在、公務員試験、教員資格試験、大学生のCET-4およびCET-6試験など、一般的なサイズと用途がいくつか含まれています... 簡単に印刷できる6インチレイアウト写真もございます。 ちなみに、このツールは現在、 FastAPI に基づく API サービスを提供しており、 Docker デプロイメントもサポートしているため、ユーザーはさまざまなオペレーティング システム環境でサービスを迅速に構築して実行できます。 このプロジェクトは、Linux、Windows、macOS プラットフォームで実行でき、Python 3.7 以上をサポートしています。 著者ZeYiLinによると: 画像マットモデルは、インターネット上のオープンソースのID写真データを用いてMODNetを微調整したもので、推論を高速化するためにONNXに変換されています。顔検出モデルにはMTCNNが使用されており、これもONNXに変換されています。コード全体はCPU上で許容できる時間で実行できます(ただし、最適化の余地はまだ大きく残っています)。 プロジェクトのホームページから判断すると、作者は美容フィルターや衣装カスタマイズ機能も提供することを計画しているようです。 つまり、これまでの皆さんの経験からすると、プロの証明写真として気軽にスナップ写真を撮るのと比べると、それほど良い結果にはならないということです。(運も必要ですが。) しかし、これは良いアイデアであり、さまざまな状況で個人が使用できます。 著者は西安電子科技大学の出身です。このプロジェクトの著者であるZeYiLin氏は、西安電子科技大学の電子工学学院のWu Jiaji教授の指導の下、同大学の博士課程1年生です。 彼は、SwanLab および SwanHub オープンソース コミュニティの創設者の一人でもあります。 彼の個人プロフィールによると、彼はフルスタックの仕事に情熱を注いでおり、機械学習、UI/UX、トップレベルの製品設計を楽しんでいます。 Zhihu での彼の投稿によると、HisvisionIDPhotos で使用されているアルゴリズムは、彼が以前参加した「インターネット + イノベーションと起業家精神のコンペティション」の結果だそうです。 これは私が開発した写真付き身分証明書作成アプリで使用されているコードで、中国では100万人近くが利用しています。 彼はなぜ今オープンソースを選んだのか率直に説明しました。 AIGC の波の到来により、画像ベースのコード エンジニアリングの実用的な応用例である ID 写真作成のシナリオは、やや時代遅れになりつつあります。 |
AI 搭載の ID 写真ジェネレーターが GitHub のトレンド リストでトップにランクイン。大学院入学試験、公務員試験、ビザ申請用のテンプレートが組み込まれており、クリック 1 回で生成できます。
関連するおすすめ記事
-
150億元の収益を誇る新しい電気自動車スタートアップ企業が閉鎖と破産を発表した。
-
2024年度全国優秀青少年科学基金および優秀青少年科学基金の選定概要
-
AppleのAIバックグラウンドプロンプトが明らかに。エンジニアが警告:妄想はやめよう!事実を捏造しないで!
-
上海交通大学の最新大規模モデルエージェントベース心理クリニックを一足先に覗いてみましょう!論文の筆頭著者が、ロールプレイングエージェントの最先端の進歩を詳細に分析します。
-
AIは9つの主要な生物医学画像モードをワンクリックで分析できます。ユーザーはテキストプロンプトに応答するだけで済みます。Microsoft UWなどの研究機関による新たな研究がNature Methodsに掲載されました。
-
[Triton チュートリアル] triton.jit