618ZXW

従来の OCR の域を超え、Google の最新イノベーションである InkSight をワンクリックで導入。手書きのテキストを正確に認識し、中国語と英語の両方を簡単に処理します。

昔、学校に入学すると最初に習うのは正しいペンの持ち方で、次にアラビア数字と中国語のピンインから書き方を学び、徐々に漢字と英語へと進んでいきました。人の筆跡は、しばしば性格特性と密接に関係しています。力強く力強いか、大胆で奔放か、優雅で流れるようなか、優美で穏やかなか…

今日、コンピュータ、携帯電話、タブレット端末を基盤とした電子記録は、多くの場面で手書きに急速に取って代わりつつあり、環境保護と炭素削減という大きな潮流の中で「ペーパーレス化」が着実に進展しています。しかしながら、手書きの文書は、学習ノートや思いつきのメモなど、人々の日常生活の中で依然として重要な役割を果たしています。同時に、古文書の多くは手書きであり、電子化することで長期保存や即時検索が容易になります。

そのため、手書きテキストの正確な認識が不可欠です。従来の光学式文字認識(OCR)技術は、背景が乱雑だったり、手書き文字がぼやけている状況では性能が十分に発揮されず、認識精度が大幅に低下することがよくあります。

最近、Google ResearchはInkSightという新たな成果を発表しました。手書き文字を単にテキスト文書に転記するOCRとは異なり、 InkSightは手書き文書のストロークセットをキャプチャし、より自然な方法で手書きテキストを認識します。

具体的には、研究者らは手書きテキストの画像をキャプチャし、筆画を抽出できるレンダリング手法を提案しました。同時に、画像内の勾配、輪郭、形状を用いて筆画を抽出するといった典型的な幾何学的構造への依存を排除​​しました。代わりに、このモデルは人間の「読む」と「書く」という理解を模倣するようにトレーニングされます。前者は書かれたテキストを認識し、後者は手書きのような筆画を出力します。手書きテキストを継続的に書き直し学習することで、テキストの外観と意味に対する理解を蓄積していきます。

HyperAIのウェブサイトのチュートリアルセクションに「InkSightデジタル化デモ」が掲載されました。デモをクローンしてオンラインでお試しください!手書きのテキストを今すぐデジタル化しましょう!

チュートリアルリンク:

https://go.hyper.ai/DR89z

デモ実行中

  1. hyper.ai にログインし、「チュートリアル」ページで「InkSight Digitize Handwritten Text Demo」を選択し、「このチュートリアルをオンラインで実行」をクリックします。


  1. ページがリダイレクトされたら、右上隅の「複製」をクリックして、チュートリアルを独自のコンテナーに複製します。

  1. 右下にある「次へ: コンピューティング能力の選択」をクリックします。

  1. ページがリダイレクトされたら、「NVIDIA GeForce RTX 4090」と「PyTorch」のイメージを選択し、ニーズに合わせて「従量課金制」または「日次/週次/月次」のサブスクリプションを選択してください。「次へ:確認」をクリックしてください。下記の招待リンクから新規登録された方には、RTX 4090を4時間無料でご利用いただけるほか、CPUを5時間無料でご利用いただけます。

HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください):

https://openbayes.com/console/signup?r=Ada0322_QZy7

  1. すべて正しいことを確認したら、「続行」をクリックし、リソースの割り当てをお待ちください。最初のクローン作成には約3分かかります。ステータスが「実行中」に変わったら、「APIアドレス」の横にあるジャンプ矢印をクリックしてデモページに移動してください。APIアドレスアクセス機能を使用する前に、実名認証を完了する必要がありますのでご注意ください。

モデルが大きすぎるため、コンテナが実行中であることを示した後、API アドレスを開く前に約 1 分待つ必要があります。そうしないと、BadGateway が表示されます。


効果のデモンストレーション

デモインターフェースを開くと、チュートリアルは「単語レベル推論」と「ページ全体推論」の2つのモードに分かれています。 「単語レベル推論」は、単一の文字または単語の認識にのみ適用されます。

「万事順調にいきますように」と『フォレスト・ガンプ』の名セリフを手書きして、恥ずかしい思いをしましたが、中国語も英語も正確に認識されました!

単語の書き起こし

フォレスト・ガンプの英語の会話の書き起こし

「安定した拡散チュートリアル交換グループ」を作成しました。ぜひご参加いただき、さまざまな技術的な問題について議論し、アプリケーションの経験を共有してください。

WeChat で Hyperai01 (WeChat ID: Hyperai01) を追加し、「SD Tutorial Exchange Group」とメンションしてグループ チャットに参加します。