|
昔、学校に入学すると最初に習うのは正しいペンの持ち方で、次にアラビア数字と中国語のピンインから書き方を学び、徐々に漢字と英語へと進んでいきました。人の筆跡は、しばしば性格特性と密接に関係しています。力強く力強いか、大胆で奔放か、優雅で流れるようなか、優美で穏やかなか… 今日、コンピュータ、携帯電話、タブレット端末を基盤とした電子記録は、多くの場面で手書きに急速に取って代わりつつあり、環境保護と炭素削減という大きな潮流の中で「ペーパーレス化」が着実に進展しています。しかしながら、手書きの文書は、学習ノートや思いつきのメモなど、人々の日常生活の中で依然として重要な役割を果たしています。同時に、古文書の多くは手書きであり、電子化することで長期保存や即時検索が容易になります。 そのため、手書きテキストの正確な認識が不可欠です。従来の光学式文字認識(OCR)技術は、背景が乱雑だったり、手書き文字がぼやけている状況では性能が十分に発揮されず、認識精度が大幅に低下することがよくあります。 最近、Google ResearchはInkSightという新たな成果を発表しました。手書き文字を単にテキスト文書に転記するOCRとは異なり、 InkSightは手書き文書のストロークセットをキャプチャし、より自然な方法で手書きテキストを認識します。 具体的には、研究者らは手書きテキストの画像をキャプチャし、筆画を抽出できるレンダリング手法を提案しました。同時に、画像内の勾配、輪郭、形状を用いて筆画を抽出するといった典型的な幾何学的構造への依存を排除しました。代わりに、このモデルは人間の「読む」と「書く」という理解を模倣するようにトレーニングされます。前者は書かれたテキストを認識し、後者は手書きのような筆画を出力します。手書きテキストを継続的に書き直し学習することで、テキストの外観と意味に対する理解を蓄積していきます。 HyperAIのウェブサイトのチュートリアルセクションに「InkSightデジタル化デモ」が掲載されました。デモをクローンしてオンラインでお試しください!手書きのテキストを今すぐデジタル化しましょう! チュートリアルリンク: https://go.hyper.ai/DR89z デモ実行中
HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください): https://openbayes.com/console/signup?r=Ada0322_QZy7
モデルが大きすぎるため、コンテナが実行中であることを示した後、API アドレスを開く前に約 1 分待つ必要があります。そうしないと、BadGateway が表示されます。 効果のデモンストレーションデモインターフェースを開くと、チュートリアルは「単語レベル推論」と「ページ全体推論」の2つのモードに分かれています。 「単語レベル推論」は、単一の文字または単語の認識にのみ適用されます。 「万事順調にいきますように」と『フォレスト・ガンプ』の名セリフを手書きして、恥ずかしい思いをしましたが、中国語も英語も正確に認識されました! 単語の書き起こし フォレスト・ガンプの英語の会話の書き起こし 「安定した拡散チュートリアル交換グループ」を作成しました。ぜひご参加いただき、さまざまな技術的な問題について議論し、アプリケーションの経験を共有してください。 WeChat で Hyperai01 (WeChat ID: Hyperai01) を追加し、「SD Tutorial Exchange Group」とメンションしてグループ チャットに参加します。 |
従来の OCR の域を超え、Google の最新イノベーションである InkSight をワンクリックで導入。手書きのテキストを正確に認識し、中国語と英語の両方を簡単に処理します。
関連するおすすめ記事
-
O1初の企画力テスト!言語モデルの域を超え、プレビューがついにミニに勝利!
-
2024年オープンソースソサエティ年次報告書のビジュアル概要
-
中国最大のオープンソースMoEモデル(2550億パラメータ)が、無条件で無料で商用利用可能です。Yuanxiangよりリリース。
-
オープンソース ソフトウェアがプログラマの世界から一般大衆の世界に移行する際に、どのような課題に直面するのでしょうか?
-
iFlytek は、iFlytek Smart Writing 2.0 の新バージョンの正式リリースを発表しました。
-
重慶ターミナルは、AIoT銘柄の第一人者を目指しています。3年間で29億人民元の売上高を達成し、その60%以上がAIによるデジタル変革によるものです。