
使用シナリオ
見慣れない植物を撮影して、その名前と詳細な説明を取得する
有名な絵画を撮影して、作品名、作者、制作年代などの情報を取得する
パッケージの文字を撮影して、多言語のテキスト認識と翻訳を行う
製品特徴
画像認識
テキスト認識
音声認識
質問応答
おすすめAI製品

拾光
拾光は、AIを活用したスマートなアルバム検索ツールです。TensorFlowなどの最先端AI技術を用いて、ローカルアルバムの写真をインテリジェントにインデックス化し、ソートします。キーワードを入力するだけで、お好みの写真に素早くアクセスできます。人物、色、風景など、写真内の様々な視覚要素を認識し、効率的なアルバム検索を実現します。オフラインで使用でき、ユーザーデータのネットワーク転送は行われないため、プライバシーを効果的に保護します。シンプルでスムーズな操作性で生産性を向上させ、ローカルアルバム管理の優れたアシスタントとなります。
AI画像検査識別
163.4K

Google Vision Transformer
Google Vision Transformerは、Transformerエンコーダーに基づく画像認識モデルです。大規模な画像データを用いて事前学習されており、画像分類などのタスクに使用できます。ImageNet-21kデータセットで事前学習され、ImageNetデータセットで微調整されており、優れた画像特徴抽出能力を備えています。このモデルは、画像を固定サイズの画像パッチに分割し、それらのパッチを線形に埋め込むことで画像データを処理します。また、Transformerエンコーダーでシーケンスデータを処理できるように、入力シーケンスの前に位置エンコーディングを追加しています。ユーザーは、事前学習済みのエンコーダーの上に線形層を追加することで、画像分類などのタスクを実行できます。Google Vision Transformerの利点は、強力な画像特徴学習能力と幅広い適用性です。このモデルは無料で使用できます。
AI画像検査識別
59.1K