ドキュメントトーカ カメラトーク

私たちは音声合成と音声認識で新しいヒューマン・インターフェースを追求しています。


ドキュメントトーカ カメラトーク


ドキュメントトーカは音声合成による読み上げプログラムです。
ドキュメントトーカ カメラトークでは、カメラに写される世界を音声に変えてみました。


ダウンロード(無償)
Google Play にて「ドキュメントトーカ」で検索してダウンロードしてください。
本アプリを使用するには、ドキュメントトーカ TTS(ドキュメントトーカ for Android 、ドキュメントトーカ たかし、ドキュメントトーカ けいこ)と、OpenCV Manager(ダウンロード) が別途必要です。


ドキュメントトーカカメラトーク (Android用のカメラおよび音声アプリケーション)

     

できること
情景文字認識 文字認識を行います。NTTドコモ文字認識APIを使用しております。
物体検出 物体検出を行います。検出したい物体をあらかじめカメラで撮って登録しておく必要があります。
QRコードやバーコード読み上げ QRコードやバーコードにかざすだけで読み上げます。
色検出 カメラに写っている画像の中央部分の色を読み上げます。
明るさ検出 カメラに写っている画像から全体の明るさを読み上げます。
顔検出カメラ 顔を検出し、その位置を音声で知らせます。


「ドキュメントトーカ カメラトーク」ウィジェット機能

アプリとそのヘルプが一緒に並んでいるウィジェットをホーム画面に張り付けることができます。




NTT_Docomo 情景文字認識
NTT_Docomo 情景文字認識は、株式会社NTTドコモ様が公開している文字認識APIを利用したプログラムです。

docomo Developer support 参照

ntt docomo 様のページより
文字認識APIは、画像内の単語を読み取るWeb APIです。
対象となる画像から単語を抽出し、単語の位置座標や認識精度を示すスコアも併せて得ることができます。
単語データベースと認識した文字の並びを照合し、結果の訂正を行う精度の高い文字認識が可能となります。
このAPIをご利用いただくことで、文字認識技術を利用したマッシュアップサービスを手軽にご構築いただけます。

以上、ntt docomo 様のページより

認識したい対象にカメラを向けオートフォーカスを確認してシャッターボタンを押してください。
カメラを被写体から10cmぐらい離して撮るのがいいでしょう。
縦向きでも、横向きでも構いませんが、文字がさかさまになるような配置は認識ができません。
Talkback使用時は画面全体がシャッターボタンになりますので、手首を固定してカメラを揺らさないで軽くダブルタップしてください。
また、シャッターボタンという音声を確認した後、右フリックすることでズームイン(拡大)
左フリックでズームアウト(縮小)することができます。
ダブルタップしてシャッター音がしたあと、通信でNTT DOCOMO様に解析を依頼します。解析が終わるまで解析中のサンウドがなり続けます。
解析が終了すると、対象となった画像と、解析できた単語が画像上に表示され、音声で読み上げが行われます。
読み上げが終了するか、タッチで読み上げがストップした後、画面をなぞればその位置の単語を喋ってくれますので、画像と単語の位置関係が分かると思います。

軽い振動はオートフォーカス機能をオンさせる意味があります。
オートフォーカス機能が働きだし鈴虫の音がします。ピントがあった時には、チャチャン、という音がします。

撮影画面のメニュー項目
保存データ一覧 保存したデータの一覧を表示します
OCRカメラパラメータ 文字検出がうまくいかないとき、このパラメーターを切り替えてみてください。
カメラ解像度 カメラの解像度を設定します
オートフォーカス
サウンド
オートフォーカスサウンドを鳴らす。チェック項目
オートフォーカス
センサー精度
振動センサーの精度を0から4までの5段階で指定します。数字が小さいほど細かな振動でオートフォーカス機能が開始します。
カメラライト 自動、点灯、消灯から選択します
ヘルプ ヘルプ画面を呼び出します
終了 この画面を終了します

結果画面のメニュー項目
読上げ開始 読み上げを開始します
再認識 画像の条件を変えて再認識します。
結果の保存 認識した結果(現在の画面)を保存します
ヘルプ ヘルプ画面を呼び出します
終了 この画面を終了します




物体検出

「ドキュメントトーカ カメラトーク 物体検出」は、あらかじめ認識したい物体をカメラで撮影しておく必要があります。
登録した物体にカメラをかざすと、その物体名を読み上げてくれます。

ブツ、ブ、ブツという音がしますが、これは登録された物体を探している音です。
みつかれば、振動とともに読み上げが開始されます。
みつからない場合は、携帯を前後に移動してみるか、軽く携帯を振ってみてください。
軽い振動はオートフォーカス機能をオンさせる意味があり、ピントがあっていれば検索されやすくなります。
オートフォーカス機能が働きだすと鈴虫の音がします。ピントがあった時には、チャ・チャン、という音がします。

物体検出画面のメニュー項目
登録物体の
・一覧・編集・削除
登録されている物体の一覧リストが表示されます。
リストの中から対象の物体を選び、追加登録、削除、詳細といった処理が選択できます。
物体検出の精度設定 物体検出の精度を「厳密」「通常」「曖昧」の中から指定します。
カメラ解像度 カメラの解像度を設定します
オートフォーカス
サウンド
オートフォーカスサウンドを鳴らす。チェック項目
オートフォーカス
センサー精度
振動センサーの精度を0から4までの5段階で指定します。数字が小さいほど細かな振動でオートフォーカス機能が開始します。
カメラライト 自動、点灯、消灯から選択します
ヘルプ ヘルプ画面を呼び出します
終了 この画面を終了します




QRコード・バーコード検出
「ドキュメントトーカ カメラトーク QRコード・バーコード検出」は、QRコードやバーコードを読み上げるプログラムです。
カメラをゆっくりとかざすだけで、QRコードやバーコードを読み上げてくれます。

ブツ、ブ、ブツという音がしますが、これはQRコードやバーコードを探している音です。
QRコードやバーコードがみつかれば、振動とともに読み上げが開始されます。
みつからない場合は、携帯を前後に移動してみるか、軽く携帯を振ってみてください。
軽い振動はオートフォーカス機能をオンさせる意味があり、ピントがあっていれば検索されやすくなります。
オートフォーカス機能が働きだすと鈴虫の音がします。ピントがあった時には、チャ・チャン、という音がします。
また、ズーム機能を自動にしておくと、一定時間見つからなければ、自動でズーミング(拡大)とオートフォーカスを行い、拡大と標準を 3秒 ~ 6秒間隔で試行されます。

これらの機能で、ゆっくりとカメラを前後左右に移動させることで、目が見えない人でもQRコードをキャッチしやすくなります。

撮影画面のメニュー項目
QRコードの作成・一覧 QRコードの作成ができます
カメラ解像度 カメラの解像度を設定します
ズーム ズーム機能の設定を行います。
手動、自動:拡大1、自動:拡大2
拡張検索 オンにすると、バーコード検索で90度反転検索を行う。
オートフォーカス
サウンド
オートフォーカスサウンドを鳴らす。チェック項目
オートフォーカス
センサー精度
振動センサーの精度を0から4までの5段階で指定します。数字が小さいほど細かな振動でオートフォーカス機能が開始します。
カメラライト 自動、点灯、消灯から選択します
ヘルプ ヘルプ画面を呼び出します
終了 この画面を終了します




色検出

「ドキュメントトーカ カメラトーク 色検出」は、カメラで写された中央部分の色を音声で読み上げます。

色検出画面のメニュー項目
カラー検出領域 センター(大)、センター(中2)、センター(中1)、センター(小2)、センター(小1)から選びます。
色の数 色の数を選びます。
Basic:12色、Basic:16色、114色、JIS慣用色名:267色
連続検出 連続か単発かの選択をします。
単発の場合、画面をタップすることで色の読み上げが行えます。
詳細検出 詳細検出をオンにすると、指定されたカラー検出領域を4等分して読み上げを行います。
カメラ解像度 カメラの解像度を設定します
オートフォーカス
サウンド
オートフォーカスサウンドを鳴らす。チェック項目
オートフォーカス
センサー精度
振動センサーの精度を0から4までの5段階で指定します。数字が小さいほど細かな振動でオートフォーカス機能が開始します。
カメラライト 自動、点灯、消灯から選択します
ヘルプ ヘルプ画面を呼び出します
終了 この画面を終了します




明るさ検出
「ドキュメントトーカ カメラトーク 明るさ検出」は、カメラで写された全体の明るさを音声で読み上げます。
また、あわせて、センサーによる明るさも読み上げが可能です。

明るさ検出画面のメニュー項目
センサー センサーによる読み上げ
カメラ画像 カメラ画像による読み上げ
カメラ解像度 カメラの解像度を設定します
オートフォーカス
サウンド
オートフォーカスサウンドを鳴らす。チェック項目
オートフォーカス
センサー精度
振動センサーの精度を0から4までの5段階で指定します。数字が小さいほど細かな振動でオートフォーカス機能が開始します。
ヘルプ ヘルプ画面を呼び出します
終了 この画面を終了します




顔検出カメラ
「ドキュメントトーカ カメラトーク 顔検出カメラ」は、視覚に障害があるかたでも人物写真を撮ることができます。
カメラ画像の中の顔の位置を読上げます。
「センターに2頭身の顔が」というように読み上げます。
2頭身というのは、顔の大きさを表し、画面の2分の1に相当する大きさを意味します。

Talkback使用時は画面全体がシャッターボタンになりますので、手首を固定してカメラを揺らさないで軽くダブルタップしてください。
また、シャッターボタンを確認後、右フリックすることでズームイン(拡大)
左フリックでズームアウト(縮小)することができます。
写真の保存先は
/sdcard/DTalkerCameraApp\photoフォルダーに入ります。
ファイル名は「年月日_時間.jpg」となります。保存時にファイル名を編集にしておけばファイル名を自由に書き換えられます。

顔検出カメラのメニュー項目
保存時に
ファイル名を編集
保存時にファイル名を編集するダイアログが開きます。
カメラ切替 フロントカメラとバックカメラを切り替えます。
フロントカメラとは自分撮りのできるカメラのことで、固定焦点が多いのでオートフォーカス音が聞こえない場合があります。
カメラ解像度 カメラの解像度を設定します
オートフォーカス
サウンド
オートフォーカスサウンドを鳴らす。チェック項目
オートフォーカス
センサー精度
振動センサーの精度を0から4までの5段階で指定します。数字が小さいほど細かな振動でオートフォーカス機能が開始します。
カメラライト 自動、点灯、消灯から選択します
ヘルプ ヘルプ画面を呼び出します
終了 この画面を終了します




OEM提供・価格
合成エンジンの有償提供、もしくは、サービスをご利用いただけるパートナーを募っております。
web-info@createsystem.co.jpまでお問い合わせください。


受託開発
当社では、iPhone・Android関連、Win・Mac関連のプログラム開発を受託しております。
web-info@createsystem.co.jpまでお問い合わせください。


製品情報のトップ


※「ドキュメントトーカ」はクリエートシステム開発株式会社の商標です。
※「DTalker iPhone」の波形処理エンジンは、富士通株式会社の日本語合成を使用しております。
※ 引用した会社名及び商品名は各社の商標もしくは登録商標です。