Windowsの音声認識を使う時に

「テキストの文字で自動的に実行」の設定の事についてです。

この設定は、一応は「Windowsの音声認識」で使う事を目的に作ったものです。

実際には「Windowsの音声認識」で実用的に使う事はかなり難しいのであまり意味はないものです。

実用的なものにはならない事を承知で説明を見てほしいところですが、このページでは「テキストの文字で自動的に実行」の設定を「Windowsの音声認識」を使った場合についてのこうしたらいいのではないかという設定について記入していこうと思います。

今回挙げるスクリプトは以下のリンクから全てダウンロードできます。

onseininsikiTry.zip

( 7 KByte )

「音声認識」で使う場合

テキストが閉じないようにする

「Windowsの音声認識」では、ウインドウタイトルの一部の文字を指定して、「〇〇に切り替え」の言葉で、指定のウインドウをアクティブにするようです。

「テキスト1に切り替え」の言葉でテキスト1 をアクティブにする事が一応ですが可能でした。

しかしこの場合、既にウインドウが閉じていた場合は効果がありません。
ですので、「Windowsの音声認識」を使う場合、テキストが閉じる動作をする場合、閉じるのではなく最小化をする設定にしておく事を勧めます。

設定のウインドウの、設定3 のタブの中にある、

テキストを閉じるのではなく、最小化させるようにする

の項目をチェック状態にしておくと、普段自動的にテキストが閉じる動作をする場合、最小化をするようになります。

テキストの名前を変える

「テキスト1に切り替え」ではなく、ある程度好きな名前で呼べるようにする設定です。

userフォルダに加えない設定のウインドウの設定2 のタブの中に、「テキスト」の呼び方を変えるの項目があります。

これの入力欄に文字を記入して OK を押して再起動すると、一行テキストのウインドウタイトルの「テキスト」の文字の部分が指定した文字に変わります。

ですので、「音声認識」でテキストをアクティブにする場合、「〇〇1に切り替え」という感じで〇〇の部分を好きに指定できるようになるのではないかと思います。

ちなみに一行テキストのウインドウタイトルのみを変更します。
後、メインのメニューにある文字も
他の場所で記入されている「テキスト」の文字までは変更されません。

入力中の文字を最後のみ消す

間違っている文字を消す方法についてです。

「音声認識」では、それを取り消すの発音でひとつ前に戻せるようです。

「テキストの文字で自動的に実行」の設定でも、消すの文字でテキストにある文字を消す事ができます。

この動作は単に &cleanText を使っている事と同です。

ただ、これではテキストの入力欄の文字を全て消す事になります。

そこで最後の引数だけを消すアイテムを紹介します。

以下の 2つのファイルを cleanLast_ とでも名付けたフォルダの中にいれ、そして fromFileName の適当な item フォルダ内に配置してください。

1_cleanLast.txt

global clea_text
global clea_count

cleanLast.txt

clea_text := F_getTextEditExecutor(False)
clea_text := RTrim( clea_text )
IfNotInString, clea_text, %A_Space%
{
    clea_text =
    &outArgsToTextEditExecutorTextOut %clea_text%
    &sendEndToTextEditExecutor
    return
}
StringGetPos, clea_count, clea_text, %A_Space%, R1
clea_count++
StringLeft, clea_text, clea_text, %clea_count%
&outArgsToTextEditExecutorTextOut %clea_text%
&sendEndToTextEditExecutor
%--

一つめの 1_cleanLast は、起動時に実行させたいアイテムなので、 startup のフォルダ内に 1_cleanLast のフォルダなどを作ってください。

これで、 cleanLast のアイテム使えばテキストに記入してある最後の引数の文字のみを削除していく事ができます。

「テキストの文字で自動的に実行」で使うなら、キーになる文字を違うで設定するなら、
違うと発音する事で右端の文字のみを消す事ができると思います。

補足

cleanLast は、今回の様な「音声認識」で使う場合の時以外でも使っていけそうなものなので、テキスト上のキーに登録して使ってもよいと思います。

&cleanText が Alt+C なので、 Shift+Alt+C あたりでしょうか？

cleanLast は規定のコマンドとして作ってもよかったのですが、このように TRR のスクリプトでも作成できるため、ここで紹介しておくだけでもよいと思っています。

要望があったら、規定のコマンドにするかもしれませんが現時点ではこれで十分だと思っています。

「テキストの文字で自動的に実行」の設定のタブ

テキストの文字で自動的に実行の設定の中にも設定のタブが最後にあります。

その中の、

テキストの右端の文字が全角の数字なら、
半角の数字に変換して再検証する

この項目にチェックをしておくと、テキストに入力された右端の 1文字が全角の数字なら、半角の数字に変換して「最後の文字で自動的に実行」の「キーになる文字に」合うかどうかを再検証します。

「音声認識」の場合、数字を言うと半角の数字になるみたいです。
ですが、全角の数字になるかもしれない場合は設定しておいた方がよいのではないでしょうか。

2022年2月14日

今のバージョンで

半角の数字に変換してみるのは右端の 1桁の数字だけです。

右端が 2桁の数字だったとしても 1桁めしか検証しません。

そして、その下にある項目も右端の文字を変換して再検証するものです。

する、して、しろなどの文字を同じ扱いにできるため、設定の仕方しだいでは話し言葉に近い方法でも使用できるようになるかもしれません。

補足

この設定の初期値の < > は半角スペースを意味します。

設定の際、端っこのスペースは取り除かれる仕様のためにあえてスペースを使いたい場合は両端を < > にして実現させれるようにしているといったとこです。

ここでは、端っこの < や > は取り除かれる仕様になっています。

「音声認識」を使って TRR を使ってみるなら、結構大事な設定になるかもしれません。

ここも、設定できる個所は少なめですが、使えそうだと判断したら今後増やしたりするかもしれません。

最後の文字を取り除くアイテムを作る

かなり面倒くさい事を提案します。一応参考程度に読んでください。

引数の右端を取り除くアイテムを作るという提案です。

「テキストの文字で自動的に実行」を使う際は、これ専用のアイテムを作る、
つまり本来指定する処理の前に、引数の右端を取り除くアイテムをさらに作っておき、それを使う様にするといったものです。

例えは何でもよいのですが、 GoogleSearch のアイテムを例にします。

このホームページでたぶん何回か紹介しているものなのですが、まだ用意していない方は以下のファイルを fromFileName の適当な item フォルダ内に入れてアイテムとして追加してください。

GoogleSearch.txt

; type=1
; argument=https://www.google.com/search&?q="%*"
; workingFolder=C:\Program Files (x86)\Microsoft\Edge\Application
C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe

今回は、「テキストの文字で自動的に実行」で以下の設定をするケースを例にします。

　　で、実行：検索

実行する処理： GoogleSearch

テキストに、グーグル検索したい文字を記入して、その後に検索を記入すると検索ができるようにするやつです。

基本これでも十分でしょうが、〇〇の検索や〇〇を検索といったように、のやをといった余計な文字を入れてもいいようにしていくものを作ります。

以下のアイテムを作ります。

GoogleSearchMk2.txt

V_var1 = %B_itemArgAll%
if(V_var1 == ""){
    F_errorOutput(B_itemNameOwn . "  のエラー`n検索する文字を記入していません。")
    return
}
V_var1 := RTrim(V_var1, "を")
V_var1 := RTrim(V_var1, "の")
V_var1 := RTrim(V_var1, "で")
; 右端 ４文字が 「について」なら取り除く
StringLen, V_var2, V_var1
if( V_var2 >= 5 ){
    StringRight, V_var3, V_var1, 4
    if( V_var3 == "について" ){
        StringTrimRight, V_var1, V_var1, 4
    }
    if( V_var3 == "に関して" ){
        StringTrimRight, V_var1, V_var1, 4
    }
}
V_var1 := Trim(V_var1)
if(V_var1 == ""){
    F_errorOutput(B_itemNameOwn . "  のエラー`n検索する文字を記入していません。")
    return
}
GoogleSearch  %V_var1%
&cleanText
&guiHideTextExecutor
%--

このアイテムの意味するところは、引数の右端にあるのやをやでやについての文字を取り除いて、
その後に、先程の GoogleSearch のアイテムを使うといったものです。

実行する処理の指定には、 GoogleSearch の代わりに GoogleSearchMk2 の方を指定します。

この様に本来の処理の前に、右端にあるのやをを取り除く処理をしてから本来の処理を実行するアイテムを作るという方法です。

このようなアイテムを用意し、そして前に紹介した
テキストの文字で自動的に実行の設定のウインドウの設定のタブにある、右端の文字を変換して再検証する設定と合わせて使えば、
〇〇を検索してや〇〇の検索するや〇〇について検索といった言葉でも使用できるようになるのではないかと思います。

最も処理一つ一つに本来の処理に手を加えるアイテムを作らなければならないので手間が非常にかかります。

一応の代替え策

同じ意味で使うアイテムをもう一つ紹介します。

以下のスクリプトのアイテムは、「本来の処理に手を加えるアイテム」を一つ一つ作る煩わしさを無くすために考えたアイテムです。

一応紹介しておきますが、これは自分が余り実験して使ってみたりしていないアイテムです。
もしかして不具合は色々見つかるかもしれません。

公式で薦められているものとして余り扱ってほしくないものです。
一応思いついたので紹介だけしておきます。

以下の 2つのファイルを作ります。

1_取り除いてから.trr

global lw_argsAll
global lw_lenNum
global lw_right

取り除いてから.trr

lw_argsAll = %B_itemArgAll%
if(lw_argsAll == ""){
    F_errorOutput(B_itemNameOwn . "  のエラー`n後に続く実行処理がない。")
    return
}
lw_argsAll := RTrim(lw_argsAll, "を")
lw_argsAll := RTrim(lw_argsAll, "の")
lw_argsAll := RTrim(lw_argsAll, "で")
lw_argsAll := RTrim(lw_argsAll, "に")
;右端 ４文字が 「について」なら取り除く
StringLen, lw_lenNum, lw_argsAll
if( lw_lenNum >= 5 ){
    StringRight, lw_right, lw_argsAll, 4
    if( lw_right == "について" ){
        StringTrimRight, lw_argsAll, lw_argsAll, 4
    }
    if( lw_right == "に関して" ){
        StringTrimRight, lw_argsAll, lw_argsAll, 4
    }
}
lw_argsAll := Trim(lw_argsAll)
&cleanText
F_textExe(lw_argsAll)
%--

1_取り除いてからの方は、起動時に実行させるものなので startup の中に 1_取り除いてからのフォルダを作っておきます。

取り除いてからの方のアイテムは、「テキストの文字で自動的に実行」の設定で指定する時に、「本来の処理」の前に記入させておくものです。

先程の GoogleSearch を指定する場合は、以下のように変えます。

実行する処理

取り除いてから GoogleSearch

この様に、「本来の処理」の前に記入して使う様にするものです。

このアイテムを使う方法なら、「本来の処理に手を加えるアイテム」を一つ一つ作る手間が省けます。

ただし、繰り返し書きますがこれは公式に薦めたい方法とかではありません。
思いついたので紹介しておいただけの方法です。

不具合がいくつもでるかもしれませんが使ってみないと分からないものです。
興味があった方は試しに使ってみてください。

簡易入力を使う

「音声認識」を使って動作させる時に用意したい事として、簡易入力を使用する方法というのもあります。

簡易入力とは、入力補完一覧の簡易入力のタブ内で設定できるやつの事です。

普通の使い方入力補完一覧簡易入力

「音声認識」を使ってみると分かると思いますが、違う文字が入力される事が多いです。

間違えるとしても、大体同じ違う文字が入力されると言えなくもないので、あらかじめ違う文字を正しい文字に変換する方法を用意しておくといった案を挙げます。

「テキストの文字で自動的に実行」の方で、以下の設定をしておきます。

　　で、実行：返還

実行する処理： &snippetOpen

返還の文字が入力されると、簡易入力の文字を展開する処理をする指定です。

変換にしたいところですが、「音声認識」では高い確率でへんかんと発音したら返還を入力するのでこちらを設定しておきます。

変換の方も設定しておいていいかもしれません。

後は、簡易入力の方の設定ですが &snippetAddFromFile を使って、ファイルから設定する方法を勧めます。

これは、以下の様な書式で記入されたファイルを読み込んで簡易入力を追加するものです。


                        [キーの文字１] /// [展開後の文字１]

                        [キーの文字２] /// [展開後の文字２]

                        [キーの文字３] /// [展開後の文字３]

書式の説明をします。

一行で一つの簡易入力を追加します。

/// を必ず記入します。
/// の左側がキーになる文字で、
/// の右側が展開後の文字です。

今回挙げる例として以下のファイルを用意します。

replaceSnippet.txt

たら /// 7
だが /// 7
奈良 /// 7

今回はこのファイルを TRR の実行ファイルがあるフォルダに配置しているものとします。

次は、以下のアイテムを作って、起動時に実行させるようにします。以下のファイルを fromFileName の item 内に配置します。

1_replaceSnippet読み込み.trr

; type=3
&snippetAddFromFile %A_ScriptDir%\replaceSnippet.txt

startup のフォルダ内に 1_replaceSnippet読み込みのフォルダを作っておきます。

作った例の説明をしていきます。

「音声認識」では、ななと発音すると、たらやだがや奈良と入力する場合が多いと思います。

その場合でも、その後にへんかんと発音すると、簡易入力の処理によってたらなどの文字が変換されて 7 に変わると思います。

このように、あらかじめ間違えるパターンのものを簡易入力として設定しておくと、へんかんなどの言葉で正しい文字に変換させていく事ができるかもしれません。

諸注意

ただし、先程にも書いていたように TRR を「音声認識」を使って実用的に使う事はまだ出来ないと思います。

今回挙げたのは、思いついた設定を紹介してみただけのものですのでその事はご了承ください。

前へ次へ

仕様へ戻るあああああ

一つ上の階層
マニアックへ