会話ログ2021-01-30
音声で使いたいという意見があったので音声入力で使ってみた
音声で使うのはイマイチ。重要なキーワードが認識されずに潰れるのが致命的。
その後テキスト入力に切り替えて、「音声で使いたい」は「音声入力で使いたい」とは別物という気づきがあった
---

あなたはこの会話で何が起きて欲しいですか?

あーこのシステムを音声で使えたらいいよねと言う人が結構いるので音声入力のテストをしてみたいと思います上

その音声は、どんな種類の音声ですか?

今は散歩をしながらAirPodsで音声入力をしています

その音声入力は、どんな種類の音声入力ですか?

音声入力を開始するのは今はいちいちキーボードの音声入力ボタンをタップしないといけないのでちょっとめんどくさいですね

その音声入力について、他に何かありますか?

あとこのチャット嵐は
すると送信するようになっているんだけれども
すると送信不良になっているんだけれどもエンターキーを押すと送信するようになっているんだけれども音声入力でそのエンターキーをしたときに入る文字が入力されても認識しないようなのでそこんところはいちいち音声入力を終了した後
男男男ボタンを長ないといけないのが面倒

あなたはその音声入力をどう知るのですか?

音声入力はさておきチャットボットからの返答今読み上げはしないので画面を見ないといけないから面倒ですね

その音声入力は、どのあたりにありますか?

いちいちキーボードの音声入力ボタンをタップしています

その音声入力は、どこにありますか?

iPhoneの標準機能です
> 音声入力はさておきチャットボットからの返答今読み上げはしないので画面を見ないといけないから面倒ですね
この音声入力は、何のようですか?

多分メール音声入力で使いたいと言う人がイメージしているのは人間と会話するようにして使うことだと思うんだけど現場ではいちいちボタンをタップして音声入力して雨に表示されたものを自分で手で読むのでちょっとなめらかさが足りない感じがあるかな

その音声について、他に何かありますか?

どうなんだろ9沢本当にそれが必要なのかね
> いちいちキーボードの音声入力ボタンをタップしています
このキーボードは、どんな種類のキーボードですか?

NGKW キーボード
> 多分メール音声入力で使いたいと言う人がイメージしているのは人間と会話するようにして使うことだと思うんだけど現場ではいちいちボタンをタップして音声入力して雨に表示されたものを自分で手で読むのでちょっとなめらかさが足りない感じがあるかな
この音声は、どのあたりにありますか?

多分先方も音声である必要があると思うんだよ

あなたはその音声をどう知るのですか?

返答の音声を見るって聞いてそれに対して音声で答えたいんだと思う

その音声は、何のようですか?

人間同士が音声で会話するようにコミニケーションしたいんだろうね僕はあんまり興味がないけど

あなたが価値を感じているのは何ですか?

うんとりあえず僕は音声入力には価値を感じてないということがわかるじゃぁ逆に何に価値を感じているのかと言うと文字としてアウトプットしたものが6分として残っていることによってそれを自分の目から入れることによって音声だったら声に出した瞬間消えてしまうけれどもテキストだったらしばらくの間2日目に留まっていると言うことによって人間を1時記憶の早朝になるとその相乗効果が人間の知性を高める上で行く勇有益であるとそれに価値を感じているんじゃないかな、うんとりあえず僕は音声入力には価値を感じてないということがわかるじゃぁ逆に何に価値を感じているのかと言うと文字としてアウトプットしたものが6分として残っていることによってそれを自分の目から入れることによって音声だったら声に出した瞬間消えてしまうけれどもテキストだったらしばらくの間2日目に留まっていると言うことによって人間を1時記憶の早朝になるとその相乗効果が人間の知性を高める上で行く勇有益であるとそれに価値を感じているんじゃないか

その音声入力は何が起こるとよいですか?

実際人間がこの手法でコーチングをやる場合相手の発言をリピートバックするんですよそれがしゃべったことがしゃべった瞬間に切るのではなくもう一度頭にインプットされる仕組みとして機能している人でもそれは音声乙開催しなければ音ではなくテキストで入力するならば容易に手に入れることができる機能が2

それには音声入力に何が起こる必要がありますか?

実際人間がこの手法でコーチングをやる場合相手の発言をリピートバックするんですよそれがしゃべったことがしゃべった瞬間に切るのではなくもう一度頭にインプットされる仕組みとして機能しているとでもそれは音声を使い済しなければ音ではなくテキストで入力するならば容易に手に入れることができる機能であると

その音声はそれができますか?

なんか音声認識が降ってバグった未開入力されてしまったうんこういうことが起きたときにフロー状態が途切れるというか後思考の対象に没頭できなくなるって言うデメリットが大きいだから音声では現場はできないって言ってしまったほうがいいのかな

その音声は、どこから来るのですか?

ここから文字入力。ここまでの話をまとめると、音声入出力はこのツールの本質的な価値に対してネガティブに働く、なぜなら「

その音声は何が起こるとよいですか?

なぜなら「自分が出力したものが文字としてログに残っていて、画面に表示されたログを目から入れることによって一次記憶の増強になる」というところが重要であって、実際に生身の人間が口頭でこの手法を使うときは相手の発言をリピートバックする。

それには音声に何が起こる必要がありますか?

そのリピートバックの時には相手の使った単語を変えないように最新の注意を払ってリピートバックする。音声入出力は、ユーザのしゃべったことを間違えずに繰り返せる必要がある。

音声入力はそれができますか?

現時点の技術では全然足りてない。「ログ」とか「短期記憶の増強」とかの重要なキーワードが音声で入力した時には軒並み潰れてる。

その音声は、どこにありますか?

音声認識かけないで、録音をそのままリピートバックした方がマシだよ

その音声と音声入力の関係は何ですか?

そう、それだ。ユーザが「音声でやりとりしたい」と思ってる時、本当に必要なのは音声認識して文字列にすることではない。音声のままフィードバックしたり、音声のまま抑揚とかからキーワード部分を見つけ出して切り出したりする方が正しい可能性がある。

その音声と、音声入力とは同じですか?違いますか?

同じだと思い込んでたけど違った!
> そう、それだ。ユーザが「音声でやりとりしたい」と思ってる時、本当に必要なのは音声認識して文字列にすることではない。音声のままフィードバックしたり、音声のまま抑揚とかからキーワード部分を見つけ出して切り出したりする方が正しい可能性がある。
この音声の時、音声入力に何が起こりますか?

対話自体には使われない。対話ログを後で読む時に「聞き返す」のか「読み返す」のかの違い。
> うんとりあえず僕は音声入力には価値を感じてないということがわかるじゃぁ逆に何に価値を感じているのかと言うと文字としてアウトプットしたものが6分として残っていることによってそれを自分の目から入れることによって音声だったら声に出した瞬間消えてしまうけれどもテキストだったらしばらくの間2日目に留まっていると言うことによって人間を1時記憶の早朝になるとその相乗効果が人間の知性を高める上で行く勇有益であるとそれに価値を感じているんじゃないかな、うんとりあえず僕は音声入力には価値を感じてないということがわかるじゃぁ逆に何に価値を感じているのかと言うと文字としてアウトプットしたものが6分として残っていることによってそれを自分の目から入れることによって音声だったら声に出した瞬間消えてしまうけれどもテキストだったらしばらくの間2日目に留まっていると言うことによって人間を1時記憶の早朝になるとその相乗効果が人間の知性を高める上で行く勇有益であるとそれに価値を感じているんじゃないか
この音声入力の時、音声に何が起こりますか?

音声入力によって文字列にすることは、現状の制度ではスムーズな音声でのやりとりを妨げる。音声でやりたいなら、音声だけでリピートバックして、画面は見ないってシステムにするべき。

その音声と音声入力の間には何がありますか?

音声を文字列にする前に、音声のままでのキーワード抽出があるべきなのだ
> 音声入力によって文字列にすることは、現状の制度ではスムーズな音声でのやりとりを妨げる。音声でやりたいなら、音声だけでリピートバックして、画面は見ないってシステムにするべき。
この音声入力は、どこから来るのですか?

どこから来るかなぁ、音声のままでのキーワード抽出は誰かが研究してるかもね

その音声とリピートの関係は何ですか?

音声でやりとりするならログ画面が見えないので音声でリピートバックする必要がある

その音声と、リピートとは同じですか?違いますか?

違う。テキストだとログがリピートバックの機能を果たしている。
> 音声でやりとりするならログ画面が見えないので音声でリピートバックする必要がある
この音声の時、リピートに何が起こりますか?

ログを見るのに比べて、音声でリピートバックされると時間が掛かると思うよ

そのリピートの時、音声に何が起こりますか?

遮って言い換えたりしたくなるかもね
> ログを見るのに比べて、音声でリピートバックされると時間が掛かると思うよ
この音声とリピートの間には何がありますか?

録音を丸ごとリピートバックするのではなく、「えーと」みたいなフィラーを取り除いたりした方がいいね
> ログを見るのに比べて、音声でリピートバックされると時間が掛かると思うよ
この音声とテキストの関係は何ですか?