投稿元:
レビューを見る
音声インターフェイスに関する本。
現場と未来、歴史。
特徴とメリット。商品。
技術。
問題・課題。
対話と会話。
関連企業。
投稿元:
レビューを見る
・シーマン(懐かし~)。
音声認識ミスに対しては、シーマンが「何を言ってるんだ、もう疲れたよ、寝るからな」
とシステム側がユーザーの発話を無視するという前代未聞の使用になっています。
開発者によると、認識語彙を増やすと認識率が下がりユーザーの不満ばかりたまる問題を抱えていた時に、
音声認識できない理由をユーザーに責任転換してしまうという、ギャンブルに近い判断をしたそうです。
結果、ユーザーは「ごめんね!」「ねぇねぇシーマン!」と優しくわかりやすい言葉で話しかけてくれたので認識できるようになったと語っています。
・ユーザーの発話に対して、認識できない場合はシステム側が何かを返答することです。聞き取れずに理解できなかった場合は「何がわからなかったか」「どう言ってもらえるといいのか」を含めて聞き返すのです。
・Pepperが独りぼっちでいる理由
⇒サービスの説明とウンチクばかりではユーザーも「またか」と期待も薄く対話しようと思わなくなるのです。
身振り手振りしながら人間らしい音声で発話ができても、言動とコンテンツによって飽きられてしまうのです。
・応答速度
ユーザの思考が途切れない応答時間は1秒以内と言われてる。ユーザーの入力に対しては2秒以内に反応すること
・雑談コンテンツを作るテンプレート
「たちつてとなかにはいれ」「シタシキナカニ衣食住」とな。
・た→食べ物
・ち→地域
・つ→通学通勤
・て→天気
・と→富
・な→名前
・か→体
・に→ニュース
・は→流行(はやっている)
・い→異性
・れ→レジャー
・し→趣味
・た→旅
・し→仕事
・き→気候
・な→仲間
・か→家族
・に→ニュース
・衣→衣類
・食→食事
・住→住まい
投稿元:
レビューを見る
スマートスピーカー等の音声インタフェースについて幅広くまとめた本。
スマートスピーカーは使ったことないけど、今のところ人間が機械にあわせたほうがいいという部分もあるらしい。シーマンというゲームは、技術的には高くないのだけどそのへんうまくやれたいたようでよかったということだ(これもやったことないけど)。
ただ、たまにスマホで音声入力すると、その精度のよさに結構ビックリすることがある。今まで長い文をがんばってフリック入力してたのはなんだったんだと。
スマートスピーカーはやっぱり、ウェイクワードがちょっと鬱陶しそう。いちいち「Ok Google」と言ってから言わなきゃいけないという。ちなみに、コルタナのウェイクワードは「コルタナさん」だそう。さん付けで呼ばせるのか。
そういや、日本語の子音の中で、「ŋ」という文字だけ初めて見た(というより他はアルファベット)なのだけど、どういう音を表しているのだろう。
後、この本で知ったのだけど、『「ピカチュウ」にこめられた感性情報』という実験論文が面白そうだった。日米の幼児を対象にピカチュウの声だけで感情が伝わるか実験すると、「悲しみ」「怒り」「平静」については母語に影響なく一致したらしい(逆に、「喜び」は一致しないということもあるということなのかもしれないけど)。
とにかく、まだ課題はありそうだけど、ユーザーがもっと使って慣れたり、データを集めて精度を高めるのが大事なのだろうと思った。
投稿元:
レビューを見る
スマートスピーカー等の音声会話の製品やサービスが出てきている現状とこれからの展開や課題について。今はまだ人が合わせる感じだがスムーズな会話に向けての問題等が解説されている。
投稿元:
レビューを見る
2018/12/26 詳細は、こちらをご覧ください。
『あとりえ「パ・そ・ぼ」の本棚とノート』 → http://pasobo2010.blog.fc2.com/blog-entry-915.html
2018/08/26 予約 8/29 借りて読み始める。 11/18 読み終わる。
内容 :
マウスやタッチといった既存のインターフェースと音声インターフェースは、似ているようで異なる点が多い。
音声インターフェースは何が得意なのか、開発に携わる側は何を考えるべきかを解説すると共に、ビジネス面にも触れる。
著者 : 河野 道成
1969年生まれ。横浜国立大学工学部卒業。ネオマデザイン株式会社代表取締役。ビヨンドUXクリエイター、クリエイティブディレクター、ITコンサルタント。
投稿元:
レビューを見る
190303 音声認識を深く勉強するにはちょうどよい。技術だけでなく、人に使われるにはどうすればよいかわかる本。いろんな勉強をしたいので、さらっと読んだが、また、早いうちにもうっかい読んでもよい。