人間とコンピュータの会話の新しいトレンド、Google Duplexで公開

Googleは二日前にAndroidのPは、Gmail、Gboard、TPUv3、多くの新製品や新機能、最も目を引くの導入に加えて、ダウン公衆をさせなかったグーグルの総会で(2018グーグルI / O)カリフォルニア州で2018年、開発者会議を開催しました間違いなく、Google AssistantのパーソナルアシスタントであるGoogle Duplexのアップグレードバージョンでは、レストラン、ヘアサロンなどを呼び出して、ユーザーが人間との会話のように感じる時間を作れるようにすることができます。

近年では、ハイテクは、特に近年では、人工知能の急速な発展、学術コミュニティは積極的に人工知能の可能性を模索している、私たちに多くのショックをもたらしている。 Googleはまた、積極的なアプリケーションに関連する技術を開発し、それは長い過去のGoogleのアシスタントに掲載された、人工知能の対話で研究されてきたが、Appleのシリ製品の競合他社に挑戦しています。今回発表されたGoogle Duplexには、新しい技術が含まれています。これは、人間を呼び出すことができ、人間の対話の自然な模倣を通じて、一連の現実世界のタスクを完了することができます。人間と機械の間では、それらを区別することは難しいです。あなたの将来の電話のもう片側は、人間ではなく機械です。

Googleは、わずか数週間で、彼らは、内部のGoogleのアシスタントを経験するために皆のためにGoogleの二重の実験的なバージョンを導入することができ、会議で語ったが、公式発表日はまだ決定され、それが思われる人工知能のアプリケーションは、すでに勉強と仕事をするためにもはや幻想ではありません。

 

少しの知識:

Google Duplexはどのように動作しますか?

Google Duplexは、言語の理解、インタラクション、時間管理、音声生成に関する最新の技術開発を活用して、会話を自然かつ自然なものにします。その中心にはTensorFlow Extended(RFX)によって構築されたリカレントニューラルネットワーク(RNNネットワーク)があります。高精度を実現するために、Googleは匿名の電話会話データを使用してDuplexのRNNネットワークをトレーニングします。ネットワークは、その上のGoogleの自動音声認識(ASR)認識結果のテキストだけでなく、オーディオ機能の使用、会話履歴、(そのようなサービスの割引、現在の時刻など)セッションパラメータ、およびを使用します。 Googleは、システムをさらに最適化するために、それぞれのタスクごとに異なる学習モデルと理解モデルを設定します。

Google Duplexは自然な音声技術を生成します

Googleでは、カスケードTTS(TTS:音声合成のための方法)エンジンと生成的なTTSエンジンを使用して、さまざまな状況に応じて音声のトーンを制御しています。このシステムでは、音声をより自然にするために、いくつかのモーダルワード(「hmmm」や「uh」など)を生成することもできます。カスケードTTSが非常に多様な音声ユニットを結合する必要がある場合、または生成された一時停止を増加させる必要がある場合、モーダルワードが生成された音声に追加され、システムは相手方に自然な方法で信号を送ることができます。私はそれに耳を傾けるか、あるいは「私はまだそれについて考えています。」(人間が話すとき、彼らはしばしば考えながらいくつかの言葉を言う) Googleは、この調査、調査では、ほとんどのユーザーがモーダルトーンでより親しみやすく自然な対話を感じていることを示していると述べています。 Googleはまた、いくつかのケースでは、他のは同じためらっ一時停止を行うだろうというとき、人間は完全には理解していないと同じように、そのようなときに、非常に複雑な文章への返信として、対話音がより自然にするために、いくつかの遅延を追加するために、ことがわかりました。

 

www.openschool.hk