「Alexa」タグの記事が3件件あります

全てのタグを見る

GoogleアシスタントをAlexa Skillにして「アレクサ、オーケーグーグルで天気を調べて」をGoogleアシスタントの声で応答する

2018年1月14日 · 約4分

moritalous

Maintainer of this blog

お知らせ

過去にQiitaに投稿した内容のアーカイブです。

前回「GoogleアシスタントをAlexa Skillにして「アレクサ、オーケーグーグルで天気を調べて」を実現する」という投稿をしました。

少し改良し、Googleアシスタントの声で応答を返すように改良しました。

こんな感じです。

https://t.co/iQ97iNKTwp
— moritalous (@moritalous) 2018年1月14日

処理の流れ

Echoに話しかける
Skill Kit(AWS Lambda)にリクエストが来る
Googleアシスタントにリクエストを投げる
Googleアシスタントからレスポンス（音声・テキスト）が返却される
音声を一度tmp領域にファイル出力する
ffmpegでAlexaのフォーマットに変換する
変換した音声ファイルをS3にアップロードする（バケットはパブリック公開しておく）
S3にアップロードした音声ファイルのURLをaudioタグに入れたSSMLレスポンスを返却する
EchoがGoogleアシスタントの声で返事をする

長くなりそうなので、要点だけ解説します。ソースコードはこちら

Googleアシスタントからのレスポンスをファイルに出力する

Googleアシスタントのレスポンス中のresp.audio_out.audio_dataが複数に分割されて取得されるので、連結してファイルに出力します。

response_audio_data = b''
for resp in self.assistant.Assist(iter_assist_requests(),
                                  self.deadline):
    if resp.audio_out.audio_data:
        response_audio_data += resp.audio_out.audio_data

def save_file(output_path, binary):
    with open(output_path, "wb") as fout:          
            fout.write(binary)

音声ファイルをAlexaのフォーマットに変換する

Googleアシスタントのレスポンスは、mp3で取得できますが、Alexaが求める要件は以下の用になっています。

音声ファイルをAlexaに適した形式に変換する

必要に応じて、変換ソフトウェアを使用してMP3ファイルを必要なコーデックバージョン（MPEGバージョン2）とビットレート（48 kbps）に変換してください。

丁寧にffmpegのパラメーターの記述もあります。

ffmpeg -i <input-file> -ac 2 -codec:a libmp3lame -b:a 48k -ar 16000 <output-file.mp3>

ffmpegはLambdaの環境には準備されていないので、デプロイパッケージに含める必要があります。 ffmpegはここの「Linux Static Builds」のリンク先からx86_64 buildのものを取得しました。取得したファイルの中にある、ffmpegバイナリーのみを、デプロイパッケージのルートに格納されるように圧縮します。

Pythonのプログラム中でffmpegを呼び出す部分はこんな感じです。

def convert(input_path, output_path):
    try:
        command = './ffmpeg -i '+input_path+' -ac 2 -codec:a libmp3lame -b:a 48k -ar 16000 -af volume=2.0 ' + output_path
        output = subprocess.check_output(
            command, stderr=subprocess.STDOUT, shell=True, timeout=3,
            universal_newlines=True)
    except subprocess.CalledProcessError as exc:
        print("Status : FAIL", exc.returncode, exc.output)
    else:
        print("Output: \n{}\n".format(output))

つづく

GoogleアシスタントをAlexa Skillにして「アレクサ、オーケーグーグルで天気を調べて」を実現する

2018年1月2日 · 約10分

moritalous

Maintainer of this blog

お知らせ

過去にQiitaに投稿した内容のアーカイブです。

Amazonさんから招待が来たのでecho dotが手に入りました。でもGoogle Homeも気になりますよね。ということで、GoogleアシスタントをAlexa Skillにしてしまうことにしました。

12/20にGoogle Assistant SDKが0.4.0にバージョンアップし、日本語にも対応しています。

Alexa Skill Kitのセットアップ

細かい手順は他に任せるとして、要点を抜粋して紹介。

スキル情報

呼び出し名
オーケーグーグル

対話モデル

カスタム対話モデル

Sample Utterances	Slot Type
{q}	qSlot (後述のカスタムスロット)

カスタムスロットタイプ

VALUE	ID (OPTIONAL)	SYNONYMS
今日の天気は

あまり理屈はわかりませんが、これで「今日の天気は」はもちろん、その他の発話に対してもこの対話モデルが選択されます。

リクエストのJSONはこんな感じになります。

{
  "session": {
      // 省略
  },
  "request": {
    "type": "IntentRequest",
    "requestId": "XXXXXXXXXX",
    "intent": {
      "name": "NewIntent",
      "slots": {
        "q": {
          "name": "q",
          "value": "こんにちは"
        }
      }
    },
    "locale": "ja-JP",
    "timestamp": "XXXXXXXXXX"
  },
  "context": {
      // 省略
  },
  "version": "1.0"
}

以上でAlexa Skillの設定は完了です。

CentOSとPython環境の構築

MacのVirtualBox上にCent OS 7の環境を構築しました。

Python 3.6のインストールとvirtualenv環境のセットアップ

Lambdaのデプロイパッケージ作成の手順を参考にしました。 https://docs.aws.amazon.com/ja_jp/lambda/latest/dg/with-s3-example-deployment-pkg.html

[centos@localhost ~]$ sudo yum install -y gcc zlib zlib-devel openssl openssl-devel
[centos@localhost ~]$ wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz
[centos@localhost ~]$ tar -xzvf Python-3.6.1.tgz
[centos@localhost ~]$ cd Python-3.6.1 && ./configure && make
[centos@localhost ~]$ sudo make install
[centos@localhost ~]$ /usr/local/bin/virtualenv ~/shrink_venv
[centos@localhost ~]$ source ~/shrink_venv/bin/activate 
(shrink_venv) [centos@localhost ~]$ 

Google Assistant SDKのセットアップ

公式ドキュメントにそって進めます。

Set Up Hardware and Network Access

https://developers.google.com/assistant/sdk/guides/library/python/embed/setup →省略。

Configure and Test the Audio

https://developers.google.com/assistant/sdk/guides/library/python/embed/audio →今回は音声の入出力は必須ではないので、省略します。

Configure a Developer Project and Account Settings

https://developers.google.com/assistant/sdk/guides/library/python/embed/config-dev-project-and-account →ドキュメントに沿って実施。

あとで以下のものが必要になります。

作成したプロジェクト名
以下の説明ではAlexa-GoogleAssistant-Skillがプロジェクト名となります。
client_secret_<client-id>.json ファイル
Do not rename this file. とあるのでファイル名もダウンロードしたままで維持する必要があるようです。
CentOS環境上にコピーしてください。

Install the SDK and Sample Code

https://developers.google.com/assistant/sdk/guides/library/python/embed/install-sample →ドキュメントに沿って実施。ただし、Pythonの環境構築はすでに実施していますので、その部分は飛ばします。

必要なライブラリーの導入

(shrink_venv) [centos@localhost ~]$ python -m pip install --upgrade google-assistant-library
(shrink_venv) [centos@localhost ~]$ python -m pip install --upgrade google-assistant-sdk[samples]

credentialsの生成

(shrink_venv) [centos@localhost ~]$ google-oauthlib-tool --scope https://www.googleapis.com/auth/assistant-sdk-prototype \
          --save --headless --client-secrets [client_secret_client-id.json]

client_secret_client-id.jsonは、Google Assistant SDKのセットアップの手順で作成したものです。ファイルパスを指定してください。コマンドを実行すると以下のように入力待受状態になりますので、メッセージ中のURLにアクセスしてコードを取得してください。

Please visit this URL to authorize this application: https://accounts.google.com/o/oauth2/auth?xxxxxxxxxx
Enter the authorization code:

コード入力後、以下のメッセージが表示されます。

credentials saved: /home/ubuntu/.config/google-oauthlib-tool/credentials.json

保存されたファイルの中身は以下のような形です。この文字列が後で必要になります。

credentials.json　(整形済み)
{
  "token_uri": "XXXXXXXXXX",
  "client_id": "XXXXXXXXXX",
  "refresh_token": "XXXXXXXXXX",
  "scopes": [
    "XXXXXXXXXX"
  ],
  "client_secret": "XXXXXXXXXX"
}

Register the Device

https://developers.google.com/assistant/sdk/guides/library/python/embed/register-device →ドキュメントに沿って実施。 SDKのバージョン0.4.0から追加された手順と思います。

(shrink_venv) [centos@localhost ~]$ googlesamples-assistant-devicetool register-model --manufacturer "Assistant SDK developer" \
          --product-name "Alexa-GoogleAssistant-Skill" --type LIGHT --model Alexa-GoogleAssistant-Skill-Model

--manufacturerはサンプルのまま、--product-nameはなんでもOK?、--typeは必須なのでとりあえずLIGHT、--modelはグローバルユニークな文字列である必要があるようです。

モデル名について

Note that this name must be globally unique so you should use your Google Developer Project ID as a prefix to help avoid collisions (for example, my-dev-project-my-model1).

Run the Sample Code

https://developers.google.com/assistant/sdk/guides/library/python/embed/run-sample サンプルを実行します。

(shrink_venv) [centos@localhost ~]$ googlesamples-assistant-hotword --project_id Alexa-GoogleAssistant-Skill --device_model_id Alexa-GoogleAssistant-Skill-Model
device_model_id: Alexa-GoogleAssistant-Skill-Model
device_id: XXXXXXXXXX

...

--project_idはGoogle Developer上で作成したプロジェクト名、--device_model_idは先程決めたモデル名です。初回実行時にデバイスIDが自動生成されるようです。このデバイスIDは後ほど必要になります。

マイクに向かってOK Googleというと反応すると思います。今回はLambda化が目的なので、Ctrl+cで抜けて問題ありません。

Google Assistant SDKの日本語対応

https://developers.google.com/assistant/sdk/guides/assistant-settings ドキュメントが上の手順からの続きではありませんのでご注意。

デバイス登録がうまくできると、AndroidアプリのGoogleアシスタントの設定に登録したデバイスが表示されます。そのデバイスの設定で、言語設定ができます。たぶん。

また、SDKの呼び出しパラメーターにlang設定があるので、ja-JPを設定すると、日本語で返事をしてくれます。

以上でGoogle Assistant SDKのセットアップは完了です。

Lambdaファンクションの作成

Google Assistant SDKのサンプル

ドキュメントには記載がないのですが、サンプルの中に、音声ではなくテキストを入力してテキストを返すものが含まれていました。

(shrink_venv) [centos@localhost ~]$ python -m googlesamples.assistant.grpc.textinput --device-model-id [デバイスモデルID] --device-id [デバイスID]
E1230 11:54:46.796841462 2399 ev_epollex_linux.cc:1482] Skipping epollex becuase GRPC_LINUX_EPOLL is not defined.
E1230 11:54:46.796894329 2399 ev_epoll1_linux.cc:1261] Skipping epoll1 becuase GRPC_LINUX_EPOLL is not defined.
E1230 11:54:46.796909730 2399 ev_epollsig_linux.cc:1761] Skipping epollsig becuase GRPC_LINUX_EPOLL is not defined.
INFO:root:Connecting to embeddedassistant.googleapis.com
: Hello
Hello
<@assistant> What can I do for you?
: What time is it now
What time is it now
<@assistant> It's 11:55.
: Good bye
Good bye
<@assistant> Goodbye
: ^CAborted!
(shrink_venv) [centos@localhost ~]$ 

ソースはGitHubにありましたので、これを改良してLambda化を目指します。 https://github.com/googlesamples/assistant-sdk-python/blob/master/google-assistant-sdk/googlesamples/assistant/grpc/textinput.py

textinputサンプルからの変更点

以下の点を変更します。

サンプルではCtrl+cで抜けるまでやり取りが続けられましたが、1回の応答で処理を終了するように変更
デバイスモデル名、デバイスIDを環境変数で指定できるように変更
credentials.jsonについてはファイルパスではなくてjson文字列を環境変数で指定できるように変更
(当然ですが)Lambdaの作法に合わせる対応
(当然ですが)Alexaからのリクエストを受けれるように、また、Alexaの求めるレスポンスが返せるように変更

Lambdaファンクション

出来上がったソースがこちら。ソース全体はこちら。

---省略---
credentials_json = os.getenv('GA_CREDENTIALS','{"token_uri": "token_uri", "client_id": "client_id", "refresh_token": "refresh_token", "scopes": ["scopes"], "client_secret": "client_secret"}')
lang = os.getenv('GA_LANG', 'en-US') # en-US, ja-JP
device_model_id = os.getenv('GA_DEVICE_MODEL_ID', 'XXXXX')
device_id = os.getenv('GA_DEVICE_ID', 'XXXXX')
error_msg=os.getenv('GA_ERROR_MSG', 'No Response')
---省略---

def assist(text_query):
    credentials = google.oauth2.credentials.Credentials(token=None,
                                                        **json.loads(credentials_json))
    http_request = google.auth.transport.requests.Request()
    credentials.refresh(http_request)

    # Create an authorized gRPC channel.
    grpc_channel = google.auth.transport.grpc.secure_authorized_channel(
        credentials, http_request, api_endpoint)

    with textinput.SampleTextAssistant(lang, device_model_id, device_id,
                                grpc_channel, grpc_deadline) as assistant:
        text_response = assistant.assist(text_query=text_query)
        return text_response

---省略---

def lambda_handler(event, context):
    text_query=text_query=event['request']['intent']['slots']['q']['value']
    logging.info('Query text is %s', text_query)

    text_response = assist(text_query=text_query)
    if text_response == None:
        logging.info('Response text is None')
        text_response = error_msg

    logging.info('Response text is %s', text_response)

    session_attributes={}
    card_title=text_query+' -> ' + text_response
    speech_output=text_response
    reprompt_text=text_response
    should_end_session=True
    
    return build_response(session_attributes, build_speechlet_response(
        card_title, speech_output, reprompt_text, should_end_session))

---省略---

デプロイパッケージの作成

AWSのドキュメントを参考にしました。 https://docs.aws.amazon.com/ja_jp/lambda/latest/dg/with-s3-example-deployment-pkg.html

(shrink_venv) [centos@localhost ~]$ cd $VIRTUAL_ENV
(shrink_venv) [centos@localhost shrink_venv]$ cd lib/python3.6/site-packages/
/home/ubuntu/env
(shrink_venv) [centos@localhost site-packages]$ zip -r9 ~/DeployPackage.zip *
(shrink_venv) [centos@localhost site-packages]$ cd ~
(shrink_venv) [centos@localhost ~]$ zip -g ~/DeployPackage.zip lambda_function.py

作成したzipファイルをマネジメントコンソールからアップロードし、Lambdaファンクションとして登録します。

終わりに

複数回の会話のやり取りはできません。改良の余地あり
応答が複数に別れる場合に最後の部分しか返答がありません。SDKの仕様？
となりにおいていたAndroidスマホも「オーケーグーグル」に反応して同じ答えを返します(声は違うけど)。😀
結局、天気を聞くぐらいしか用途がありません。😀

alexa-avs-sample-appを日本語に対応させる

2017年11月15日 · 約3分

moritalous

Maintainer of this blog

お知らせ

過去にQiitaに投稿した内容のアーカイブです。

(2017/12/21更新) 12/19の更新で、公式に日本語に対応したようです。 https://github.com/alexa/alexa-avs-sample-app/commit/f78290baf141c53604ed3ee79ffd8fb1a74fad37

そのため、この記事は用無しとなりました。

今まで見てくださった1206名の皆様、いいねをくださった10名の皆様、ありがとうございました！

本日(11/15)からAmazon Echo購入の招待メールが配信されているようですが、私のところにまだ来ていません。悔しいので、alexa-avs-sample-appを日本語化してみました。

公式サイト

【GitHub】 https://github.com/alexa/alexa-avs-sample-app

【Quick Start Guides】 Raspberry Pi https://github.com/alexa/alexa-avs-sample-app/wiki/Raspberry-Pi

Windows https://github.com/alexa/alexa-avs-sample-app/wiki/Windows

日本語化の方法

Raspberry piでは以前導入したことがあったので、今回はWindowsに導入しました。導入手順は、上記Quick Start Guidesのとおりです。

ただ、そのままでは、Javaのアプリ（Alexa Voice Service Sample Java Client）が日本語に対応しておらず、日本語が選べないので、少しだけ細工します。 mvn installを実行する前に、変更します。

設定ファイル

samples\javaclient\config.json

-"locale":"en-US",
+"locale":"ja-JP",

Javaソース

samples\javaclient\src\main\java\com\amazon\alexa\avs\config\DeviceConfig.java

 public class DeviceConfig {
     private static final String DEFAULT_HOST = "https://avs-alexa-na.amazon.com";
     public static final String FILE_NAME = "config.json";
     private static final List<Locale> SUPPORTED_LOCALES = new ArrayList<>();
     static {
         SUPPORTED_LOCALES.add(Locale.US);
         SUPPORTED_LOCALES.add(Locale.UK);
         SUPPORTED_LOCALES.add(Locale.GERMANY);
+        SUPPORTED_LOCALES.add(Locale.JAPAN);
     }

こんだけ。成功すれば、Localeがja-JPに設定できるようになります。

キャプチャ.PNG

色々やってみた

Google PlayからAmazon Alexaアプリをインストールしてスキルを追加してみました。

天気予報
radiko.jp
ピカチュウトーク

全部動きました！Echo買わなくても一通りのことができそう！！

QiitaでAlexa関連のサイト

Skill作って見ようと思います。

Amazon Echo を日本語でセットアップする。　https://qiita.com/takustaqu/items/10d2fb58dbcbf94b1304 Raspberry Pi2 で Alexaに話してみる　https://qiita.com/areaz_/items/f181ddbbb2f53d6d98e4 Raspberry pi 2BでAmazon Alexaを動かしてみた　https://qiita.com/noimi/items/f107df4ff8b754fd0df0 Alexa Skill Kitを触ってみる　https://qiita.com/Darmuck/items/07dfd996ad4e90e1d605 はじめてのAlexa 　https://qiita.com/kei_0324/items/e97fe52df9e0a91ad5bf

処理の流れ​

Googleアシスタントからのレスポンスをファイルに出力する​

音声ファイルをAlexaのフォーマットに変換する​

Alexa Skill Kitのセットアップ​

スキル情報​

対話モデル​

CentOSとPython環境の構築​

Python 3.6のインストールとvirtualenv環境のセットアップ​

Google Assistant SDKのセットアップ​

Set Up Hardware and Network Access​

Configure and Test the Audio​

Configure a Developer Project and Account Settings​

Install the SDK and Sample Code​

Register the Device​

Run the Sample Code​

Google Assistant SDKの日本語対応​

Lambdaファンクションの作成​

Google Assistant SDKのサンプル​

textinputサンプルからの変更点​

Lambdaファンクション​

デプロイパッケージの作成​

終わりに​

公式サイト​

日本語化の方法​

設定ファイル​

Javaソース​

色々やってみた​

QiitaでAlexa関連のサイト​

処理の流れ

Googleアシスタントからのレスポンスをファイルに出力する

音声ファイルをAlexaのフォーマットに変換する

Alexa Skill Kitのセットアップ

スキル情報

対話モデル

CentOSとPython環境の構築

Python 3.6のインストールとvirtualenv環境のセットアップ

Google Assistant SDKのセットアップ

Set Up Hardware and Network Access

Configure and Test the Audio

Configure a Developer Project and Account Settings

Install the SDK and Sample Code

Register the Device

Run the Sample Code

Google Assistant SDKの日本語対応

Lambdaファンクションの作成

Google Assistant SDKのサンプル

textinputサンプルからの変更点

Lambdaファンクション

デプロイパッケージの作成

終わりに

公式サイト

日本語化の方法

設定ファイル

Javaソース

色々やってみた

QiitaでAlexa関連のサイト