growing hard days.

Amazon CloudSearchにAWS Lambda(Python)からデータをアップロードする

2018/12/16

このブログはゆるっとアドベントカレンダー Advent Calendar 2018に参加しました。

Alexaスキルを作るにあたって全文検索できたほうがいいかなあと思いまして、実装してみました。
でも、全文検索だと戻る量が多くなってしまうので、DyanmoDBのソートキーを使って前方一致のほうが望ましいかと思い直しているところです。

せっかくやってみたので書き残しておきます。

構成はこちらの日次でCloudSearchにデータをアップロードしているところです。

目次

Amazon CloudSearch

ドメインを新規作成して、course_codeとcourse_nameという2つのフィールドを作りました。

AWS Lambda

IAMロールはもちろんCloudSearchへのアップロードが必要です。

import traceback, json, os, boto3
import logging.config

logger = logging.getLogger()
logger.setLevel(logging.INFO)

ENDPOINT = os.environ.get('ENDPOINT', '')


def lambda_handler(event, context):
    try:
        logger.info(event)
        domain = boto3.client(
            'cloudsearchdomain',
            endpoint_url=ENDPOINT
        )
        documents = []
        for record in event['Records']:
            if record['eventName'] == 'REMOVE':
                continue

            course_code = record['dynamodb']['NewImage']['course_code']['S']
            course_name = record['dynamodb']['NewImage']['course_name']['S']

            document = {
                'type': 'add',
                'id': course_code,
                'fields': {
                    'course_code': course_code,
                    'course_name': course_name
                }
            }

            documents.append(document)

        if len(documents) == 0:
            return

        response = domain.upload_documents(
            documents=json.dumps(documents),
            contentType='application/json'
        )

        logger.info(response)

    except:
        raise Exception(traceback.format_exc())

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

import traceback, json, os, boto3

import logging.config

logger = logging.getLogger()

logger.setLevel(logging.INFO)

ENDPOINT = os.environ.get('ENDPOINT', '')

def lambda_handler(event, context):

try:

logger.info(event)

domain = boto3.client(

'cloudsearchdomain',

endpoint_url=ENDPOINT

)

documents = []

for record in event['Records']:

if record['eventName'] == 'REMOVE':

continue

course_code = record['dynamodb']['NewImage']['course_code']['S']

course_name = record['dynamodb']['NewImage']['course_name']['S']

document = {

'type': 'add',

'id': course_code,

'fields': {

'course_code': course_code,

'course_name': course_name

}

}

documents.append(document)

if len(documents) == 0:

return

response = domain.upload_documents(

documents=json.dumps(documents),

contentType='application/json'

)

logger.info(response)

except:

raise Exception(traceback.format_exc())

CloudSearchドメインのエンドポイントは環境変数に設定しています。
トリガーはDyanmoDBで新規のアイテムのみを対象にしています。
boto3.clientはcloudsearchdomainです。
documentsでCloudSearchへの操作をJsonで新規アイテムの数だけ配列にしています。
upload_documentsでcontentTypeを’application/json’にしてます。

これで、データが追加されて、全文検索できました！！

最後までお読みいただきましてありがとうございました！

「AWS認定資格試験テキスト＆問題集　AWS認定ソリューションアーキテクト - プロフェッショナル改訂第2版」という本を書きました。

「AWS認定資格試験テキスト AWS認定クラウドプラクティショナー改訂第3版」という本を書きました。

「ポケットスタディ AWS認定デベロッパーアソシエイト［DVA-C02対応］」という本を書きました。

「要点整理から攻略するAWS認定ソリューションアーキテクト-アソシエイト」という本を書きました。

「AWSではじめるLinux入門ガイド」という本を書きました。

開発ベンダー5年、ユーザ企業システム部門通算9年、ITインストラクター5年目でプロトタイプビルダーもやりだしたSoftware Engineerです。
質問はコメントかSNSなどからお気軽にどうぞ。
出来る限りなるべく答えます。

このブログの内容/発言の一切は個人の見解であり、所属する組織とは関係ありません。
このブログは経験したことなどの共有を目的としており、手順や結果などを保証するものではありません。
ご参考にされる際は、読者様自身のご判断にてご対応をお願いいたします。

また、勉強会やイベントのレポートは自分が気になったことをメモしたり、聞いて思ったことを書いていますので、登壇者の意見や発表内容ではありません。

- AWS AWS, lambda, python

Tweet

関連記事

: AWS Protonの管理者ガイドとユーザーガイドのチュートリアル

AWS Proton管理者ガイドのAWS Management Console …

: AWS Lambdaで Unable to import module エラーが発生したときは

そもそも、Pycharmのナビゲーションペインでディレクトリごとドラッグ&amp …

: Amazon CloudWatch クロスリージョンクロスアカウントダッシュボードを作成

本ブログのCloudFrontとWAFのアカウントと、EC2、RDS、S3などオ …

: AWS Transit Gatewayピアリング接続確認

AWS Transit Gatewayのピアリング接続を使用して、異なるリージョ …

: RocketChat(EC2インスタンス)でCPU80%以上を10分間継続したら再起動する

先日、数日間のやり取り用で完全に使い捨てとして使っているRocketChatで、 …

: AWS SSOのIDソースをAD Connectorにしました

オンプレミス想定のActive DirectoryにVPN接続して、AD Con …

: EC2ハードウェア専有インスタンス(Dedicated Instances)を起動して請求書を確認してみました

EC2ハードウェア専有インスタンスのサイトには、次の料金と表記されています。 * …

: WordPressのwp-login.php , xmlrpc.phpへのアクセスをAWS WAFで接続元IPアドレスを制限する

AWS CloudWatch LogsエージェントでAmazon EC2上のNg …

: AWS Cost Explorerの設定で「EC2リソースの推奨事項を受け取る」を有効にしました

「EC2リソースの推奨事項を受け取る」という機能がAWS Cost Explor …

: EC2スポットインスタンスの中断通知を受ける

オートスケーリンググループでEC2インスタンスをスポットインスタンスで使用してい …

PREV: ゼロからはじめるAlexaスキル開発(Alexa Dev Summit Tokyo 2018)に参加しました
NEXT: 持ち帰って欲しいもの