growing hard days.

Amazon CloudSearchにAWS Lambda(Python)からデータをアップロードする

2018/12/16

このブログはゆるっとアドベントカレンダー Advent Calendar 2018に参加しました。

Alexaスキルを作るにあたって全文検索できたほうがいいかなあと思いまして、実装してみました。
でも、全文検索だと戻る量が多くなってしまうので、DyanmoDBのソートキーを使って前方一致のほうが望ましいかと思い直しているところです。

せっかくやってみたので書き残しておきます。

構成はこちらの日次でCloudSearchにデータをアップロードしているところです。

目次

Amazon CloudSearch

ドメインを新規作成して、course_codeとcourse_nameという2つのフィールドを作りました。

AWS Lambda

IAMロールはもちろんCloudSearchへのアップロードが必要です。

import traceback, json, os, boto3
import logging.config

logger = logging.getLogger()
logger.setLevel(logging.INFO)

ENDPOINT = os.environ.get('ENDPOINT', '')


def lambda_handler(event, context):
    try:
        logger.info(event)
        domain = boto3.client(
            'cloudsearchdomain',
            endpoint_url=ENDPOINT
        )
        documents = []
        for record in event['Records']:
            if record['eventName'] == 'REMOVE':
                continue

            course_code = record['dynamodb']['NewImage']['course_code']['S']
            course_name = record['dynamodb']['NewImage']['course_name']['S']

            document = {
                'type': 'add',
                'id': course_code,
                'fields': {
                    'course_code': course_code,
                    'course_name': course_name
                }
            }

            documents.append(document)

        if len(documents) == 0:
            return

        response = domain.upload_documents(
            documents=json.dumps(documents),
            contentType='application/json'
        )

        logger.info(response)

    except:
        raise Exception(traceback.format_exc())

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

import traceback, json, os, boto3

import logging.config

logger = logging.getLogger()

logger.setLevel(logging.INFO)

ENDPOINT = os.environ.get('ENDPOINT', '')

def lambda_handler(event, context):

try:

logger.info(event)

domain = boto3.client(

'cloudsearchdomain',

endpoint_url=ENDPOINT

)

documents = []

for record in event['Records']:

if record['eventName'] == 'REMOVE':

continue

course_code = record['dynamodb']['NewImage']['course_code']['S']

course_name = record['dynamodb']['NewImage']['course_name']['S']

document = {

'type': 'add',

'id': course_code,

'fields': {

'course_code': course_code,

'course_name': course_name

}

}

documents.append(document)

if len(documents) == 0:

return

response = domain.upload_documents(

documents=json.dumps(documents),

contentType='application/json'

)

logger.info(response)

except:

raise Exception(traceback.format_exc())

CloudSearchドメインのエンドポイントは環境変数に設定しています。
トリガーはDyanmoDBで新規のアイテムのみを対象にしています。
boto3.clientはcloudsearchdomainです。
documentsでCloudSearchへの操作をJsonで新規アイテムの数だけ配列にしています。
upload_documentsでcontentTypeを’application/json’にしてます。

これで、データが追加されて、全文検索できました！！

最後までお読みいただきましてありがとうございました！

「AWS認定資格試験テキスト＆問題集　AWS認定ソリューションアーキテクト - プロフェッショナル改訂第2版」という本を書きました。

「AWS認定資格試験テキスト AWS認定クラウドプラクティショナー改訂第3版」という本を書きました。

「ポケットスタディ AWS認定デベロッパーアソシエイト［DVA-C02対応］」という本を書きました。

「要点整理から攻略するAWS認定ソリューションアーキテクト-アソシエイト」という本を書きました。

「AWSではじめるLinux入門ガイド」という本を書きました。

開発ベンダー5年、ユーザ企業システム部門通算9年、ITインストラクター5年目でプロトタイプビルダーもやりだしたSoftware Engineerです。
質問はコメントかSNSなどからお気軽にどうぞ。
出来る限りなるべく答えます。

このブログの内容/発言の一切は個人の見解であり、所属する組織とは関係ありません。
このブログは経験したことなどの共有を目的としており、手順や結果などを保証するものではありません。
ご参考にされる際は、読者様自身のご判断にてご対応をお願いいたします。

また、勉強会やイベントのレポートは自分が気になったことをメモしたり、聞いて思ったことを書いていますので、登壇者の意見や発表内容ではありません。

- AWS AWS, lambda, python

Tweet

関連記事

: CUSTOMINEを使ってkintoneからAWS Lambdaを実行する(Cognito認証付き)

先日の記事「kintoneのカスタマイズ開発を超速にするCUSTOMINE」で書 …

: DynamoDBテーブル項目をS3にエクスポート

DynamoDBテーブルを一時テーブルとして使っていて、毎回使い捨てしてます。 …

: Amazon CloudWatch RUMはじめました

新機能 – Amazon CloudWatch RUM をご紹介 2021年12 …

: [JapanTaxi] Athena 指向アナリティクス〜真面目に手を抜き価値を得よ〜(AWS Summit Tokyo 2017)を聞いてきました

Athenaのユースケースとして聞きにいきましたが、最近触ってるRe:dashも …

: EC2にSystems MangerからCloudWatchエージェントをインストール

CloudWatchエージェント EC2の標準メトリクスでは収集できないメモリの …

: S3 Intelligent-Tieringのオブジェクトの階層移動をCloudWatchメトリクスで確認

CloudWatchメトリクスの保存期間は現時点で15ヶ月(455日)なのでそろ …

: Amazon SES, S3で受信したメールをAWS Lambda, SESで別のメールへ転送する

Amazon SESでメール受信で受信したメールを、毎回S3バケットに見に行って …

: QuickSightのVisualizeをダッシュボード化して定期メール

「Backlogの実績工数をAmazon QuickSightで可視化してわかっ …

: WordPressをAmazon CloudFrontで配信してついでにACM(AWS Certificate Manager)を使って常時SSL化する

当サイトの500と502の発生状況がドイヒーであるとの苦情をいただきまして、Am …

: Pandocサーバーのコンテナイメージを作成する

マークダウンからEPUBへの変換をAWS Batchで行いたく、ECRにアップロ …

PREV: ゼロからはじめるAlexaスキル開発(Alexa Dev Summit Tokyo 2018)に参加しました
NEXT: 持ち帰って欲しいもの