ヤマムギ

growing hard days.

*

「Talend ハンズオンセミナー」に行ってきました

      2016/09/18

Talendとは

  • データの整備・統合
  • ビッグデータ対応
  • ストリーミングデータ
  • アプリケーション連携
  • OSS(無償)のTalend Open Studio
  • Enterprise(500万前後)のData Integration/Big Data(Map Reduce & Spark)
  • IoTセンサーデータをストリーミングに流してSparkで受けてリアルタイムに分析する場合はTalend Real-time Big Data Platoform

Talend Open Studio(TOS)と商用版の違い

  • TOSはクライアントスタンドアロンでjarを作るまで(jarの実行はlambdaでいいのでは?)
  • 商用版は共有リポジトリ、運用開始サーバ、JOB実行サーバ、Talend Studioとの自動同期が可能

商用版のメリット

開発支援に関わる機能拡張

利便性の向上

  • データプレビュー
    やり取りされるデータをStudio内でプレビュー出来る
  • Dynamic Schema
    データ型を主導設定しなくても自動設定してくれる

コンポーネント追加と拡張/処理の高速化

  • SAP,Paralleize,パーティションパラレル,tMapのパラレルルックアップは商用版のみ
    本気でBig Dataの扱いが必要になり並列処理が必要にならない限りは不要

Job Script API

  • Source(JobScript) -> GUIが可能
    TOSではGUI -> Source(Java)のみ

Change Data Capture

  • ソースDB内の変更差分を取得してターゲットDBへ反映可能

ディスタントラン

  • サーバーでテストランが可能(TOSはクライアント)

Map/Reduceジョブの開発

  • BigDataのみ

Streaming Jobの開発

チーム開発生産性の向上

ジョブレット

  • 業務ロジックの共有

共有リポジトリ

  • SVNを使用したチーム開発(Gitも可)

プロジェクト管理

  • Jobの塊をプロジェクトとする
  • プロジェクトを跨いでJobを利用する事が可能

自動文書化

  • TOSでは手動で文書化が可能

影響分析,データ来歴分析

  • 変更を加える際に影響発生箇所を特定
  • 特定して分析した結果は自動文書化

運用管理に関わる機能

  • ユーザ管理
  • ジョブコンダクター(ジョブスケジューリング)
  • インターバル実行、カレンダー実行、イベント実行
  • 実行プラン(タスク連携、実行制御)
  • サーバ監視
  • ロードバランシング,フェイルオーバー
  • 運用履歴分析(運用状態の可視化)
  • エラーリカバリ
  • コマンドオペレーション

ハンズオン

tRowGenerator

  • Sequence identifier : “s1”
  • コード – ルーチン – systemにファンクションが定義されている

メタデータ

  • 各Jobが共通して参照出来る
  • メンテンスが楽
  • 推定では先頭の50行を読み込んで各パラメータを提案

tMap

  • デフォルトはLeft Outer Join

最後までお読みいただきましてありがとうございました!

「AWS認定資格試験テキスト&問題集 AWS認定ソリューションアーキテクト - プロフェッショナル 改訂第2版」という本を書きました。

「AWS認定資格試験テキスト AWS認定クラウドプラクティショナー 改訂第2版」という本を書きました。

「ポケットスタディ AWS認定 デベロッパーアソシエイト [DVA-C02対応] 」という本を書きました。

「要点整理から攻略するAWS認定ソリューションアーキテクト-アソシエイト」という本を書きました。

「AWSではじめるLinux入門ガイド」という本を書きました。

 - study ,

ad

ad

  関連記事

AWS Expert Online at JAWS-UG首都圏エリアに参加して「Amazon EC2 スポットインスタンス再入門」を聞いてきた

AWS Expert Onlineという勉強会がありまして、AWS ソリューショ …

「雲勉 第1回【勉強会:新技術好き!】AWSマネージドサービス勉強会」に行ってきました

「雲勉 第1回【勉強会:新技術好き!】AWSマネージドサービス勉強会」に行ってき …

「JAWS-UG 名古屋 DR対策特集+LT」で発表しました

2021/3/29の「JAWS-UG 名古屋 DR対策特集+LT」で「ブログを大 …

Alexa Day2018で「Alexa連携デバイスクラウドを構成するAWS ソリューション」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …

Developers Summit 2018 「Building Real-time Application With AWS AppSync 〜GraphQLの始め方〜」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …

「JAWS-UG in AWS Cloud Roadshow 2017 大阪」で運営をしました

AWS Cloud Roadshow 2017 大阪のナイトイベントで、「JAW …

LINEとAWSとTwilioとkintoneでBOTを作ってみるハンズオン~ラッキーコンテンツ手順~

LINEとAWSとTwilioとkintoneでBOTを作ってみるハンズオンで一 …

Developers Summit 2024「GitHub Copilotは開発者の生産性をどれだけ上げるのか? ZOZOでの全社導入とその効果」を見ました

株式会社ZOZO 技術本部 技術戦略部 CTOブロック テックリード 堀江 亮介 …

「GCPUG Tokyo Container Builder Day February 2018」に行ってきました

GCPUGは神戸以来の2回目で参加させていただきました。 申し込もうかと思ったら …

Java SE 7 Silver対策勉強をしながらメモ 2015/1/30

本日は配列です。 いつものごとくマークダウンで記載したのでそのままJetpack …