リリース概要

2020年7月17日のリリース内容は以下の通りです。

製品 trocco
バージョン v20200717
タイプ メジャーリリース
日付 2020/07/17
お客様への影響 特にございません

 

新機能

1. BigQueryのデータチェック対応

BigQuery内のテーブルに対し、データが正しい形式で存在しているかチェックする機能が追加されました。
任意のSQLを実行し、結果に対してエラー条件を設定することができます。例えば毎日1000件以上のレコードが追記されるテーブルがあった場合、昨日追加されたレコード件数をチェックし、1000件未満だった場合にSlack/メールアラートを飛ばす、というようなことが実現できるようになります。
本機能はワークフロー内のタスクとして選択頂くことで、どなたでもすぐにご利用可能です。

2. 転送中にSkipされた行数でアラートが可能に

troccoでは、データ転送されたレコード数に応じてアラートを飛ばす機能がございます。
今回その拡充版として、「Skipされた」レコード数に応じてアラートを設定する機能を追加致しました。
対象はCSV系のファイルのみとなっていますが、不正文字列やカラムの過不足でSkipされたレコード数を検知することが出来るようになります。

3. BigQueryのカラム(列)にdescriptionのメタデータを転送可能に

BigQueryテーブルには、列ごとに説明文やコメントを付与することが出来る「description」というフィールドがあります。
このリリースでは、trocco上で説明文を定義しておけば、BigQueryのテーブルに説明文を同期できるようになりました。メタデータの管理用途等でお使い下さい。

4. その他

下記機能改善をリリースしている他、多数の修正パッチをリリースしております。

  • ワークフローでtrocco転送タスクを追加する際、複数の設定をまとめて選択可能に
  • 転送先MySQL – SSH鍵が無いときのエラーを解消
  • 転送元Marketo – の安定性向上、 APIリクエスト上限設定が可能に
  • 転送元S3/SFTP で zip展開後のファイル指定が出来るように
  • S3 Parquetバージョンアップ対応

今回のリリース内容としては以上となります。
Happy Data Engineering!

投稿者

hirokazu.kobayashi
2020年7月17日

データ分析基盤を作るなら、trocco®

パワフルなデータ統合機能だけでなく、データの管理やワークフローの管理を、手軽に実現するには「trocco®(トロッコ)」が最適です。自前構築に比べて最大90%の工数カットが可能です。

troccoについて詳しく知る